Nauka i technika

Uczenie maszynowe pomaga zaprojektować najlepszą poprawkę dla danej wady genetycznej

  • 16 lutego, 2023
  • 6 min read
Uczenie maszynowe pomaga zaprojektować najlepszą poprawkę dla danej wady genetycznej


Edycja DNA AI inżynierii genetycznej

Nowe badanie opublikowane w czasopiśmie Biotechnologia przyrody wykorzystał uczenie maszynowe do przyspieszenia rozwoju pierwszej edycji, obiecującej technologii edycji genów. W badaniu przeanalizowano tysiące sekwencji DNA wprowadzonych do genomu za pomocą głównych edytorów i wykorzystano dane do wyszkolenia algorytmu uczenia maszynowego w celu zaprojektowania najlepszej poprawki dla danej wady genetycznej. Wykorzystując uczenie maszynowe do usprawnienia procesu projektowania poprawek genetycznych, badania te mogą pomóc przyspieszyć wysiłki mające na celu wprowadzenie pierwszej edycji do użytku klinicznego.

Naukowcy z Wellcome Sanger Institute opracowali nowe narzędzie do przewidywania szans na pomyślne wstawienie zmodyfikowanej genetycznie sekwencji[{” attribute=””>DNA into the genome of a cell, using a technique known as prime editing. An evolution of CRISPR-Cas9 gene editing technology, prime editing has huge potential to treat genetic diseases in humans, from cancer to cystic fibrosis. But thus far, the factors determining the success of edits are not well understood.

The study, published today (February 16, 2023) in the journal Nature Biotechnology, assessed thousands of different DNA sequences introduced into the genome using prime editors. These data were then used to train a machine learning algorithm to help researchers design the best fix for a given genetic flaw, which promises to speed up efforts to bring prime editing into the clinic.

Developed in 2012, CRISPR-Cas9 was the first easily programmable gene editing technology.[1] Te „nożyce molekularne” umożliwiły naukowcom cięcie DNA w dowolnej pozycji w genomie w celu usunięcia, dodania lub zmiany fragmentów sekwencji DNA. Technologia została wykorzystana do badania, które geny są ważne dla różnych schorzeń, od raka po rzadkie choroby, oraz do opracowania metod leczenia, które naprawiają lub wyłączają szkodliwe mutacje lub geny.

Edytory bazowe były innowacją rozszerzającą CRISPR-Cas9 i nazywano je „ołówkami molekularnymi” ze względu na ich zdolność do zastępowania pojedynczych zasad DNA. Najnowsze narzędzia do edycji genów, stworzone w 2019 roku, nazywane są głównymi edytorami. Ich zdolność do wykonywania operacji wyszukiwania i zastępowania bezpośrednio na genomie z wysokim stopniem precyzji doprowadziła do tego, że nazwano je „molekularnymi procesorami tekstu”.

Ostatecznym celem tych technologii jest korygowanie szkodliwych mutacji w ludzkich genach.[2] Ponad 16 000 małych wariantów delecji – w przypadku których z genomu usunięto niewielką liczbę zasad DNA – zostało przyczynowo powiązanych z chorobą. Obejmuje to mukowiscydozę, w której 70 procent przypadków jest spowodowanych delecją tylko trzech zasad DNA. W 2022 roku komórki T poddane edycji podstawowej zostały z powodzeniem zastosowane w leczeniu białaczki pacjenta, w przypadku której zawiodły chemioterapia i przeszczep szpiku kostnego.

W tym nowym badaniu naukowcy z Wellcome Sanger Institute zaprojektowali 3604 sekwencje DNA o długości od jednej do 69 zasad DNA. Sekwencje te wstawiono do trzech różnych ludzkich linii komórkowych, stosując różne systemy dostarczania edytora głównego w różnych kontekstach naprawy DNA.[3] Po tygodniu komórki poddano sekwencjonowaniu genomu, aby sprawdzić, czy zmiany powiodły się, czy nie.

Oceniono skuteczność wstawiania lub wskaźnik sukcesu każdej sekwencji w celu określenia wspólnych czynników sukcesu każdej edycji. Stwierdzono, że długość sekwencji jest kluczowym czynnikiem, podobnie jak rodzaj zaangażowanego mechanizmu naprawy DNA.

Jonas Koeppel, pierwszy autor badania z Wellcome Sanger Institute, powiedział: „Zmiennych zaangażowanych w udane pierwsze edycje genomu jest wiele, ale zaczynamy odkrywać, które czynniki zwiększają szanse na sukces. Długość sekwencji jest jednym z tych czynników, ale nie jest to takie proste, ponieważ im dłuższa sekwencja, tym trudniej ją wstawić. Odkryliśmy również, że jeden rodzaj naprawy DNA uniemożliwiał wstawianie krótkich sekwencji, podczas gdy inny rodzaj naprawy uniemożliwiał wstawianie długich sekwencji”.

Aby pomóc zrozumieć te dane, naukowcy zwrócili się do[{” attribute=””>machine learning to detect patterns that determine insertion success, such as length and the type of DNA repair involved. Once trained on the existing data, the algorithm was tested on new data and was found to accurately predict insertion success.

Juliane Weller, a first author of the study from the Wellcome Sanger Institute, said: “Put simply, several different combinations of three DNA letters can encode for the same amino acid in a protein. That’s why there are hundreds of ways to edit a gene to achieve the same outcome at the protein level. By feeding these potential gene edits into a machine learning algorithm, we have created a model to rank them on how likely they are to work. We hope this will remove much of the trial and error involved in prime editing and speed up progress considerably.”

The next steps for the team will be to make models for all known human genetic diseases to better understand if and how they can be fixed using prime editing. This will involve other research groups at the Sanger Institute and its collaborators.

Dr. Leopold Parts, senior author of the study from the Wellcome Sanger Institute, said: “The potential of prime editing to improve human health is vast, but first we need to understand the easiest, most efficient and safest ways to make these edits. It’s all about understanding the rules of the game, which the data and tool resulting from this study will help us to do.”

Notes

  1. More information on CRISPR-Cas9 is available on the YourGenome website.
  2. The most advanced CRISPR-Cas9 clinical trial is a treatment for sickle cell disease. Red blood cells from patients are edited to turn on the gene that produces fetal hemoglobin, which unlike adult hemoglobin is not affected by the damaging sickle cell mutation. More information on current clinical trials can be found here.
  3. All forms of gene editing technology rely on the intrinsic DNA repair mechanisms of the cell to re-join DNA strands after an edit has been made. Human cell lines are colonies of human cells grown in the laboratory and are used to model complex biological systems.

Reference: “Sequence and DNA repair determinants of writing short sequences into the genome using prime editing” 16 February 2023, Nature Biotechnology.
DOI: 10.1038/s41587-023-01678-y




Źródło

Warto przeczytać!  Nowe badanie opublikowane w JCO Precision Oncology pokazuje niezliczone