Nauka i technika

Głębokie uczenie rozwiązuje zagadki kopiowania danych DNA

  • 23 stycznia, 2024
  • 4 min read
Głębokie uczenie rozwiązuje zagadki kopiowania danych DNA


DNA, jako nośnik danych, jest użyteczne tylko wtedy, gdy jest odczytywane, kopiowane i wysyłane gdzie indziej. Medium przekazującym informację genetyczną z jądra komórkowego jest RNA – transkrybowany z DNA, który sam nigdy nie opuszcza jądra komórkowego. Teraz, korzystając z głębokiego uczenia się, naukowcy z Northwestern University rozwikłali złożoną część procesu transkrypcji RNA: skąd komórki wiedzą, kiedy przestać kopiować.

W transkrypcji RNA kluczowa jest wiedza, kiedy przestać. Informacje zakodowane w RNA są wykorzystywane w całej komórce do syntezy białek i regulowania szerokiego zakresu procesów metabolicznych. Dostarczenie właściwej wiadomości do zamierzonego celu wymaga, aby nici RNA powiedziały tyle, ile potrzebują – i nic więcej. Jeśli powiedzą więcej lub mniej, niż potrzebują, jak to może mieć miejsce w przypadku wielu chorób, takich jak epilepsja lub dystrofia mięśniowa, wówczas dowolna liczba procesów metabolicznych może się załamać lub działać nieprawidłowo w sposób wyniszczający.

„To bardzo przydatne narzędzie do wstępnej selekcji umożliwiające badanie wariantów genetycznych z dużą wydajnością”.
—Emily Kunce Stroup, Uniwersytet Northwestern

Zatrzymanie procesu kopiowania RNA – zwanego poliadenylacją (poliA) w przypadku łańcucha cząsteczek adeniny, który wiąże się z końcem odciętej nici RNA – obejmuje szereg białek, których interakcje nigdy nie zostały w pełni poznane.

Warto przeczytać!  Nowy chip polimorficzny pojedynczego nukleotydu, który może pomóc w identyfikacji markerów genetycznych pożądanych cech w ryżu

Aby pomóc w rozwikłaniu problemu poliA, badacze Zhe Ji i Emily Kunce Stroup z Northwestern University opracowali model uczenia maszynowego, który może lokalizować i identyfikować miejsca poliA. Działa poprzez łączenie splotowych sieci neuronowych (CNN) wytrenowanych w celu dopasowywania ważnych sekwencji w kodzie genetycznym z rekurencyjnymi sieciami neuronowymi (RNN) przeszkolonymi do badania wyników CNN.

Podczas gdy poprzednie modele przyjmowały podobne podejście, wykorzystując zarówno CNN, jak i RNN, badacze ci następnie wprowadzili wyniki modelu CNN/RNN do dwóch innych modeli głębokiego uczenia się, przeszkolonych w zakresie lokalizowania i identyfikowania miejsc poliA w genomie.

Wydaje się, że pomogły dwa dodatkowe modele. „Posiadanie tandemowych wyjść jest naprawdę wyjątkową rzeczą w naszej pracy” – mówi Stroup. „To, co odróżnia nas od istniejących prac, to fakt, że model trafia do dwóch oddzielnych gałęzi wyjściowych, które następnie łączymy w celu identyfikacji miejsc w wysokiej rozdzielczości”.

Ze swojego modelu naukowcy nauczyli się kilku ważnych aspektów tego, co może powodować dobre lub złe działanie poliA. Część modelu CNN nauczyła się wzorców genetycznych w DNA, o których wiadomo, że przyciągają białka kontrolujące poliA, podczas gdy część modelu RNN ujawniła, że ​​niezawodne odcięcie transkrypcji wymaga ostrożnego odstępu między tymi wzorami. Badacze ci mogli wyciągnąć tak precyzyjne wnioski dzięki rozdzielczości modelu na nukleotydy. „To uderzające, że nasz model potrafi to precyzyjnie uchwycić” – mówi Ji.

Warto przeczytać!  Blizny wyleczone za pomocą przeszczepionych mieszków włosowych w badaniu Imperial College London | Wiadomości imperialne

Zespół twierdzi, że w przyszłości planuje zastosować swój model i podobne techniki do badań identyfikujących kluczowe mutacje genetyczne potencjalnie powodujące choroby, a następnie opracować na tej podstawie potencjalny rurociąg bardziej ukierunkowanych leków terapeutycznych. „To bardzo przydatne narzędzie do wstępnej selekcji umożliwiające badanie wariantów genetycznych z dużą wydajnością” – mówi Stroup. „Miejmy nadzieję, że pomoże to zmniejszyć liczbę potencjalnych mutacji, dzięki czemu proces będzie bardziej wydajny”.

Stroup twierdzi, że zespół planuje także odtworzyć swoje badania na innych organizmach, aby zobaczyć, jak zmienia się transkrypcja RNA między różnymi zwierzętami. Mają nadzieję – mówi – wykorzystać tę wiedzę do kontrolowania poliA lub zapobiegania jej, gdy jej procesy wymykają się spod kontroli – jak w przypadku epilepsji i dystrofii mięśniowej – i powodują rzeczywiste szkody.

Naukowcy opublikowali swoje papier w dzienniku Natura.

Z artykułów w Twojej witrynie

Powiązane artykuły w Internecie


Źródło