Nauka i technika

Podejście do uczenia maszynowego przewiduje, jak geny reagują na warunki środowiskowe

  • 23 listopada, 2023
  • 5 min read
Podejście do uczenia maszynowego przewiduje, jak geny reagują na warunki środowiskowe


Sygnały ze środowiska uruchamiają kaskadę zmian, które na różne sposoby wpływają na różne geny. Dlatego tradycyjnie trudno było zbadać, jak takie sygnały wpływają na organizm. W ramach nowego badania naukowcy opracowali metodę uczenia maszynowego o nazwie FUN-PROSE, która pozwala przewidywać, jak geny reagują na różne warunki środowiskowe.

Komórki, niezależnie od organizmu, dostosowują swoją reakcję na otoczenie za pomocą mRNA. Po pierwsze, wykorzystują białka zwane czynnikami transkrypcyjnymi, które wykrywają zmiany, a następnie wiążą się z sekwencją DNA – zwaną promotorem – przed genami. To przyłączenie może albo zatrzymać tworzenie się mRNA z genu, albo zwiększyć ilość wytwarzanego mRNA. mRNA służy następnie jako matryca do produkcji białek odpowiedzialnych za różne funkcje w komórce. Mechanizm ten umożliwia komórkom szybką realokację zasobów do procesów niezbędnych do przeżycia.

Badanie sposobu kontrolowania promotorów jest jednym z najstarszych wyzwań genomiki, a mimo to badacze wciąż się z nim borykają. Największym problemem jest to, że różne czynniki transkrypcyjne mogą wiązać się z tą samą sekwencją promotora i robić to w różnych układach, w różnych warunkach środowiskowych. Co więcej, chociaż istnieją pewne dowody na to, że czynniki transkrypcyjne mają tendencję do wiązania się z określonymi motywami sekwencji w promotorach, nie wszystkie z nich zostały szeroko zbadane. W ostatnich latach badacze zwrócili się ku sztucznej inteligencji, aby pomóc im rozwiązać te wyzwania.

„Geny charakteryzują się średnim poziomem ekspresji, a poprzednie modele uczenia maszynowego nie były w stanie zmierzyć, jak zmieniają się te poziomy w różnych warunkach” – powiedział Siergiej Masłow (lider CAIM/CABBI), profesor bioinżynierii i fizyki. „Chcieliśmy zrozumieć, jak określone geny reagują na zmiany pH, temperatury i składników odżywczych”.

Naukowcy opracowali model nazwany FUNgal PROmoter to Condition-Specific Expression (FUN-PROSE), aby przewidzieć, jak drożdże piekarskie (Saccharomyces cerevisiae) i mniej zbadane grzyby Neurospora Crassa I Issatchenkia orientalis reagowałoby na zmiany środowiska.

Aby opracować model, naukowcy musieli najpierw zidentyfikować sekwencje promotorów i czynniki transkrypcyjne dla trzech gatunków. Następnie przeszkolili model, aby dowiedzieć się, jakie motywy promotora są rozpoznawane przez czynniki transkrypcyjne w różnych warunkach.

„Czynniki transkrypcyjne N. crassa I I. orientalis nie są tak znane jak S. cerevisiae, więc musieliśmy wywnioskować, jakie geny można zidentyfikować na podstawie czynników transkrypcyjnych u tych gatunków” – powiedział Ananthan Nambiar, absolwent grupy Maslova. Według Veroniki Dubinkiny, byłej absolwentki grupy Maslova, obecnie badaczki ze stopniem doktora w Gladstone Institutes, proces ten obejmował powszechnie stosowane podejście polegające na skanowaniu regionów białkowych, o których wiadomo, że wiążą DNA.

Warto przeczytać!  Usuwanie lub zastępowanie błędów w kodzie genetycznym pacjenta może leczyć niektóre choroby genetyczne

Wreszcie model nauczył się, jak integrować wszystkie informacje, aby obliczyć, ile mRNA powstaje w określonych warunkach w porównaniu ze średnim poziomem mRNA. Następnie naukowcy porównali wyniki uzyskane w badaniu FUN-PROSE z danymi dotyczącymi sekwencji RNA, które mierzą zmienne poziomy mRNA wszystkich trzech grzybów. Każdy organizm ma ponad 4000 genów i 180 czynników transkrypcyjnych, które mierzono w 12–295 warunkach, w zależności od tego, jak dobrze został zbadany.

„Przewidywanie, które geny są ważne w określonych warunkach, zawsze było trudnym problemem. Odkryliśmy jednak, że nasz model był bardzo bliski przewidywania, co faktycznie dzieje się w tych organizmach” – powiedział Nambiar.

Oprócz oceny jego działania badacze wyjaśnili, w jaki sposób model formułuje swoje przewidywania. „Mimo czarnoskrzynkowej natury byliśmy w stanie zrozumieć, jak nasz model patrzy na promotorów i zauważyliśmy, że nauczył się wyszukiwać znane sekwencje” – powiedział Simon Liu, były student w grupie Maslova. „Możliwość interpretacji wyszkolonego modelu jest niezbędna do sprawdzenia jego logiki, a także wykorzystania go do odkrycia nowej wiedzy regulacyjnej”.

Modelka zmaga się jednak z promotorami, z którymi wcześniej się nie spotkała. „Model świetnie sprawdza się w nowych warunkach, ale jeśli doda się do niego nowy gen lub sekwencję promotora, popełnia błędy” – powiedział Nambiar.

Warto przeczytać!  Potwierdzenie teorii powstawania planet, gwiazd i czarnych dziur

Zdaniem Masłowa błędy te wynikały z ograniczonej dostępności danych. „Uczenie maszynowe to czarna skrzynka i trzeba je dobrze trenować, aby móc nauczyć się biologii” – powiedział. „Jeśli uda nam się zdobyć więcej danych, model będzie zawierał więcej wzorców, z których można się uczyć i będzie zawierał dokładniejsze przewidywania”.

Naukowcy są obecnie zainteresowani testowaniem swojego modelu na innych organizmach. „W zasadzie nie ma ograniczeń co do naszej techniki – powinna działać na każdy organizm. Jednak na przykład u zwierząt geny są kontrolowane w bardziej skomplikowany sposób, co będzie wymagało znacznych zmian w architekturze modelu i znacznie większej ilości danych szkoleniowych” – powiedział Maslov. „Mimo to ciekawie byłoby zobaczyć, jak dobrze radzi sobie ten model”.

Odniesienie: Nambiar A, Dubinkina V, Liu S, Maslov S. FUN-PROSE: podejście do głębokiego uczenia się w celu przewidywania ekspresji genów specyficznej dla stanu u grzybów. Robinson-Rechavi M, wyd. PLoS Comput Biol. 2023;19(11):e1011563. doi: 10.1371/journal.pcbi.1011563

Artykuł ten został ponownie opublikowany na podstawie następujących materiałów. Uwaga: materiał mógł zostać zmieniony pod względem długości i treści. Aby uzyskać więcej informacji, skontaktuj się z cytowanym źródłem.


Źródło