Nauka i technika

Przewidywanie reakcji genów grzybów przy użyciu nowego podejścia do uczenia maszynowego

  • 20 listopada, 2023
  • 6 min read
Przewidywanie reakcji genów grzybów przy użyciu nowego podejścia do uczenia maszynowego


Ten artykuł został zrecenzowany zgodnie z procesem redakcyjnym i polityką Science X. Redaktorzy podkreślili następujące atrybuty, zapewniając jednocześnie wiarygodność treści:

sprawdzone fakty

recenzowana publikacja

zaufane źródło

czytać korektę


Model FUN-PROSE dokładnie przewiduje specyficzną dla stanu ekspresję genów dla trzech różnych gatunków grzybów. Wyniki FUN-PROSE przewidujące specyficzną dla stanu ekspresję genów N. crassa (a), S. cerevisiae (b) i I. orientalis (c). Górny panel pokazuje wykresy punktowe przewidywanych (oś y) i zmierzonych eksperymentalnie (oś x) poziomów ekspresji, przy czym kolor reprezentuje gęstość punktów. Dolne panele pokazują macierze zamieszania poziomów ekspresji podzielone na trzy kategorie (niski, średni i wysoki) (szczegóły w tekście). Kredyt: Biologia obliczeniowa PLOS (2023). DOI: 10.1371/journal.pcbi.1011563

× zamknąć


Model FUN-PROSE dokładnie przewiduje specyficzną dla stanu ekspresję genów dla trzech różnych gatunków grzybów. Wyniki FUN-PROSE przewidujące specyficzną dla stanu ekspresję genów N. crassa (a), S. cerevisiae (b) i I. orientalis (c). Górny panel pokazuje wykresy punktowe przewidywanych (oś y) i zmierzonych eksperymentalnie (oś x) poziomów ekspresji, przy czym kolor reprezentuje gęstość punktów. Dolne panele pokazują macierze zamieszania poziomów ekspresji podzielone na trzy kategorie (niski, średni i wysoki) (szczegóły w tekście). Kredyt: Biologia obliczeniowa PLOS (2023). DOI: 10.1371/journal.pcbi.1011563

Sygnały ze środowiska uruchamiają kaskadę zmian, które na różne sposoby wpływają na różne geny. Dlatego tradycyjnie trudno było zbadać, jak takie sygnały wpływają na organizm. W ramach nowego badania naukowcy opracowali metodę uczenia maszynowego o nazwie FUN-PROSE, która pozwala przewidywać, jak geny reagują na różne warunki środowiskowe.

Komórki, niezależnie od organizmu, dostosowują swoją reakcję na otoczenie za pomocą mRNA. Po pierwsze, wykorzystują białka zwane czynnikami transkrypcyjnymi, które wykrywają zmiany, a następnie wiążą się z sekwencją DNA – zwaną promotorem – przed genami. To przyłączenie może albo zatrzymać tworzenie się mRNA z genu, albo zwiększyć ilość wytwarzanego mRNA.

Warto przeczytać!  » Lider badań nad alergiami odchodzi na emeryturę

mRNA służy następnie jako matryca do produkcji białek odpowiedzialnych za różne funkcje w komórce. Mechanizm ten umożliwia komórkom szybką realokację zasobów do procesów niezbędnych do przeżycia.

Badanie sposobu kontrolowania promotorów jest jednym z najstarszych wyzwań genomiki, a mimo to badacze wciąż się z nim borykają. Największym problemem jest to, że różne czynniki transkrypcyjne mogą wiązać się z tą samą sekwencją promotora i robić to w różnych układach, w różnych warunkach środowiskowych.

Co więcej, chociaż istnieją pewne dowody na to, że czynniki transkrypcyjne mają tendencję do wiązania się z określonymi motywami sekwencji w promotorach, nie wszystkie z nich zostały szeroko zbadane. W ostatnich latach badacze zwrócili się ku sztucznej inteligencji, aby pomóc im rozwiązać te wyzwania.

„Geny charakteryzują się średnim poziomem ekspresji, a poprzednie modele uczenia maszynowego nie były w stanie zmierzyć, jak zmieniają się te poziomy w różnych warunkach” – powiedział Siergiej Masłow (lider CAIM/CABBI), profesor bioinżynierii i fizyki. „Chcieliśmy zrozumieć, jak określone geny reagują na zmiany pH, temperatury i składników odżywczych”.

Naukowcy opracowali model o nazwie FUNgal PROmoter to Condition-Specific Expression (FUN-PROSE), aby przewidzieć, jak drożdże piekarskie (Saccharomyces cerevisiae) i mniej zbadane grzyby Neurospora crassa i Issatchenkia orientalis zareagują na zmiany środowiskowe.

Aby opracować model, naukowcy musieli najpierw zidentyfikować sekwencje promotorów i czynniki transkrypcyjne dla trzech gatunków. Następnie przeszkolili model, aby dowiedzieć się, jakie motywy promotora są rozpoznawane przez czynniki transkrypcyjne w różnych warunkach.

Warto przeczytać!  Nowe dane genetyczne łączą jenoty z pochodzeniem pandemii

„Czynniki transkrypcyjne N. crassa i I. orientalis nie są tak dobrze znane jak S. cerevisiae, dlatego musieliśmy wywnioskować, jakie geny można zidentyfikować na podstawie czynników transkrypcyjnych u tych gatunków” – powiedział Ananthan Nambiar, absolwent Instytutu grupa Masłowa. Według Veroniki Dubinkiny, byłej absolwentki grupy Maslova, obecnie badaczki ze stopniem doktora w Gladstone Institutes, proces ten obejmował powszechnie stosowane podejście polegające na skanowaniu regionów białkowych, o których wiadomo, że wiążą DNA.

Wreszcie model nauczył się, jak integrować wszystkie informacje, aby obliczyć, ile mRNA powstaje w określonych warunkach w porównaniu ze średnim poziomem mRNA. Następnie naukowcy porównali wyniki uzyskane w badaniu FUN-PROSE z danymi dotyczącymi sekwencji RNA, które mierzą zmienne poziomy mRNA wszystkich trzech grzybów. Każdy organizm ma ponad 4000 genów i 180 czynników transkrypcyjnych, które mierzono w 12–295 warunkach, w zależności od tego, jak dobrze został zbadany.

„Przewidywanie, które geny są ważne w danych warunkach, zawsze było trudnym problemem. Odkryliśmy jednak, że nasz model był bardzo blisko przewidywania, co faktycznie dzieje się w tych organizmach” – powiedział Nambiar.

Oprócz oceny jego działania badacze wyjaśnili, w jaki sposób model formułuje swoje przewidywania. „Nawet przy czarnoskrzynkowej naturze modelu udało nam się zrozumieć, jak nasz model patrzy na promotorów i zauważyliśmy, że nauczył się wyszukiwać znane sekwencje” – powiedział Simon Liu, były student w grupie Maslova. „Możliwość interpretacji wytrenowanego modelu jest niezbędna do sprawdzenia jego logiki, a także wykorzystania go do odkrycia nowej wiedzy regulacyjnej”.

Warto przeczytać!  Czy życie ewoluowało więcej niż raz? Naukowcy zbliżają się do odpowiedzi

Modelka zmaga się jednak z promotorami, z którymi wcześniej się nie spotkała. „Model świetnie sprawdza się w nowych warunkach, ale jeśli doda się do niego nowy gen lub sekwencję promotora, popełnia błędy” – powiedział Nambiar.

Zdaniem Masłowa błędy te wynikały z ograniczonej dostępności danych. „Uczenie maszynowe to czarna skrzynka i trzeba je dobrze trenować, aby móc nauczyć się biologii” – powiedział. „Jeśli uda nam się zdobyć więcej danych, model będzie zawierał więcej wzorców, z których można się uczyć i będzie zawierał dokładniejsze przewidywania”.

Naukowcy są obecnie zainteresowani testowaniem swojego modelu na innych organizmach. „W zasadzie nie ma ograniczeń dla naszej techniki – powinna działać na każdy organizm. Jednak np. u zwierząt sterowanie genami odbywa się w bardziej skomplikowany sposób, co będzie wymagało znaczących zmian w architekturze modelu i znacznie większej ilości danych treningowych, – powiedział Masłow. „Mimo to ciekawie byłoby zobaczyć, jak dobrze radzi sobie ten model”.

Wyniki badań publikowane są w czasopiśmie Biologia obliczeniowa PLOS.

Więcej informacji:
Ananthan Nambiar i wsp., FUN-PROSE: podejście oparte na głębokim uczeniu się w celu przewidywania ekspresji genów specyficznej dla stanu u grzybów, Biologia obliczeniowa PLOS (2023). DOI: 10.1371/journal.pcbi.1011563

Informacje o czasopiśmie:
Biologia obliczeniowa PLoS


Źródło