Nauka i technika

Boffins budują sztuczną inteligencję, aby identyfikować mutacje genetyczne • Rejestr

  • 5 stycznia, 2023
  • 5 min read
Boffins budują sztuczną inteligencję, aby identyfikować mutacje genetyczne • Rejestr


Techniki uczenia maszynowego, takie jak głębokie uczenie się, okazały się zaskakująco skuteczne w identyfikowaniu chorób, takich jak rak piersi. Jednak jeśli chodzi o identyfikację mutacji na poziomie genetycznym, według naukowców z University of California San Diego (UCSD) modele te okazały się niewystarczające.

W artykule opublikowanym w tym tygodniu w czasopiśmie Nature Biotechnology naukowcy z uniwersytetu proponują nową platformę uczenia maszynowego o nazwie DeepMosaic, która wykorzystuje kombinację wizualizacji opartej na obrazie i modeli głębokiego uczenia się do identyfikacji mutacji genetycznych związanych z chorobami, w tym rakiem i zaburzeniami genetycznymi. powiązań, takich jak zaburzenia ze spektrum autyzmu.

Wykorzystanie AI/ML do identyfikacji chorób było gorącym tematem w ostatnich latach. Na przykład w sierpniu naukowcy z Harvardu szczegółowo opisali multimodalny system sztucznej inteligencji zdolny do przewidywania 14 rodzajów raka.

Według profesora UCSD Joe Gleesona problem polega na tym, że większość z tych modeli nie jest dobrze przystosowana do identyfikacji mutacji genetycznych, zwanych wariantami mozaiki lub mutacjami, ponieważ większość oprogramowania opracowanego w ciągu ostatnich dwóch dekad była szkolona na próbkach raka.

Ponieważ komórki rakowe dzielą się tak szybko, są stosunkowo łatwe do wykrycia przez programy komputerowe, wyjaśnił w wywiadzie dla Rejestr. Dla porównania, mutacje mozaikowe są trudne do wykrycia, ponieważ istnieją tylko w podzbiorze komórek.

Warto przeczytać!  Przyszłość jagód: lepszy smak, odporność klimatyczna, większa podaż jesienno-zimowa | Artykuł

W przeciwieństwie do tego, czego uczono cię w szkole podstawowej, kiedy komórki się dzielą, nie są one idealną kopią siebie nawzajem. Istnieją drobne zmiany lub mutacje, wyjaśnił Gleeson. Mutacje te są zwykle nieszkodliwe, ale czasami prowadzą do raka lub innych chorób. To sprawia, że ​​metody identyfikacji potencjalnie problematycznych mutacji są tak cenne.

Ale do niedawna „nie było dobrego sposobu na zidentyfikowanie tych mutacji na podstawie sekwencjonowania DNA” – powiedział. „To, co przedstawiamy w tym artykule, to nowy sposób na zrobienie tego [which] korzysta z głębokiego uczenia się”.

Nurkowanie w DeepMosaic

Sam framework DeepMosaic został przeszkolony na 180 000 wariantów mozaiki przy użyciu węzłów GPU Nvidia Kepler K80 umieszczonych w klastrze obliczeniowym Comet w San Diego Supercomputing Center.

Dostępny jako wstępnie wyszkolony model open source, framework działa poprzez konwersję sekwencji genomu na obrazy, a następnie stosuje konwolucyjną sieć neuronową głębokiego uczenia się w celu identyfikacji mutacji mozaikowych, powiedział Xiaoxu Yang, badacz ze stopniem doktora pracujący nad projektem Rejestr.

I w przeciwieństwie do niektórych modeli uczenia maszynowego, każdy, kto wdraża DeepMosaic, nie powinien musieć kondycjonować swoich danych, chyba że planuje przeszkolić model.

Warto przeczytać!  MGI wspiera branżę nauk przyrodniczych dzięki rewolucyjnej kampanii What If na XXIII Międzynarodowym Kongresie Genetyki

Naukowcy twierdzą, że w porównaniu z istniejącymi metodami model może identyfikować te mutacje z większą dokładnością. W porównaniu z ręcznym procesem weryfikacji wymaganym przez konwencjonalne metody, jest to również o rząd wielkości szybsze, zauważył Gleeson.

Biorąc pod uwagę wystarczającą moc GPU, Yang mówi, że DeepMosaic powinien być w stanie przejrzeć cały profil genomowy w ciągu godziny. I chociaż model został przeszkolony na Comet, nie oznacza to, że potrzebujesz superkomputera do uruchomienia lub nawet ponownego nauczenia modelu. Twierdził, że całkowicie możliwe jest, aby ktoś trenował DeepMosaic przy użyciu osobistej stacji roboczej.

Ramy oferują również wyraźne korzyści w porównaniu z modelami opracowanymi specjalnie z myślą o raku, powiedział Yang. Większość z tych programów wymaga nienowotworowej próbki kontrolnej. To sprawia, że ​​​​używanie ich do identyfikacji wariantów mozaiki jest niepraktyczne, ponieważ mutacje mogą rozprzestrzeniać się w wielu tkankach.

DeepMosaic „jest niezależny od kontroli, co oznacza, że ​​jesteśmy w stanie przyjrzeć się tym wariantom, które są wspólne dla różnych tkanek” – powiedział.

Choć lepiej nadaje się do identyfikacji wariantów mozaiki, naukowcy zauważają, że DeepMosaic, przynajmniej w swojej obecnej formie, nie jest praktyczny w przypadku próbek raka.

Warto przeczytać!  Ryzyko chorób układu krążenia może być czerwone

Ale, jak wskazuje Gleeson, możliwość dokładnego zidentyfikowania tych mutacji jest pierwszym krokiem w kierunku opracowania metod leczenia.

Klon Gita stąd

Badacze zainteresowani wypróbowaniem DeepMosaic nie będą musieli posuwać się daleko. Framework, dokumentacja i wersje demonstracyjne niezbędne do wdrożenia i przetestowania są dostępne do pobrania w GitHub.

Oprócz wstępnie wytrenowanego modelu badacze uwzględnili również wszystkie narzędzia niezbędne do ponownego nauczenia modelu na własnych zbiorach danych.

Według Gleesona wciąż jest wiele do zrobienia. „Obecnie wiele prac w genetyce człowieka dotyczy pochodzenia europejskiego” – wyjaśnił, dodając, że istnieje możliwość zastosowania tych narzędzi do różnych przodków.

Poza identyfikacją sygnatur chorób, DeepMosaic może mieć zastosowanie w sąsiednich dziedzinach. „Nasz model jest bardzo dobrze dostrojony do wykrywania subtelnych różnic w plikach sekwencji genomowych jednej osoby, ale myślę, że narzędzie prawdopodobnie ma zastosowania w innych dziedzinach” – powiedział Gleeson. „Na przykład w kryminalistyce, gdzie często słyszymy w wiadomościach o dopasowywaniu DNA do publicznych baz danych”.

Możliwości narzędzi, takich jak DeepMosaic, do poprawy zdrowia ludzkiego i zrozumienia będą nadal rosły, ponieważ koszt sekwencjonowania genomu będzie nadal spadał, dodał Yang. ®


Źródło