Nauka i technika

Nowe narzędzie AI przeszukuje genetyczne stogi siana, aby znaleźć warianty powodujące choroby

  • 2 czerwca, 2023
  • 5 min read
Nowe narzędzie AI przeszukuje genetyczne stogi siana, aby znaleźć warianty powodujące choroby


Naukowcy opracowali sposób na przesiewanie milionów różnic w planie genetycznym danej osoby, aby wykryć te, które zagrażają naszemu zdrowiu, i przetestowali nowe narzędzie w biomedycznej bazie danych obejmującej ponad 450 000 osób w Wielkiej Brytanii, zgodnie z serią artykułów opublikowane w czwartek w czasopiśmie Science.

Eksperci twierdzą, że badania stanowią kluczowy krok w kierunku wykorzystania pełnej mocy genomu w medycynie i pokazują nowy sposób, w jaki sztuczna inteligencja może być zastosowana do problemów zdrowia ludzkiego.

Jeden z problemów, który od lat frustruje lekarzy, wynika z faktu, że chociaż jesteśmy w 99,6 proc. podobni na poziomie DNA, każdy z nas ma średnio 4 miliony wariantów, fragmentów kodu genetycznego, którymi się od siebie różnimy.

„Niezwykle trudno było określić, które z nich powodują choroby, a które nie” – powiedział Kyle Farh, wiceprezes ds. sztucznej inteligencji w firmie biotechnologicznej Illumina z siedzibą w San Diego.

Farh i międzynarodowy zespół prawie 100 badaczy stworzyli algorytm, który ma pomóc medycynie wyjaśnić część niepewności. „Naszym celem jest wyeliminowanie wariantów o nieznanym znaczeniu, co jest główną przeszkodą w odblokowaniu wartości medycyny genomowej” – powiedział Farh.

Tak jak ChatGPT może nauczyć się przewidywać ludzką mowę, zlecając inżynierom karmienie go bogatym tekstem, tak nowy algorytm został przeszkolony w zakresie przewidywania medycznego na podstawie odczytywania genomów.

Naukowcy zbudowali algorytm o nazwie PrimateAI-3D, wykorzystując plany genetyczne 233 różnych gatunków naczelnych. Ta baza wyraźnie ukazuje warianty, które mogą być tolerowane przez naczelne, w tym ludzi, oraz te, które okazują się śmiertelne. Naukowcy szukają miejsc, w których sekwencja jest taka sama u jednego naczelnego, co jest wyraźnym znakiem, że każda zmiana jest katastrofalna.

Warto przeczytać!  Nowy pakt Myriad Genetics (MYGN) mający na celu rozszerzenie dostępu do testów HRD

„To genialny pomysł. Gdy tylko przeczytałem artykuł, wysłałem go do mojego zespołu i powiedziałem: „Musimy się tym zająć” – powiedział Stephen Kingsmore, prezes i dyrektor generalny Rady Children’s Institute for Genomic Medicine, placówki z siedzibą w San Diego który dekoduje genomy 1000 rodzin rocznie dla 90 szpitali w całych Stanach Zjednoczonych.

Kingsmore powiedział, że w około jednej czwartej przypadków lekarze sekwencjonują genom pacjenta tylko po to, aby znaleźć wariant o nieznanym wpływie na zdrowie.

„Wyrządzamy im wielką krzywdę” — powiedział powiedział. „Rodzice w pewnym sensie rozkładają ręce i pytają:„ Czy dziecko ma chorobę, czy nie? i możemy tylko powiedzieć: „Może”.

Do tej pory szpitale badające warianty genetyczne u swoich pacjentów często korzystały z dużego archiwum o nazwie ClinVar. Farh powiedział, że nowy algorytm PrimateAI-3D skanuje około 70 milionów wariantów genetycznych, co stanowi wybór ponad 1000 razy większy niż ClinVar.

3D w nazwie odnosi się do trójwymiarowej struktury białek, kluczowego czynnika w rozróżnianiu, które mutacje będą siać spustoszenie. Wiele chorób jest spowodowanych mutacjami, które uszkadzają białko lub powodują, że organizm wytwarza go za dużo lub za mało.

Warto przeczytać!  PatientSeek ma na celu połączenie pacjentów z chorobą Parkinsona, najlepsze metody leczenia

Nie jest jasne, jak dużą różnicę zrobi algorytm w codziennej medycynie, „ale pokazują, że przewyższa wszystko, co mamy obecnie” – powiedział Bruce Gelb, dyrektor Mindich Child Health and Development Institute w Icahn School of Medicine na górze Synaj.

Gelb, który nie był częścią zespołu badawczego, powiedział, że widział poprzednią wersję algorytmu opisaną w Nature Genetics w 2018 roku. Wcześniejsza wersja była oparta na zaledwie sześciu gatunkach naczelnych innych niż człowiek, w przeciwieństwie do 233 gatunków naczelnych w Nowa wersja. „To bardzo duży wzrost i daje znacznie większą moc statystyczną do znajdowania rzeczy” — powiedział Gelb.

Matthew Lebo, który kieruje Laboratorium Medycyny Molekularnej w Mass General Brigham, powiedział, że PrimateAI-3D nie wyeliminuje problemu znajdowania wariantów o nieznanym znaczeniu, ale pomoże lekarzom ustalić priorytety wariantów, które badają dla określonej choroby.

Nowe narzędzie powinno również pomóc firmom farmaceutycznym w poszukiwaniu nowych leków. Próby kliniczne często kończą się niepowodzeniem, ponieważ gen, na który celują naukowcy, jest „niepoprawny i nie ma związku z chorobą” – powiedział Farh. „Wykorzystanie sztucznej inteligencji i genomiki do wyboru właściwych celów powinno znacznie zmniejszyć odsetek niepowodzeń badań klinicznych na późnym etapie”.

Warto przeczytać!  Jak testy genetyczne Wilsona pomagają innym dzieciom chorym na padaczkę

Illumina zapowiedziała, że ​​udostępni nowe narzędzie w przyszłych wersjach swoich produktów.

Testując nowy algorytm na setkach tysięcy genomów pacjentów w brytyjskim Biobanku, „odkryliśmy, że 97 procent ogólnej populacji jest nosicielem rzadkiego wariantu”, który ma jakiś znaczący wpływ na zdrowie, powiedział Farh. Chociaż algorytm nie może uwzględniać wpływu diety i czynników środowiskowych, wyjaśnił: „Możemy zasadniczo przewidzieć poziom cholesterolu i glukozy u ludzi, a tym samym ryzyko wystąpienia chorób układu krążenia lub cukrzycy, na podstawie genomu, przewidując wpływ tych wariantów. ”

Kingsmore powiedział, że nauka o genomie „zmusza medycynę do sztucznej inteligencji” od lat ze względu na sam rozmiar naszego planu genetycznego. Genom to długi kod zapisany czterema literami: A, T, G, C. Każda litera oznacza jedną z czterech zasad chemicznych, z których zbudowane jest nasze DNA: adeninę, tyminę, guaninę i cytozynę. Jeden pełny genom jest jak drabina zawierająca około 3 miliardów stopni, z parą liter na każdym z nich.

National Institutes of Health szacuje, że sekwencjonowanie genomu generuje obecnie do 40 miliardów gigabajtów danych rocznie, co odpowiada około 10 milionom pełnych genomów.

„Powodem, dla którego sztuczna inteligencja jest tak dobrze dopasowana” – powiedział – „jest to, że personel medyczny jest tak źle przygotowany” do wyciągania odpowiedzi z takiego oceanu danych.


Źródło