Nauka i technika

Model uczenia maszynowego znajduje genetyczne czynniki chorób serca

  • 1 maja, 2023
  • 7 min read
Model uczenia maszynowego znajduje genetyczne czynniki chorób serca


Ten artykuł został sprawdzony zgodnie z procesem redakcyjnym i zasadami Science X. Redaktorzy podkreślili następujące atrybuty, zapewniając jednocześnie wiarygodność treści:

sprawdzone

publikacja recenzowana

zaufane źródło

czytać korektę






Źródło: Sonja Vasiljeva, Broad Communications

Aby uzyskać wgląd w serce, kardiolodzy często używają elektrokardiogramów (EKG) do śledzenia jego aktywności elektrycznej i obrazów rezonansu magnetycznego (MRI) do mapowania jego struktury. Ponieważ te dwa rodzaje danych ujawniają różne szczegóły dotyczące serca, lekarze zazwyczaj badają je oddzielnie, aby zdiagnozować choroby serca.

Teraz w artykule opublikowanym w r Komunikacja natury, naukowcy z Centrum Erica i Wendy Schmidtów w Broad Institute na MIT i Harvardzie opracowali podejście do uczenia maszynowego, które może jednocześnie uczyć się wzorców z EKG i MRI i na podstawie tych wzorców przewidywać charakterystykę serca pacjenta. Takie narzędzie, po dalszym rozwoju, może pewnego dnia pomóc lekarzom w lepszym wykrywaniu i diagnozowaniu chorób serca na podstawie rutynowych badań, takich jak EKG.

Naukowcy wykazali również, że mogą analizować zapisy EKG, które są łatwe i tanie do pozyskania, oraz generować filmy MRI tego samego serca, których przechwycenie jest znacznie droższe. A ich metoda mogłaby nawet zostać wykorzystana do znalezienia nowych markerów genetycznych chorób serca, które mogą zostać pominięte w istniejących podejściach, które analizują poszczególne modalności danych.

Ogólnie rzecz biorąc, zespół stwierdził, że ich technologia jest bardziej holistycznym sposobem badania serca i jego dolegliwości. „Oczywiste jest, że te dwa widoki, EKG i MRI, powinny być zintegrowane, ponieważ zapewniają różne perspektywy na stan serca” – powiedziała Caroline Uhler, współautorka badania, członkini Broad core Institute, współautorka badania. dyrektor Centrum Schmidta w Broad oraz profesor na Wydziale Elektrotechniki i Informatyki, a także w Instytucie Danych, Systemów i Społeczeństwa na MIT.

Warto przeczytać!  Trójka rodzeństwa Hexham z niewydolnością nerek w końcu otrzymuje odpowiedzi dzięki zespołowi genetyki Uniwersytetu w Newcastle

„Jako dziedzina, kardiologia ma to szczęście, że dysponuje wieloma metodami diagnostycznymi, z których każda zapewnia inny pogląd na fizjologię serca w zdrowiu i chorobie. Wyzwanie, przed którym stoimy, polega na tym, że brakuje nam systematycznych narzędzi do zintegrowania tych metod w jeden, spójny obraz” – powiedział Anthony Philippakis, starszy współautor badania i dyrektor ds. danych w Broad oraz współdyrektor Centrum Schmidta. „To badanie stanowi pierwszy krok w kierunku zbudowania takiej multimodalnej charakterystyki”.






Przegląd naszych intermodalnych ram autoenkodera do integracji modalności danych sercowo-naczyniowych. Nasz model jest szkolony na parach EKG i MRI serca z brytyjskiego Biobanku. a Wizualizacja naszego potoku szkoleniowego. Kodery specyficzne dla modalności odwzorowują modalności danych na wspólną ukrytą przestrzeń, w której strata kontrastu jest wykorzystywana do wymuszenia ograniczenia polegającego na tym, że sparowane próbki są osadzone w pobliżu i dalej od innych próbek. Dekodery specyficzne dla modalności są następnie używane do rekonstrukcji modalności z punktów w przestrzeni ukrytej. b Wyuczone reprezentacje międzymodalne są wykorzystywane do dalszych zadań przewidywania fenotypów poprzez trenowanie modelu uczenia nadzorowanego (np. maszyny jądra) na utajonych reprezentacjach. c Nasz system umożliwia translację między modalnościami: EKG można przetłumaczyć na odpowiednie MRI i odwrotnie. d Wyuczone reprezentacje międzymodalne można wykorzystać do zrozumienia map genotyp-fenotyp w przypadku braku znakowanych fenotypów przez wykonanie GWAS w utajonej przestrzeni między modelami i grupowanie SNP poprzez ich sygnatury (tj. wektor w utajonej przestrzeni zorientowany z homozygoty odniesienie do średniej zastępcy heterozygoty i homozygoty); SNP 1 i 4 mają podobne sygnatury w przestrzeni utajonej, a zatem podobne efekty fenotypowe. Kredyt: Komunikacja natury (2023). DOI: 10.1038/s41467-023-38125-0

Modelarstwo

Aby opracować swój model, naukowcy wykorzystali algorytm uczenia maszynowego zwany autoenkoderem, który automatycznie integruje gigantyczne pokosy danych w zwięzłą reprezentację – prostszą formę danych. Następnie zespół wykorzystał tę reprezentację jako dane wejściowe dla innych modeli uczenia maszynowego, które dokonują określonych prognoz.

W swoich badaniach zespół najpierw wyszkolił swój autoenkoder za pomocą EKG i MRI serca od uczestników brytyjskiego Biobanku. Wprowadzili dziesiątki tysięcy zapisów EKG, z których każdy był połączony z obrazami MRI tej samej osoby. Następnie algorytm utworzył wspólne reprezentacje, które uchwyciły kluczowe szczegóły z obu typów danych.

„Kiedy już masz te reprezentacje, możesz ich używać do wielu różnych zastosowań” – powiedział Adityanarayanan Radhakrishnan, współpierwszy autor badania, stypendysta Erica i Wendy Schmidt Center w Broad oraz absolwent MIT w laboratorium Uhlera . Drugim współautorem jest Sam Friedman, starszy naukowiec zajmujący się uczeniem maszynowym w Data Sciences Platform na Broad.

Warto przeczytać!  Elon Musk przełamuje szeregi Partii Republikańskiej, chwaląc technologię inżynierii genetycznej, która pomogła w walce z Covid-19: „Medycyna cyfrowa o niesamowitym potencjale” – SPDR Series Trust SPDR S&P Biotech ETF (ARCA:XBI)

Jednym z takich zastosowań jest przewidywanie cech związanych z sercem. Naukowcy wykorzystali reprezentacje utworzone przez ich autoenkodery do zbudowania modelu, który mógłby przewidzieć szereg cech, w tym cechy serca, takie jak masa lewej komory, inne cechy pacjenta związane z czynnością serca, takie jak wiek, a nawet zaburzenia serca. Co więcej, ich model przewyższał bardziej standardowe podejścia do uczenia maszynowego, a także algorytmy autoenkodera, które zostały przeszkolone tylko w jednej z metod obrazowania.

„Pokazaliśmy tutaj, że uzyskasz lepszą dokładność przewidywania, jeśli uwzględnisz wiele typów danych” – powiedział Uhler.

Radhakrishnan wyjaśnił, że ich model zapewniał dokładniejsze prognozy, ponieważ wykorzystywał reprezentacje, które zostały przeszkolone na znacznie większym zbiorze danych. Autoenkodery nie wymagają danych, które zostały oznaczone przez ludzi, więc zespół mógł zasilić swój autokoder około 39 000 nieoznakowanych par obrazów EKG i MRI, zamiast zaledwie około 5000 par oznaczonych.

Naukowcy zademonstrowali inne zastosowanie swojego autoenkodera: generowanie nowych filmów MRI. Wprowadzając zapis EKG danej osoby do modelu — bez sparowanego zapisu MRI — model wytworzył przewidywany film MRI dla tej samej osoby.

Przy dalszych pracach naukowcy przewidują, że taka technologia mogłaby potencjalnie pozwolić lekarzom dowiedzieć się więcej o zdrowiu serca pacjenta z samych zapisów EKG, które są rutynowo gromadzone w gabinetach lekarskich.

Szersze wyszukiwanie genów

Dzięki reprezentacjom autoenkodera zespół zdał sobie sprawę, że może ich również użyć do poszukiwania wariantów genetycznych związanych z chorobami serca. Tradycyjna metoda znajdowania wariantów genetycznych choroby, zwana badaniem asocjacyjnym całego genomu (GWAS), wymaga danych genetycznych od osób, które zostały oznaczone chorobą będącą przedmiotem zainteresowania.

Warto przeczytać!  Trinity Rodman twierdzi, że jej poczucie stylu może być „genetyczne”

Ale ponieważ struktura autoenkodera zespołu nie wymaga oznaczonych danych, byli w stanie wygenerować reprezentacje, które odzwierciedlają ogólny stan serca pacjenta. Korzystając z tych reprezentacji i danych genetycznych dotyczących tych samych pacjentów z brytyjskiego Biobanku, naukowcy stworzyli model, który szukał wariantów genetycznych, które wpływają na stan serca w bardziej ogólny sposób. Model stworzył listę wariantów, w tym wiele znanych wariantów związanych z chorobami serca oraz kilka nowych, które można teraz dalej badać.

Radhakrishnan powiedział, że odkrycie genetyczne może być obszarem, w którym ramy autoenkodera, z większą ilością danych i rozwojem, mogą mieć największy wpływ – nie tylko na choroby serca, ale na każdą chorobę. Zespół badawczy już pracuje nad zastosowaniem ich struktury autoenkodera do badania chorób neurologicznych.

Uhler powiedział, że ten projekt jest dobrym przykładem tego, jak innowacje w analizie danych biomedycznych pojawiają się, gdy naukowcy zajmujący się uczeniem maszynowym współpracują z biologami i lekarzami. „Ekscytującym aspektem zainteresowania naukowców zajmujących się uczeniem maszynowym kwestiami biomedycznymi jest to, że mogą oni wymyślić zupełnie nowy sposób patrzenia na problem”.

Więcej informacji:
Adityanarayanan Radhakrishnan i in., Cross-modal autoencoder framework uczy się holistycznych reprezentacji stanu układu sercowo-naczyniowego, Komunikacja natury (2023). DOI: 10.1038/s41467-023-38125-0

Informacje o czasopiśmie:
Komunikacja natury


Źródło