Nauka i technika

Google Research przedstawia nową metodę AI do odkryć genetycznych, która może wykorzystać ukryte informacje w wielowymiarowych danych klinicznych

  • 20 lipca, 2024
  • 4 min read
Google Research przedstawia nową metodę AI do odkryć genetycznych, która może wykorzystać ukryte informacje w wielowymiarowych danych klinicznych


Wysokowymiarowe dane kliniczne (HDCD) odnoszą się do zestawów danych w opiece zdrowotnej, w których liczba zmiennych (lub cech) jest znacznie większa niż liczba pacjentów (lub obserwacji). Wraz ze wzrostem liczby zmiennych przestrzeń danych rośnie wykładniczo, wymagając znacznych zasobów obliczeniowych, które utrudniają przetwarzanie i analizę. Ponadto modele zbudowane na danych wysokowymiarowych mogą być trudne do zinterpretowania, co utrudnia podejmowanie decyzji klinicznych. Trudności w uzyskaniu dużych zestawów danych z kompleksowymi etykietami chorób i ograniczenia standardowych etykiet chorób w odzwierciedlaniu złożonych cech biologicznych ograniczają efektywne wykorzystanie HDCD w badaniach genomicznych.

Badacze GoogleAI zajmują się wyzwaniem wykorzystania wielowymiarowych danych klinicznych (HDCD), takich jak spirogramy, fotopletyzmogramy (PPG) i dane obrazowe, do odkryć genetycznych i przewidywania chorób. Obecne metody badań genomicznych często obejmują badania asocjacji w całym genomie (GWAS) na zdefiniowanych przez ekspertów cechach wyodrębnionych z HDCD lub bezpośrednio na współrzędnych danych wielowymiarowych. Jednak podejścia te napotykają na wyzwania, takie jak koszty obliczeniowe, wysokie obciążenia związane z wielokrotnym testowaniem i ograniczone możliwości odkrywania złożonych powiązań genetycznych.

Nowe podejście Google’a o nazwie REpresentation Learning for Genetic discovery on Low-dimensional Embeddings (REGLE) zostało opracowane w celu rozwiązania tych ograniczeń. REGLE wykorzystuje nienadzorowane uczenie się reprezentacji, aby przekształcić HDCD w osadzenia o niższym wymiarze bez konieczności etykietowania chorób. Ta metoda integruje funkcje zdefiniowane przez ekspertów (EDF), jeśli są dostępne, i umożliwia bardziej wydajną i kompleksową analizę genetyczną.

Warto przeczytać!  Nowo odkryta wada genetyczna zaburza tworzenie krwi i układ odpornościowy

REGLE wykorzystuje autokoder wariacyjny (VAE) do nauki nieliniowych, niskowymiarowych, rozplątanych reprezentacji HDCD. Proces obejmuje trzy główne kroki: naukę osadzeń HDCD za pomocą VAE, przeprowadzanie GWAS na tych osadzeniach w celu zidentyfikowania powiązań genetycznych i tworzenie poligenicznych wyników ryzyka (PRS) z osadzeń w celu przewidywania określonych chorób lub cech, potencjalnie przy użyciu kilku etykiet chorób. Metodę walidowano na dwóch typach HDCD — spirogramach i PPG — i wykazano znaczące ulepszenia. REGLE wykrył nowe loci genetyczne związane z funkcjami płuc i układu krążenia, które nie zostały zidentyfikowane za pomocą tradycyjnych metod. Na przykład REGLE znalazł o 45% więcej istotnych loci dla danych PPG i poprawił przewidywanie ryzyka chorób takich jak POChP i astma w porównaniu z metodami opartymi na EDF lub analizie głównych składowych (PCA). Osadzenia dostarczyły również interpretowalnych wyników, podkreślając cechy takie jak niedrożność dróg oddechowych, które nie są dobrze reprezentowane przez standardowe EDF.

Podsumowując, metoda REGLE zapewnia solidne rozwiązanie do analizy genetycznej przy użyciu wielowymiarowych danych klinicznych, wykorzystując uczenie bez nadzoru w celu odkrycia ukrytych sygnałów genetycznych i poprawy przewidywania chorób. Eliminując potrzebę rozległych etykiet chorób i włączając funkcje eksperckie, REGLE skutecznie rozwiązuje ograniczenia tradycyjnych metod. Naukowcy wykazali, że ulepszenia w odkrywaniu nowych loci i przewidywaniu ryzyka podkreślają potencjał REGLE w zakresie rozwoju badań genomicznych i ulepszania medycyny spersonalizowanej poprzez bardziej kompleksową analizę HDCD.

Warto przeczytać!  Pełnia Truskawkowego Księżyca i Przesilenie Letnie

Sprawdź Papier. Cała chwała za te badania należy się badaczom tego projektu. Nie zapomnijcie też śledzić nas na Świergot.

Dołączć do naszego Kanał Telegramu I LinkedIn Grw górę.

Jeśli podoba Ci się nasza praca, pokochasz nas biuletyn Informacyjny..

Nie zapomnij dołączyć do naszego 46 tys.+ ML SubReddit

Pragati Jhunjhunwala jest konsultantką stażystką w MarktechPost. Obecnie zdobywa tytuł B.Tech w Indian Institute of Technology (IIT) w Kharagpur. Jest entuzjastką technologii i interesuje się zakresem zastosowań oprogramowania i nauki o danych. Zawsze czyta o rozwoju w różnych dziedzinach AI i ML.

🐝 Zapisz się na najszybciej rozwijający się newsletter poświęcony badaniom nad sztuczną inteligencją, czytany przez badaczy z Google, NVIDIA, Meta, Stanford, MIT, Microsoft i wielu innych…




Źródło