Nauka i technika

Poprawiono wyszukiwanie przyczyn chorób dziedzicznych

  • 2 czerwca, 2023
  • 8 min read
Poprawiono wyszukiwanie przyczyn chorób dziedzicznych


Newswise — Do tej pory wyjaśnienie pochodzenia mniej więcej połowy wszystkich rzadkich zaburzeń genetycznych okazało się nieosiągalne. Monachijska grupa naukowa opracowała algorytm, który przewiduje konsekwencje mutacji genetycznych dla syntezy RNA z sześciokrotnie większą precyzją w porównaniu z wcześniejszymi modelami. Dzięki temu możliwa staje się precyzyjna identyfikacja czynników genetycznych odpowiedzialnych za rzadkie choroby dziedziczne i nowotwory.

Stosunkowo często pojawiają się różne formy sekwencji genetycznych – zazwyczaj dotyczy to jednego na tysiąc nukleotydów w genomie danej osoby. Czasami te zmiany mogą skutkować wadliwymi RNA, aw konsekwencji nieefektywnymi białkami. W konsekwencji może to prowadzić do nieprawidłowego działania w obrębie poszczególnych narządów ciała. W przypadkach, gdy podejrzewa się rzadką dolegliwość, wspomagane komputerowo programy diagnostyczne mogą pomóc w identyfikacji potencjalnego pochodzenia genetycznego. Mówiąc dokładniej, algorytmy można wykorzystać do zbadania genomu i ustalenia, czy istnieje korelacja między rzadkimi odmianami genetycznymi a dysfunkcjami w poszczególnych regionach ciała.

Interdyscyplinarny projekt badawczy

Pod kierunkiem Juliena Gagneura, cenionego profesora obliczeniowej medycyny molekularnej na Uniwersytecie Technicznym w Monachium (TUM) i szefa grupy badawczej obliczeniowej medycyny molekularnej w Helmholtz Monachium, interdyscyplinarny zespół składający się z członków wydziałów informatyki i medycyny z powodzeniem stworzył zaawansowany model. Ten nowy model przewyższa swoich poprzedników w dokładnym prognozowaniu zmian DNA, które skutkują produkcją wadliwego RNA.

„Około pięćdziesiąt procent naszych pacjentów może otrzymać wiarygodną diagnozę dzięki ustalonym technikom analizy DNA” – stwierdza dr Holger Prokisch, jeden ze współautorów badania i lider grupy Instytutu Genetyki Człowieka w TUM i Helmholtz w Monachium. „Jednakże w pozostałych przypadkach potrzebujemy modeli, które zwiększą nasze możliwości predykcyjne. Nasz niedawno opracowany algorytm może wnieść znaczący wkład w tym zakresie”.

Model koncentruje się na splicingu

Podczas swoich badań naukowcy zbadali wariacje genetyczne, które wpływają na konwersję DNA do RNA, a następnie na tworzenie białek specyficznych dla tkanki. Skupili się na splicingu, który odnosi się do komórkowego procesu cięcia RNA w sposób umożliwiający rozszyfrowanie instrukcji budowy białka na późniejszym etapie. Kiedy w DNA występuje zmienność genetyczna, proces ten może zostać zakłócony, co prowadzi do wycięcia nadmiernej lub niewystarczającej ilości RNA. Uważa się, że błędy w procesie splicingu należą do najczęstszych czynników przyczyniających się do błędnego tworzenia białek i rozwoju chorób dziedzicznych.

Warto przeczytać!  Operacyjny kod RNA i zwijanie białek

Znacznie większa precyzja niż w poprzednich badaniach

Aby zbadać potencjalne powiązania między wariacjami genetycznymi a dysfunkcjami splicingu w określonych tkankach, zespół wykorzystał istniejące wcześniej zbiory danych. Te zbiory danych obejmowały próbki DNA i RNA zebrane od 946 osób, obejmujące 49 różnych typów tkanek. Wykorzystując ten obszerny zbiór danych, naukowcy byli w stanie dokonać świadomej oceny dotyczącej powiązań między odmianami genetycznymi a nieprawidłowościami splicingu w określonych tkankach.

W przeciwieństwie do poprzednich badań, zespół przyjął inne podejście, najpierw badając każdą próbkę, aby określić, czy iw jakim stopniu nieprawidłowy splicing spowodowany zmianami DNA często skutkuje dysfunkcjami splicingu w określonych tkankach. Uznali, że niektóre białka mogą mieć określone znaczenie dla określonych obszarów serca, na przykład nie pełniąc żadnej funkcji w mózgu. Rozważając konteksty tkankowo-specyficzne, naukowcy starali się uzyskać wgląd w przejawy dysfunkcji splicingu spowodowanych zmianami DNA w różnych tkankach, uznając różne role, jakie białka mogą odgrywać w różnych częściach ciała.

„Aby osiągnąć ten cel, stworzyliśmy mapę splicingu, która była specyficzna dla każdej tkanki, określając ilościowo kluczowe regiony RNA zaangażowane w splicing w tej konkretnej tkance” – wyjaśnia Nils Wagner, główny autor badania i doktorant w Katedrze Obliczeniowej Medycyny Molekularnej TUM. „Przyjmując to podejście, byliśmy w stanie skoncentrować nasz model na biologicznie istotnych kontekstach. Nasze wykorzystanie próbek skóry i krwi pozwoliło nam wyciągnąć wnioski dotyczące trudno dostępnych tkanek, takich jak mózg czy serce”.

Podczas analizy naukowcy wzięli pod uwagę każdy gen, który posiadał co najmniej jeden rzadki wariant genetyczny i miał znaczenie w tworzeniu białek. Warto jednak zauważyć, że oprócz regionów kodujących białka na RNA istnieją inne sekcje, które odgrywają kluczową rolę w różnych procesach komórkowych. Te regiony niekodujące białka nie były objęte zakresem badania. W rezultacie badanie objęło łącznie zbadanie około 9 milionów rzadkich wariantów genetycznych.

Warto przeczytać!  Wykorzystanie środowiskowego DNA do badania popu

„Dzięki wykorzystaniu naszego nowo opracowanego modelu znacznie zwiększyliśmy dokładność przewidywania błędnego splicingu, sześciokrotnie przewyższając poprzednie modele” — stwierdza prof. Julien Gagneur. „Podczas gdy poprzednie algorytmy osiągały precyzję 10 procent przy 20 procentach przypomnienia, nasz model osiąga imponującą precyzję 60 procent przy tym samym poziomie przypomnienia”.

Rzeczywiście, precyzja i przypominanie to kluczowe wskaźniki oceny skuteczności modeli. Precyzja mierzy odsetek przewidywanych wariacji genetycznych, które faktycznie skutkują nieprawidłowym splicingiem. Wskazuje to na zdolność modelu do dokładnego identyfikowania prawdziwie pozytywnych przypadków. Z drugiej strony, przypominanie określa ilościowo odsetek zmienności genetycznych prowadzących do nieprawidłowego splicingu, które są pomyślnie identyfikowane przez model. Odzwierciedla zdolność modelu do wychwytywania prawdziwie dodatnich przypadków bez ich pominięcia, zwanych również fałszywie ujemnymi. Metryki te dostarczają cennych informacji na temat wydajności i niezawodności modelu w przewidywaniu i wychwytywaniu zmian genetycznych związanych z nieprawidłowym splicingiem.

Rzeczywiście, precyzja i przypominanie to kluczowe wskaźniki oceny skuteczności modeli. Precyzja mierzy odsetek przewidywanych wariacji genetycznych, które faktycznie skutkują nieprawidłowym splicingiem. Wskazuje to na zdolność modelu do dokładnego identyfikowania prawdziwie pozytywnych przypadków. Z drugiej strony, przypominanie określa ilościowo odsetek zmienności genetycznych prowadzących do nieprawidłowego splicingu, które są pomyślnie identyfikowane przez model. Odzwierciedla zdolność modelu do wychwytywania prawdziwie dodatnich przypadków bez ich pominięcia, zwanych również fałszywie ujemnymi. Metryki te dostarczają cennych informacji na temat wydajności i niezawodności modelu w przewidywaniu i wychwytywaniu zmian genetycznych związanych z nieprawidłowym splicingiem.

Praktyczne zastosowanie algorytmu

Model opracowany przez zespół jest wykorzystywany jako integralna część europejskiego projektu badawczego o nazwie „Solve-RD – solved the unsolved rzadkich chorób”. Inicjatywa ta ma na celu poprawę wyników diagnostycznych rzadkich chorób poprzez ułatwienie szeroko zakrojonej wymiany wiedzy. Naukowcy z TUM przeprowadzili już analizy 20 000 sekwencji DNA uzyskanych od 6 000 rodzin dotkniętych tymi schorzeniami. Wykorzystując możliwości modelu, przyczyniają się do realizacji nadrzędnego celu projektu Solve-RD, jakim jest zapewnienie lepszej diagnostyki osobom cierpiącym na rzadkie choroby.

Warto przeczytać!  Rynek testów genetycznych skierowanych bezpośrednio do konsumenta (DTC) wzrośnie o 19,5% rocznie do 2030 r.

Ponadto oczekuje się, że model ułatwi w przyszłości sprawne wykrywanie genetycznych diagnoz różnych rodzajów białaczki. Aby osiągnąć ten cel, naukowcy badają obecnie 4200 próbek DNA i RNA pobranych od osób, u których zdiagnozowano białaczkę. Wykorzystując możliwości modelu, starają się uprościć proces identyfikacji precyzyjnych uwarunkowań genetycznych leżących u podstaw różnych wariantów białaczki. To trwające przedsięwzięcie badawcze obiecuje pogłębienie naszej wiedzy na temat genetyki białaczki oraz zwiększenie skuteczności i dokładności diagnoz w tej dziedzinie.

Dalsza informacja

Prof. Julien Gagneur dołączył do TUM w 2016 roku jako adiunkt, a następnie objął stanowisko Katedry Obliczeniowej Medycyny Molekularnej w 2020 roku. Jego badania koncentrują się przede wszystkim na badaniu genetycznych podstaw regulacji genów i ich implikacji dla chorób, z wykorzystaniem algorytmów statystycznych i uczenia maszynowego techniki. Oprócz swojej roli w TUM, prof. Gagneur pełni funkcję lidera grupy badawczej w Helmholtz Monachium. Jego wiedza specjalistyczna polega na wykorzystaniu metod obliczeniowych w celu uzyskania wglądu w skomplikowany związek między mechanizmami genetycznymi a różnymi stanami patologicznymi.

We współpracy z Holgerem Prokischem, liderem grupy w Instytucie Genetyki Człowieka na TUM i Helmholtzem w Monachium, prof. Julien Gagneur jest aktywnie zaangażowany w opracowywanie strategii odkrywania przyczyn zaburzeń genetycznych. Ich wspólne wysiłki skupiają się wokół opracowania innowacyjnych podejść i technik, aby rzucić światło na mechanizmy genetyczne, które przyczyniają się do powstawania różnych zaburzeń genetycznych. Wykorzystując swoją wiedzę specjalistyczną w zakresie obliczeniowej medycyny molekularnej i genetyki człowieka, mają na celu pogłębienie naszej wiedzy na temat zaburzeń genetycznych i utorowanie drogi do lepszej identyfikacji i charakterystyki ich pierwotnych przyczyn.




Źródło