Nauka i technika

Poza krótkimi odczytami: Wykorzystanie sekwencjonowania długich odczytów w celu uzyskania wglądu genomicznego w skali populacji

  • 24 maja, 2023
  • 4 min read
Poza krótkimi odczytami: Wykorzystanie sekwencjonowania długich odczytów w celu uzyskania wglądu genomicznego w skali populacji


obraz nagłówka bloga dotyczącego genomiki populacji i precyzyjnego zdrowia

Programy sekwencjonowania populacji na dużą skalę mają wiele ważnych celów badawczych i wyników. Obejmują one:

Generowanie kompleksowego katalogu zmienności genetycznej

w celu odzwierciedlenia różnorodności genetycznej w populacji docelowej.

Maksymalizacja mocy wykrywania poprzez dokładne wywoływanie wariantów we wszystkich klasach wariantów iw całym ludzkim genomie

w tym trudne regiony genomowe (wysoce powtarzalne lub homologiczne regiony), jednocześnie wykorzystując dodatkowy kontekst genetyczny, taki jak fazowanie i status metylacji.

Tworzenie szerokiej i długoterminowej użyteczności generowanych danych

służyć jako źródło informacji dla genetyki populacji, badań translacyjnych oraz badań i rozwoju w dziedzinie farmacji.

Zwracanie wartości populacji

poprzez zwracanie bezpośrednich wyników uczestnikom badania, aby umożliwić precyzyjne programy zdrowotne i profilaktyczne.


W ostatnich latach genetyka populacji i precyzyjne badania zdrowotne opierały się na dużych zbiorach danych genomowych, często łącząc dane z mikromacierzy, egzomu i genomu w celu uzyskania potrzebnych wyników. Luki i wyzwania w generowanych danych pozostają trwałe, głównie ze względu na ograniczenia technologiczne głównych technologii sekwencjonowania nowej generacji, które wymagają dodatkowych metod w celu uzupełnienia danych i wypełnienia luk.

Obecne krótkie metody sekwencjonowania nowej generacji (NGS) nie wykrywają wariantów w ciemnych regionach i rutynowo borykają się z dużymi lub złożonymi wariantami, co może w różny sposób wpływać na uzyskiwanie wglądu genetycznego z populacji przodków i może skutkować częściowym lub niepełnym zrozumieniem przyczyn genetycznych i mechanizmy choroby.

Warto przeczytać!  Naukowcy z UTSW pomogli zmapować ludzki genom 20 lat temu. To na zawsze zmieniło medycynę

Oto kilka przykładów genów związanych z chorobą, które ilustrują ten problem:

  • SMN1: Cisi nosiciele SMA (rdzeniowy zanik mięśni) pochodzenia afrykańskiego pozostają słabo wykrywani za pomocą obecnych krótkich odczytów NGS i powiązanych rozmówców
  • LPA: Wysoki poziom LP(a) (lipoproteiny (a)) zwiększa ryzyko zawału serca, udaru mózgu i zwężenia zastawki aortalnej, długie zmienne powtórzenia w genie LPA pozostają trudne dla metod krótkiego odczytu, najwyższe poziomy Lp(a) są występuje u Afrykanów i mieszkańców Azji Południowej
  • HBA, HBB, HBM: Geny zaangażowane w talasemię i niedokrwistość sierpowatokrwinkową, w przypadku których sekwencje homologiczne, warianty liczby kopii (CNV) i fuzje genów wpływają na analizę, hemoglobinopatie występują najczęściej u mieszkańców basenu Morza Śródziemnego, Bliskiego Wschodu, Azji Południowo-Wschodniej, Afryki i Afroamerykanów

Długo czytana różnica w sekwencjonowaniu


Sekwencjonowanie HiFi rewolucjonizuje tę dziedzinę, znacząco zmieniając grę w programach genomiki populacji. W porównaniu z tradycyjnymi metodami krótkiego odczytu, genom HiFi może wykryć 2,5 razy więcej wariantów strukturalnych. Chociaż warianty pojedynczych nukleotydów (SNV) i indele stanowią większość wariantów pod względem liczby, to warianty strukturalne (SV) mają większy wpływ na liczbę dotkniętych par zasad w całym genomie. W rzeczywistości SV zmieniają więcej zasad niż SNV i indele razem wzięte. Co więcej, sekwencjonowanie HiFi okazuje się nieocenione w analizie wcześniej niedostępnych „ciemnych regionów” genomu, które pozostają poza zasięgiem sekwencjonowania całego genomu z krótkim odczytem (WGS). Regiony te zawierają liczne medycznie istotne geny, takie jak SMN1, HBM i LPA. Ponadto genomy HiFi oferują sygnał metylacji obejmujący cały genom wraz z wywoływaniem zasad i możliwością fazowania wariantów w różne haplotypy, umożliwiając generowanie wglądu bardziej istotnego dla choroby.

Warto przeczytać!  Co trzeba zrobić, aby przywrócić dodo

Aby zapewnić szeroką i długoterminową użyteczność danych sekwencjonowania populacji, kluczowe jest, aby programy uzyskiwały kompleksowe i obejmujące cały genom wgląd we wszystkich przodków, pracując w ramach swoich budżetów. Dane PacBio HiFi zostały uznane za niezbędne w tym dążeniu, jak zauważyli autorzy niedawnego artykułu zaangażowanego w jeden z największych i najbardziej zaawansowanych projektów sekwencjonowania populacji na świecie: „Powinniśmy kontynuować opracowywanie kohort na skalę populacji zsekwencjonowanych tylko z długimi odczytami. Powstaje pytanie, czy wkroczyliśmy w erę używania wyłącznie długich odczytów”.

Chcesz dowiedzieć się, w jaki sposób sekwencjonowanie HiFi może zmienić Twój następny projekt sekwencjonowania populacji lub kohorty? Odwiedź naszą stronę Genetyka populacji + badanie przesiewowe nosicieli lub skontaktuj się z nami, aby poznać dostępne opcje.

Warto przeczytać!  Twoja grupa krwi wpływa na ryzyko wczesnego udaru, stwierdzili naukowcy: ScienceAlert


Źródło