Poza krótkimi odczytami: Wykorzystanie sekwencjonowania długich odczytów w celu uzyskania wglądu genomicznego w skali populacji
Programy sekwencjonowania populacji na dużą skalę mają wiele ważnych celów badawczych i wyników. Obejmują one:
Generowanie kompleksowego katalogu zmienności genetycznej
w celu odzwierciedlenia różnorodności genetycznej w populacji docelowej.
Maksymalizacja mocy wykrywania poprzez dokładne wywoływanie wariantów we wszystkich klasach wariantów iw całym ludzkim genomie
w tym trudne regiony genomowe (wysoce powtarzalne lub homologiczne regiony), jednocześnie wykorzystując dodatkowy kontekst genetyczny, taki jak fazowanie i status metylacji.
Tworzenie szerokiej i długoterminowej użyteczności generowanych danych
służyć jako źródło informacji dla genetyki populacji, badań translacyjnych oraz badań i rozwoju w dziedzinie farmacji.
Zwracanie wartości populacji
poprzez zwracanie bezpośrednich wyników uczestnikom badania, aby umożliwić precyzyjne programy zdrowotne i profilaktyczne.
W ostatnich latach genetyka populacji i precyzyjne badania zdrowotne opierały się na dużych zbiorach danych genomowych, często łącząc dane z mikromacierzy, egzomu i genomu w celu uzyskania potrzebnych wyników. Luki i wyzwania w generowanych danych pozostają trwałe, głównie ze względu na ograniczenia technologiczne głównych technologii sekwencjonowania nowej generacji, które wymagają dodatkowych metod w celu uzupełnienia danych i wypełnienia luk.
Obecne krótkie metody sekwencjonowania nowej generacji (NGS) nie wykrywają wariantów w ciemnych regionach i rutynowo borykają się z dużymi lub złożonymi wariantami, co może w różny sposób wpływać na uzyskiwanie wglądu genetycznego z populacji przodków i może skutkować częściowym lub niepełnym zrozumieniem przyczyn genetycznych i mechanizmy choroby.
Oto kilka przykładów genów związanych z chorobą, które ilustrują ten problem:
- SMN1: Cisi nosiciele SMA (rdzeniowy zanik mięśni) pochodzenia afrykańskiego pozostają słabo wykrywani za pomocą obecnych krótkich odczytów NGS i powiązanych rozmówców
- LPA: Wysoki poziom LP(a) (lipoproteiny (a)) zwiększa ryzyko zawału serca, udaru mózgu i zwężenia zastawki aortalnej, długie zmienne powtórzenia w genie LPA pozostają trudne dla metod krótkiego odczytu, najwyższe poziomy Lp(a) są występuje u Afrykanów i mieszkańców Azji Południowej
- HBA, HBB, HBM: Geny zaangażowane w talasemię i niedokrwistość sierpowatokrwinkową, w przypadku których sekwencje homologiczne, warianty liczby kopii (CNV) i fuzje genów wpływają na analizę, hemoglobinopatie występują najczęściej u mieszkańców basenu Morza Śródziemnego, Bliskiego Wschodu, Azji Południowo-Wschodniej, Afryki i Afroamerykanów
Długo czytana różnica w sekwencjonowaniu
Sekwencjonowanie HiFi rewolucjonizuje tę dziedzinę, znacząco zmieniając grę w programach genomiki populacji. W porównaniu z tradycyjnymi metodami krótkiego odczytu, genom HiFi może wykryć 2,5 razy więcej wariantów strukturalnych. Chociaż warianty pojedynczych nukleotydów (SNV) i indele stanowią większość wariantów pod względem liczby, to warianty strukturalne (SV) mają większy wpływ na liczbę dotkniętych par zasad w całym genomie. W rzeczywistości SV zmieniają więcej zasad niż SNV i indele razem wzięte. Co więcej, sekwencjonowanie HiFi okazuje się nieocenione w analizie wcześniej niedostępnych „ciemnych regionów” genomu, które pozostają poza zasięgiem sekwencjonowania całego genomu z krótkim odczytem (WGS). Regiony te zawierają liczne medycznie istotne geny, takie jak SMN1, HBM i LPA. Ponadto genomy HiFi oferują sygnał metylacji obejmujący cały genom wraz z wywoływaniem zasad i możliwością fazowania wariantów w różne haplotypy, umożliwiając generowanie wglądu bardziej istotnego dla choroby.
Aby zapewnić szeroką i długoterminową użyteczność danych sekwencjonowania populacji, kluczowe jest, aby programy uzyskiwały kompleksowe i obejmujące cały genom wgląd we wszystkich przodków, pracując w ramach swoich budżetów. Dane PacBio HiFi zostały uznane za niezbędne w tym dążeniu, jak zauważyli autorzy niedawnego artykułu zaangażowanego w jeden z największych i najbardziej zaawansowanych projektów sekwencjonowania populacji na świecie: „Powinniśmy kontynuować opracowywanie kohort na skalę populacji zsekwencjonowanych tylko z długimi odczytami. Powstaje pytanie, czy wkroczyliśmy w erę używania wyłącznie długich odczytów”.
Chcesz dowiedzieć się, w jaki sposób sekwencjonowanie HiFi może zmienić Twój następny projekt sekwencjonowania populacji lub kohorty? Odwiedź naszą stronę Genetyka populacji + badanie przesiewowe nosicieli lub skontaktuj się z nami, aby poznać dostępne opcje.