Nauka i technika

Naukowcy opracowują pierwszy w historii zestaw narzędzi dla RN

  • 16 stycznia, 2023
  • 5 min read
Naukowcy opracowują pierwszy w historii zestaw narzędzi dla RN


Schemat potoku analizy transkryptomu uwzględniającego haplotypy

obraz: Schemat potoku analizy transkryptomu uwzględniającego haplotypy
pogląd jeszcze

Źródło: Kredyt dla autorów badań

Analiza ekspresji genów danej osoby wymaga zmapowania jej krajobrazu RNA do standardowego odniesienia, aby uzyskać wgląd w stopień, w jakim geny są „włączone” i pełnią funkcje w organizmie. Ale badacze mogą napotkać problemy, gdy odniesienie nie zawiera wystarczających informacji, aby umożliwić dokładne mapowanie, problem znany jako stronniczość odniesienia.

W nowym artykule opublikowanym w czasopiśmie Metody natury, naukowcy z UC Santa Cruz wprowadzają pierwszą w historii metodę analizy danych sekwencjonowania RNA w całym genomie przy użyciu „pantranscriptomu”, który łączy transkryptom i pangenom – odniesienie, które zawiera materiał genetyczny z kohorty różnych osobników, a nie tylko pojedyncza liniowa nić. Grupa naukowców kierowana przez profesora nadzwyczajnego inżynierii biomolekularnej UCSC, Benedicta Patena, wydała zestaw narzędzi, który pozwala badaczom mapować dane RNA danej osoby do znacznie bogatszego odniesienia, usuwając błąd odniesienia i prowadząc do znacznie dokładniejszego mapowania.

„To jest pangenom plus transkryptom – taka kombinacja nigdy wcześniej nie została wykonana” – powiedział Jordan Eizenga, współautor artykułu i doktor habilitowany w UCSC Computational Genomics Lab. „Po raz pierwszy ktokolwiek próbował włączyć pangenom jako standardową cechę mapowania sekwencjonowania RNA”.

To narzędzie pomoże naukowcom z całego świata, którzy pracują nad zrozumieniem ekspresji genów poprzez analizę sekwencjonowania RNA. Narzędzia są publicznie dostępne i można uzyskać dostęp za pośrednictwem Github.

Warto przeczytać!  Więcej stad żubrów zostanie przywróconych na ziemie rdzennych Amerykanów

„Dzięki temu zestawowi narzędzi wykorzystujemy bardziej zróżnicowane dane, które możemy teraz uzyskać z pangenomu, aby poprawić pomiar danych dotyczących ekspresji genów, co może znacznie różnić się u poszczególnych osób” – powiedział Paten. „Celem jest wywarcie wpływu tych bardziej zróżnicowanych danych na badania dotyczące ekspresji genów, co zaowocuje lepszą analizą modeli komórkowych, modeli organoidów i innych zastosowań badawczych”.

Najbardziej powszechnie rozpoznawaną funkcją RNA jest translacja DNA na białka, ale obecnie naukowcy rozumieją, że zdecydowana większość RNA jest niekodująca i nie tworzy białek, ale zamiast tego może odgrywać takie role, jak wpływanie na strukturę komórki lub regulowanie genów. Cały krajobraz RNA jest określany zbiorczo jako transkryptom, a jego mapowanie pozwala naukowcom lepiej zrozumieć ekspresję genów danej osoby.

Pantranskryptom opiera się na powstającej koncepcji „pangenomiki” w dziedzinie genomiki. Zazwyczaj, oceniając dane genomowe danej osoby pod kątem zmienności, naukowcy porównują genom danej osoby z genomem odniesienia składającym się z pojedynczej liniowej nici zasad DNA. Korzystanie z pangenomu pozwala naukowcom porównać genom jednostki z genetycznie zróżnicowaną kohortą sekwencji referencyjnych jednocześnie, pochodzących od osób reprezentujących różnorodność pochodzenia biogeograficznego. Daje to naukowcom więcej punktów porównawczych, dla których mogą lepiej zrozumieć zmienność genomową danej osoby.

Warto przeczytać!  Miażdżyca ma cechy nowotworowe i można ją zwalczać lekami przeciwnowotworowymi

Mapowanie danych z sekwencjonowania RNA w celu zrozumienia ekspresji genów może być trudne, ponieważ sekwencje RNA są składane przez mechanizmy komórkowe, co oznacza, że ​​jeden zestaw danych RNA może pochodzić z niepołączonych obszarów genomu, co utrudnia prawidłowe dopasowanie ich do odniesienia. Te miejsca splicingu nie są jednolite w całej populacji ludzkiej, ale różnią się między osobnikami. Trudno też stwierdzić, z jakiego haplotypu pochodzi RNA – czy grupa genów pochodzi specyficznie z zestawu chromosomów odziedziczonych po matce osobnika, czy też z zestawu odziedziczonego po ojcu.

Ale dzięki nowemu potokowi narzędzi open source naukowcy mogą pobrać splicing segmentów RNA danej osoby, zmapować ich położenie na pangenomie, zidentyfikować haplotyp, do którego należą dane, i przeanalizować ekspresję genów.

Po pierwsze, potok identyfikuje, z których obszarów genomu pochodzą dane sekwencjonowania RNA, w tym miejsca składania, i zaznacza te punkty w odniesieniu do pangenomu. Te zaznaczone punkty są następnie porównywane z pantranskryptomem składającym się z transkryptów specyficznych dla haplotypu, wygenerowanych z danych referencyjnych zawartych w pangenomie. Ten krok wymaga specjalistycznych, wymagających metod algorytmicznych.

Na koniec generuje oszacowania poziomów ekspresji genów na podstawie tego porównania między zmapowanymi danymi a transkryptami w pantranskryptomie i identyfikuje haplotypy, z których pochodzą geny.

Warto przeczytać!  Dlaczego znajomość swoich zaburzeń genetycznych jest niezbędna do zdrowego życia

„To z pewnością bardzo przyszłościowe badanie, ponieważ inne metody ekspresji całego genomu nie wykorzystują jeszcze pangenomów i informacji o haplotypie” – powiedział Jonas Sibbesen, współpierwszy autor badania i były doktor habilitowany w UCSC Computational Genomics Lab który jest obecnie adiunktem na Uniwersytecie w Kopenhadze. „Myślimy teraz z wyprzedzeniem, co pangenomika może dodatkowo wnieść do stołu w analizach transkryptomicznych”.

Idąc dalej, naukowcy są zainteresowani dalszym rozwojem tych narzędzi, aby były one przydatne w dalszej analizie informatycznej i dostosowywaniu narzędzi do specyfiki badań nad danymi jednokomórkowymi. Na razie grupa ma nadzieję, że ich nowy zestaw narzędzi posłuży do pokazania, jak przydatne może być wykorzystanie analizy opartej na pangenomice.

„Musimy być w stanie wyjaśnić niektórym badaczom, w jaki sposób odniesienie do pangenomu przyniesie im korzyści” – powiedział Paten. „Ten rurociąg jest naprawdę pierwszym podejściem do zrobienia tego dla RNA, danych funkcjonalnych, danych ekspresyjnych”.


Zastrzeżenie: AAAS i EurekAlert! nie ponosi odpowiedzialności za dokładność komunikatów prasowych publikowanych na EurekAlert! przez instytucje wnoszące wkład lub do wykorzystania jakichkolwiek informacji za pośrednictwem systemu EurekAlert.


Źródło