Informatycy sekwencjonują genom bawełny
Bawełna jest głównym źródłem naturalnego włókna na Ziemi, ale tylko cztery z 50 znanych gatunków nadają się do produkcji tekstyliów. Informatycy z DePaul University zastosowali bioinformatyczny przepływ pracy, aby zrekonstruować jeden z najbardziej kompletnych genomów czołowego gatunku bawełny, udomowionej afrykańskiej odmiany Gossypium herbaceum Wagad. Eksperci twierdzą, że wyniki dają naukowcom pełniejszy obraz udomowienia dzikiej bawełny na przestrzeni czasu i mogą pomóc we wzmocnieniu i ochronie upraw dla rolników w USA, Afryce i poza nią.
Wyniki badań są publikowane w czasopiśmie Geny G3|Genomy|Genetyka. Thiru Ramaraj, adiunkt informatyki w Jarvis College of Computing and Digital Media w DePaul, jest głównym autorem publikacji. Skoki postępu technologicznego w ostatniej dekadzie umożliwiły Ramarajowi analizę genomu w jego laboratorium w Chicago.
„Moc tej technologii polega na tym, że pozwala nam tworzyć wysokiej jakości genomy, które zapewniają poziom szczegółowości, który po prostu nie był wcześniej możliwy” – mówi Ramaraj, który specjalizuje się w bioinformatyce. „Otwiera to większej liczbie badaczy możliwość sekwencjonowania wielu upraw, które są ważne dla światowej gospodarki i wyżywienia populacji”.
Praca jest częścią współpracy, w skład której wchodzi Jonathan Wendel, wybitny profesor na Wydziale Ekologii, Ewolucji i Biologii Organizmów na Uniwersytecie Stanowym Iowa; oraz Joshua Udall, kierownik badań w Jednostce Badań nad Plazmą Zarodkową Upraw w Departamencie Rolnictwa Stanów Zjednoczonych. Według Udalla bawełna Wagad jest odmianą diploidalną uprawianą głównie w krajach afrykańskich. „Ma to potencjał, aby zapewnić mapę genetyczną, która mogłaby poprawić ich uprawy bawełny” – powiedział Udall.
Zaawansowane metody obliczeniowe przybliżają genom
Prace zespołu rozpoczęto od analizy danych dotyczących sekwencji DNA. Rozpoczęli rekonstrukcję genomu Wagada, gromadząc wysokiej jakości dane o długich sekwencjach DNA wygenerowane przy użyciu technologii sekwencjonowania Pacific Biosciences. Kolejnym krokiem było wykorzystanie map całego genomu z Bionano Genomics do uporządkowania i ukierunkowania początkowego złożenia. Na koniec wykorzystano dane sekwencji Hi-C z genomiki fazowej do skonstruowania genomu na poziomie chromosomu.
Następnie Ramaraj zwrócił się do Azalei Mendozy, absolwentki informatyki, która posiada również tytuł licencjata w dziedzinie badań środowiskowych w DePaul. „Azalea miała zaplecze biologiczne i wiedzę, aby zagłębić się w te badania” – powiedział Ramaraj.
Mendoza zaczął od zbadania historii bawełny, aby pomniejszyć i zrozumieć „szerszy obraz”. Bez względu na to, gdzie uprawia się bawełnę, jest ona wykorzystywana głównie do produkcji włókien. Wykorzystując genomikę porównawczą, szukała wariacji w stosunku do jej bliskiego krewnego i grupy obcej. Mendoza zagłębił się również w opisane geny i odnotował ich funkcje. „Gdy badaliśmy regiony genomu, znaleźliśmy wiele genów związanych z zawartością błonnika” – mówi Mendoza. „To było niesamowite zobaczyć zastosowanie tej pracy w prawdziwym życiu”.
Ochrona upraw w Stanach Zjednoczonych i poza nimi
Wpływ genomiki bawełny na rolnictwo i gospodarkę Stanów Zjednoczonych jest jasny dla Udalla, który współpracuje z Ramaraj od 2015 roku. Udall kieruje Jednostką Badań nad Plazmą Zarodkową Upraw i bada niektóre z 10 000 przystąpienia różnych gatunków, które USDA przechowuje w swoim repozytorium. Ich celem jest utrzymanie genetycznego bezpieczeństwa żywności i pasz w kraju, a częścią tego jest zrozumienie odporności i słabości upraw z całego świata.
„Kiedy do Stanów Zjednoczonych przybywają nowe choroby lub pojawiają się nowe inwazyjne szkodniki, jedną z pierwszych rzeczy, które robimy, jest badanie różnorodności genetycznej bawełny, aby sprawdzić, czy któraś z poprzednich odmian jest na nią odporna” – mówi Udall. Może to dać rolnikom szansę na krzyżowanie tych genów i ulepszenie nowoczesnych odmian bawełny, potencjalnie unikając katastrofalnych strat w rolnictwie.
Udall polega na biologach obliczeniowych, takich jak Ramaraj, aby kontynuować tę pracę. Chociaż koszt sekwencjonowania genomów spadł, badanie to nadal wymagało prawie dwóch lat pracy w różnych dyscyplinach. „To dobry krok w identyfikacji przyszłych genomów bawełny do sekwencjonowania” – mówi Udall.
Ramaraj ma nadzieję, że projekt zainspiruje innych wykładowców i studentów do zwrócenia się do CDM z pomysłami na projekty bioinformatyczne. Dla Mendozy, obecnie absolwentki pracującej jako analityk danych, doświadczenie w pracy w bioinformatyce w DePaul inspiruje jej cele zawodowe.
„Uwielbiam badania i pracę, która pomaga mi rozwijać się na wielu poziomach” — mówi Mendoza. „To jest rodzaj pracy, która wpłynie na ludzi i zrównoważony rozwój w przyszłości”.
Więcej informacji:
Thiruvarangan Ramaraj i wsp., The Gossypium herbaceum L. Wagad genom jako źródło informacji o udomowieniu bawełny, Geny G3|Genomy|Genetyka (2022). DOI: 10.1093/g3journal/jkac308
Informacje o czasopiśmie:
Geny G3|Genomy|Genetyka