Biznes

Leć wysoko, bo niebo wybacza

  • 30 marca, 2024
  • 4 min read
Leć wysoko, bo niebo wybacza


Debata na temat technologii głębokich i technologii konsumenckich jest dziś wśród Hindusów dość gorąca. To dobra debata na temat dzisiejszego miejsca Indii w przestrzeni generatywnej sztucznej inteligencji. Czy przegapiliśmy autobus w opracowywaniu własnego, podstawowego LLM? Czy jesteśmy dobrzy w korzystaniu wyłącznie z LLM stworzonych przez innych? Czy Indie są postrzegane jedynie jako konsument AI, a nie jako producent AI? Czy mamy jeszcze szansę na wygranie wyścigu? Nie mam pełnej odpowiedzi na wszystkie te pytania, prawdopodobnie na którekolwiek z nich. Jednocześnie nie skreślę Indii z mapy Generatywnej AI.

Podstawowe LLM wymagają budowania modeli od podstaw, zbierając dane szkoleniowe z różnych źródeł internetowych. Nie używają żadnych wstępnie wytrenowanych modeli jako punktu wyjścia. Godny uwagi jest wzrost liczby indyjskich LLM. Jeśli się nie mylę, BharatGPT obsługuje 14 języków indyjskich w przypadku głosu i 22 w przypadku tekstu. Obsługuje szeroką gamę zadań związanych z przetwarzaniem języka naturalnego (NL). Możemy mieć suwerenność danych. Dane pozostają w granicach Indii. Jest dostosowany dla użytkowników indyjskich, zachowując kontekst kulturowy i niuanse językowe. Podobna historia i możliwości dotyczą Krutrima. Celem ekosystemu Bhashini jest gromadzenie wielojęzycznych danych i tworzenie produktów generatywnej sztucznej inteligencji w językach indyjskich, przy jednoczesnym usuwaniu barier językowych w całym kraju. OpenHathi z Sarvam AI wnosi wkład w indyjski ekosystem sztucznej inteligencji i zachęca do innowacji w LLM.

Warto przeczytać!  Milionowe zarobki ludzi PiS w spółkach skarbu państwa. Oto co mówią oświadczenia

Potrzebujemy głębokich kieszeni, aby inwestować w badania nad sztuczną inteligencją. Sprowadza się to do szybkiej, krótkoterminowej monetyzacji w porównaniu z długoterminowym nastawieniem na zwrot z inwestycji (ROI). Różnica polega na tym, czy pracownicy pracują nad teorią sztucznej inteligencji, czy nad jej zastosowaniami. Ilu Hindusów pracuje nad zbudowaniem kolejnego rewolucyjnego algorytmu AI, który zmieni zasady gry? Musi istnieć równowaga pomiędzy badaniami podstawowymi a zyskownymi zastosowaniami LLM. Równowaga zapewni zrównoważony charakter wysiłków związanych z generatywną sztuczną inteligencją, nie podważając jednocześnie potrzeby długoterminowego finansowania badań.

Nie każdy przypadek użycia wymagałby pełnych, podstawowych możliwości istniejących LLM. Na wzór budowania LLM od podstaw proponuję wyszkolenie „modelu życia”, który będzie przewidywał, jakie wydarzenie wydarzy się w moim życiu, biorąc pod uwagę sekwencję wydarzeń, które miały miejsce w moim życiu do chwili obecnej. Do danych oznaczonych etykietami wybierzmy wszystkie sekwencje wydarzeń, które miały miejsce w życiu ludzi, ze źródeł takich jak cyfrowe książki biograficzne, artykuły internetowe na temat poszczególnych osób, w tym sławnych i niesławnych, oraz strony Wikipedii mówiące o ludziach. W tym celu filtrowanie i tworzenie danych szkoleniowych modelu życia sekwencji zdarzeń ze zbioru danych szkoleniowych wykorzystywanych w podstawowych LLM nie jest złe. Będziemy musieli zdefiniować „słownictwo”, które powinno być zbiorem wszystkich możliwych wydarzeń życiowych, jakie kiedykolwiek miały miejsce. Oznaczałoby to, że zgodnie z naszym modelem musimy zdecydować o szczegółowości wydarzeń życiowych. Poziom szczegółowości powinien być określony na podstawie tego, jaki poziom wydarzeń życiowych mamy pod ręką i jaki poziom chcemy przewidzieć czyjeś następne wydarzenie życiowe. Jedną z różnic, jakie widzę pomiędzy słowami (tokenami) a wydarzeniami życiowymi (także tokenami), jest to, że „słownictwo” dotyczące wydarzeń życiowych może być stosunkowo mniejsze w porównaniu ze słownictwem języka angielskiego. Czy to oznacza, że ​​możemy ręcznie tworzyć próbki szkoleniowe, badając życie? Czy mogę zatem wyraźnie użyć modelu życia, aby określić, jak będzie wyglądał mój dzień jutro?

Warto przeczytać!  Udany debiut spółki na giełdzie. Na GPW dawno nie było takiego IPO

Czy możemy zatem zrozumieć wzór udanego życia? Oczywiście musimy określić, co oznacza sukces dla różnych osób (finansowy, społeczny, osobisty, zawodowy i wszechstronny). Czy ktoś może zatem wiedzieć, jakie przyszłe kroki doprowadzą do osiągnięcia przez niego wymarzonej pozycji w zawodzie lub społeczeństwie? Próbuję powiedzieć, że jest to przykład przypadku użycia, w którym zaczynamy budować nasz LLM od zera. Językowa moc generacyjna wstępnie przeszkolonego podstawowego LLM nie będzie tutaj wymagana.

Zasłony jeszcze nie opadły i prawdopodobnie nigdy nie będą. Gra będzie trwała tak długo, jak uda nam się wymyślić kolejną wielką rzecz. Indie, posiadające jedną szóstą tkanki mózgowej na świecie, nie mogą zostać zignorowane na mapie generatywnej sztucznej inteligencji.



Linkedin


Zastrzeżenie

Poglądy wyrażone powyżej są poglądami autora.



KONIEC ARTYKUŁU



Warto przeczytać!  Cena akcji Paytm osiąga 5% górny poziom po skinieniu głową przez NPCI w sprawie licencji dostawcy aplikacji strony trzeciej


Źródło