Biznes

Meta potwierdza, że ​​LLM o otwartym kodzie źródłowym Llama 3 pojawi się w przyszłym miesiącu

  • 9 kwietnia, 2024
  • 4 min read
Meta potwierdza, że ​​LLM o otwartym kodzie źródłowym Llama 3 pojawi się w przyszłym miesiącu


Kredyty obrazkowe: Ingrid Lunden / na licencji CC BY 2.0.

We wtorek na wydarzeniu w Londynie Meta potwierdziła, że ​​planuje pierwszą wersję Llama 3 – kolejnej generacji jej wielkojęzykowego modelu wykorzystywanego do obsługi generatywnych asystentów AI – w ciągu najbliższego miesiąca.

Potwierdza to raport opublikowany w poniedziałek przez The Information, że Meta była bliska premiery.

„Mamy nadzieję rozpocząć wdrażanie naszego nowego zestawu podstawowych modeli nowej generacji, Llama 3, w ciągu najbliższego miesiąca, a właściwie mniej, i miejmy nadzieję, że w bardzo krótkim czasie” – powiedział Nick Clegg, prezes ds. spraw globalnych firmy Meta. Opisał coś, co brzmi jak wydanie kilku różnych iteracji lub wersji produktu. „Będzie wiele różnych modeli o różnych możliwościach i różnej wszechstronności [released] w ciągu tego roku, a zacznie się już bardzo niedługo.”

Plan, dodał dyrektor ds. produktu Meta, Chris Cox, będzie polegał na zasilaniu wielu produktów na platformie Meta za pomocą Llama 3.

Meta starała się dogonić OpenAI, co zaskoczyło ją i inne duże firmy technologiczne, takie jak Google, uruchamiając ChatGPT ponad rok temu, a aplikacja stała się wirusowa, zamieniając pytania i odpowiedzi generatywnej sztucznej inteligencji w codzienne, mainstreamowe doświadczenia.

Warto przeczytać!  Elon Musk szuka miejsca pod kolejną gigafabrykę. Jakie kraje wchodzą w grę?

Meta w dużej mierze przyjęła bardzo ostrożne podejście do sztucznej inteligencji, ale nie zostało to dobrze przyjęte przez opinię publiczną, a poprzednie wersje Lamy krytykowano jako zbyt ograniczone. (Llama 2 została udostępniona publicznie w lipcu 2023 r. Pierwsza wersja Lamy nie została upubliczniona, ale mimo to wyciekła do Internetu.)

Oczekuje się, że Llama 3, która ma większy zakres niż jej poprzedniczki, rozwiąże ten problem, umożliwiając nie tylko dokładniejsze odpowiadanie na pytania, ale także zadawanie szerszego zakresu pytań, które mogą obejmować bardziej kontrowersyjne tematy. Ma nadzieję, że dzięki temu produkt przyjmie się wśród użytkowników.

„Naszym celem w przyszłości jest uczynienie Meta AI opartej na lamach najbardziej użytecznym asystentem na świecie” – powiedziała Joelle Pineau, wiceprezes AI Research. „Pozostało jeszcze sporo pracy, aby to osiągnąć.” Firma nie wspomniała o wielkości parametrów zastosowanych w Lamie 3, ani nie udostępniła żadnych wersji demonstracyjnych tego, jak to będzie działać. Oczekuje się, że będzie miał około 140 miliardów parametrów, w porównaniu do 70 miliardów w przypadku największego modelu Llama 2.

Warto przeczytać!  KPO dla Polski. Coraz mniej czasu na wydanie miliardów. Ekonomista alarmuje

Co najważniejsze, rodziny Lam firmy Meta, zbudowane jako produkty typu open source, reprezentują odmienne filozoficzne podejście do tego, jak sztuczna inteligencja powinna rozwijać się jako szersza technologia. Robiąc to, Meta ma nadzieję zyskać szerszą przychylność programistów w porównaniu z bardziej zastrzeżonymi modelami.

Wydaje się jednak, że Meta podchodzi do tego ostrożniej, zwłaszcza jeśli chodzi o inną generatywną sztuczną inteligencję wykraczającą poza generowanie tekstu. Pineau powiedział, że firma nie wypuściła jeszcze Emu, swojego narzędzia do generowania obrazu.

„Opóźnienie ma ogromne znaczenie, podobnie jak bezpieczeństwo i łatwość obsługi, ponieważ umożliwia generowanie obrazów, z których jesteś dumny i które reprezentują dowolny kontekst twórczy” – powiedział Cox.

Jak na ironię — a może przewidywalnie (heh) — nawet gdy Meta pracuje nad wypuszczeniem Lamy 3, w domu znajduje się kilku znaczących sceptyków generatywnej sztucznej inteligencji.

Yann LeCun, uznany naukowiec zajmujący się sztuczną inteligencją, a także główny naukowiec zajmujący się sztuczną inteligencją w Meta, zmierzył ogólnie ograniczenia generatywnej sztucznej inteligencji i stwierdził, że stawia na to, co nastąpi po niej. Przewiduje, że będzie to architektura wspólnego osadzania przewidywania (JEPA), czyli odmienne podejście zarówno do uczenia modeli, jak i generowania wyników, które Meta wykorzystuje do budowania dokładniejszej predykcyjnej sztucznej inteligencji w obszarze generowania obrazów.

Warto przeczytać!  Zaoszczędzisz na rachunkach za prąd od 1 października! Rząd zwiększa limity zużycia

„Przyszłością sztucznej inteligencji jest JEPA. To nie jest generatywna sztuczna inteligencja” – powiedział. „Będziemy musieli zmienić nazwę działu produktów Chrisa”.




Źródło