Technologia

Google aktualizuje model AI Gemini, dodaje okno kontekstowe 1M

  • 15 lutego, 2024
  • 5 min read
Google aktualizuje model AI Gemini, dodaje okno kontekstowe 1M


Google w czwartek wprowadziło kolejną wersję swojego wielkojęzykowego modelu Gemini: Gemini 1.5.

Gemini 1.5 Pro to pierwszy model Gemini 1.5.

Jest to średniej wielkości multimodalny model sztucznej inteligencji, który działa na podobnym poziomie jak wersja 1.0 Ultra, która została wydana na początku lutego, ale według dostawcy chmury zużywa mniej mocy obliczeniowej.

Gemini 1.5 Pro jest wyposażony w standardowe okno zawartości zawierające 128 000 tokenów, które określa zakres tekstu, jaki może przetworzyć model dużego języka (LLM). Jednak programiści i klienci korporacyjni mogą wypróbować wersję 1.5 z oknem kontekstowym zawierającym do miliona tokenów za pośrednictwem AI Studio i platformy Google Vertex AI w prywatnej wersji zapoznawczej.

Duże okno kontekstowe

To największe jak dotąd okno kontekstowe na rynku. Jest około osiem razy większy niż GPT-4 OpenAI i pięć razy większy niż Claude 2.1 od Anthropic.

Duże okno kontekstowe odpowiada około godzinie wideo, 11 godzinom dźwięku, 30 000 linii kodu i 750 000 słów.

Gemini 1.5 Pro potrafi analizować, klasyfikować i podsumowywać duże ilości treści w formie podpowiedzi. Może również wykonywać wysoce zaawansowane zrozumienie i rozumowanie w przypadku różnych modalności, w tym wideo.

Warto przeczytać!  iPhone 16 będzie wyglądał jak iPhone 12? Nowy raport twierdzi, że moduł kamery pionowej

Aktualizacja Google Gemini następuje tydzień po zmianie nazwy chatbota Bard AI na Gemini.

Następuje to również po roku, kiedy jego konkurent Microsoft wydawał się liderem na rynku generatywnej sztucznej inteligencji, zwłaszcza dzięki partnerstwu z OpenAI.

Jednak dzięki ostatnim zmianom w Gemini Google wykazuje przewagę.

„Teraz to Google wyznacza tempo przyszłości GenAI” – powiedział analityk firmy Gartner Chirag Dekate. „Nie chodzi już o to, czy Google dogoni innych, chodzi raczej o to, kiedy inni dogonią Google”.

Okno kontekstowe wersji 1.5 Pro ma na celu eliminowanie jednego z największych ograniczeń współczesnych generatywnych systemów AI, powiedział analityk Forrester Research William McKeon-White.

Wyzwaniem tym jest zdolność generatywnych systemów sztucznej inteligencji do zrozumienia stanu, czyli zbioru informacji wskazujących, gdzie w określonym czasie znajdują się elementy systemu sztucznej inteligencji.

Chociaż do rozwiązania tego problemu wykorzystano generowanie wspomagane wyszukiwaniem (RAG), ograniczone okno kontekstowe w dalszym ciągu okazało się problematyczne w przypadku LLM.

Jednak duże okno kontekstowe Google nie eliminuje w pełni wyzwania, jakie stanowi państwo, stwierdził McKeon-White. Modele sztucznej inteligencji nadal mają trudności z przechowywaniem informacji w sposób, który można aktualizować w czasie, ale który nie jest efemeryczny.

Warto przeczytać!  Informacje o banerze, nowe postacie, wydarzenia

Okno kontekstowe wersji 1.5 Pro jest również pomocne, ponieważ dopasowuje sposób postrzegania użytkowników końcowych do tego, co według nich Gemini powinno być w stanie zrobić, dodał McKeon-White.

„Jest w stanie zachować kontekst, jest w stanie zachować poprzednie interakcje i istotne odpowiedzi” – powiedział. „Można znacznie lepiej dostroić się do poziomu zbliżenia się do zwykłego, ludzkiego, pasywnego postrzegania kontekstu, trafności i zrozumienia”.

Duże okno kontekstowe Google jest również ważne dla przedsiębiorstw, ponieważ obecne 1-milionowe okno kontekstowe Gemini 1.5 można rozszerzyć do 10 milionów na potrzeby badań, a Google może być w stanie rozszerzyć je na wersje dla przedsiębiorstw, powiedział założyciel Constellation Research R „Ray” Wang.

„Użytkownik korporacyjny może usprawnić personalizację na dużą skalę, a także poruszać się z większą szybkością” – powiedział Wang. „Google zrealizował to szybciej, lepiej i, miejmy nadzieję, taniej dzięki wydajnemu transformatorowi i architekturze MoE”.

Dzięki architekturze MoE modele są podzielone na mniejsze sieci neuronowe. Dzięki temu model jest bardziej wydajny i odpowiedni w zależności od podanych danych wejściowych.

Poza innowacją

Chociaż innowacja Google jest imponująca i wydaje się trudna do przebicia lub dorównania, dostawca usług w chmurze będzie musiał jeszcze udowodnić klientom korporacyjnym, jak przekłada się na zastosowania biznesowe, powiedział Dekate.

Warto przeczytać!  OpenAI opóźnia wprowadzenie „trybu głosowego” na lipiec Według Reuters

„Muszą się nauczyć, jak działać skutecznie, to łączyć fakty w imieniu klienta” – powiedział.

Google będzie musiał pokazać, jak 1.5 Pro ma zastosowanie w branżach takich jak ubezpieczenia, finanse i produkcja.

Microsoft odniósł sukces na tym polu, ponieważ szybko sprawił, że jego technologia generatywnej sztucznej inteligencji stała się użyteczna dla przedsiębiorstwa.

„Google musi sprawić, aby jego innowacje były istotne dla przedsiębiorstwa” – stwierdził Dekate. „Jeśli udało im się to zrobić i wprowadzić innowacje w imieniu klientów oraz stworzyć sojusze branżowe i strategie realizacji, mogą stworzyć moment zmieniający udział w rynku”.

Bez tego innowacja Google w postaci Gemini byłaby imponująca, ale niezapomniana – dodał Dekate.

Google planuje wprowadzić poziomy cenowe dla swojego standardowego okna obejmującego 128 000 kontekstów i skalować do miliona tokenów w miarę ulepszania modelu.

Wcześni testerzy mogą bezpłatnie wypróbować okno kontekstowe o wartości 1 miliona tokenów.

Esther Ajao jest autorką wiadomości w redakcji TechTarget i zajmuje się oprogramowaniem i systemami sztucznej inteligencji.


Źródło