Technologia

Google wprowadza na rynek multimodalny model AI Gemini w trzech rozmiarach, który będzie teraz zasilał Barda i Pixela | Wiadomości technologiczne

oen.pl

6 grudnia, 2023
4 min read

Google wprowadza na rynek multimodalny model AI Gemini w trzech rozmiarach, który będzie teraz zasilał Barda i Pixela | Wiadomości technologiczne

Gemini, najbardziej wydajny, elastyczny i ogólny model sztucznej inteligencji Google, będzie dostępny dla użytkowników na całym świecie od środy. Zostanie zintegrowany z Bardem, a także najnowszymi smartfonami Pixel 8 Pro.

Podkreślając „najnowocześniejszą wydajność Gemini w wielu wiodących testach porównawczych”, dyrektor generalny Google, Sundar Pichai, powiedział, że Gemini 1.0 jest zoptymalizowany pod kątem różnych rozmiarów: Ultra, Pro i Nano. „To pierwsze modele ery Gemini i pierwsza realizacja wizji, jaką mieliśmy, gdy na początku tego roku zakładaliśmy Google DeepMind. Ta nowa era modeli stanowi jeden z największych wysiłków naukowych i inżynieryjnych, jakie podjęliśmy jako firma” – stwierdził Pichai w swojej notatce.

W wyniku zakrojonych na szeroką skalę wspólnych wysiłków zespołów Google, w tym Google Research, Gemini został stworzony jako multimodalny, dzięki czemu może „uogólniać i bezproblemowo rozumieć, operować i łączyć różne typy informacji, w tym tekst, kod, dźwięk, obraz i wideo”. W jednej z demonstracji Google pokazało, jak Gemini może widzieć jak ludzkie oko, rozumieć i oceniać w czasie rzeczywistym oraz sugerować kolejny sposób działania.

Podczas gdy Gemini Ultra będzie największym i najbardziej wydajnym modelem do bardzo złożonych zadań, Gemini Pro będzie najlepiej skalować się w szerokim zakresie zadań, a Gemini Nano będzie zarządzać zadaniami na urządzeniu. Od dziś Gemini Nano będzie dostępne na Pixelu 8 Pro i obsługuje nowe funkcje, takie jak Podsumowanie w aplikacji Rejestrator i Inteligentna odpowiedź przez Gboard, zaczynając od WhatsApp. Gemini zostanie wdrożone w większej liczbie produktów i usług Google, takich jak wyszukiwarka, reklamy, Chrome i Duet AI.

Warto przeczytać! OnePlus 11 5G otrzymuje aktualizację OxygenOS 13.1.0.580 z ulepszonymi funkcjami bezpieczeństwa i łączności. Dowiedz się, co nowego..

W notatce napisano, że Google już zaczyna eksperymentować z Gemini w wyszukiwarce, „w ramach której przyspiesza generowanie doświadczenia wyszukiwania (SGE) dla użytkowników, zmniejszając o 40% opóźnienia w języku angielskim w USA, przy jednoczesnej poprawie jakości”.

Od 13 grudnia programiści i klienci korporacyjni będą mogli uzyskać dostęp do Gemini Pro za pośrednictwem Gemini API w Google AI Studio lub Google Cloud Vertex AI. Programiści Androida będą także mogli tworzyć przy użyciu Gemini Nano za pośrednictwem AICore – nowej funkcji systemu dostępnej w systemie Android 14, począwszy od urządzeń Pixel 8 Pro. Ponieważ Gemini Ultra wciąż przechodzi weryfikację zaufania i bezpieczeństwa, będzie jednak dostępna dla wybranych klientów, programistów, partnerów oraz ekspertów ds. bezpieczeństwa i odpowiedzialności w celu wczesnych eksperymentów i uzyskania opinii, zanim zostanie udostępniona programistom i klientom korporacyjnym na początku przyszłego roku.

Tymczasem Bard otrzyma od dziś „specjalnie dostrojoną wersję Gemini Pro w języku angielskim, umożliwiającą bardziej zaawansowane rozumowanie, planowanie, zrozumienie i nie tylko”. Na początku przyszłego roku Google wprowadzi Bard Advanced, który zapewni użytkownikom pierwszy dostęp do naszych najbardziej zaawansowanych modeli i możliwości — zaczynając od Gemini Ultra.

Warto przeczytać! Jak ukończyć zadanie The Final Repository

Zapytany, czy Gemini był w stanie przezwyciężyć problemy z halucynacjami, które nękają modele AI od ich premiery, powiedział Eli Collins, wiceprezes ds. produktu w Google DeepMind indianexpress.com: „Włożyliśmy dużo pracy w poprawę rzeczowości w Gemini, więc poprawiliśmy wydajność w zakresie odpowiadania na pytania i jakości, ale LLM nadal ma halucynacje. Kiedy integrujemy te modele z produktami takimi jak Bard, mamy dodatkowe techniki poprawiające dokładność odpowiedzi.

Google twierdzi, że wydajność Gemini Ultra „przekracza aktualne, najnowocześniejsze wyniki w 30 z 32 powszechnie używanych akademickich testów porównawczych” wykorzystywanych w badaniach i rozwoju modelu dużego języka (LLM). Z wynikiem 90,0% Gemini Ultra jest pierwszym modelem, który przewyższa ludzkich ekspertów w zakresie masowego wielozadaniowego rozumienia języka (MMLU), który wykorzystuje kombinację 57 przedmiotów, takich jak matematyka, fizyka, historia, prawo, medycyna i etyka do testowania obu wiedzę światową i umiejętności rozwiązywania problemów – dodał. Ponadto, jak twierdziła firma, Gemini może „rozumieć, wyjaśniać i generować wysokiej jakości kod w najpopularniejszych językach programowania na świecie, takich jak Python, Java, C++ i Go”.

Nandagopal Rajan pisze o technologii, gadżetach i wszystkim, co z tym związane. Współpracował z India Today Group i Hindustan Times. Jest absolwentem Uniwersytetu Calicut i Indyjskiego Instytutu Komunikacji Masowej w Dhenkanal. … Czytaj więcej

Warto przeczytać! Prawdziwy robot „Terminator 2” może przełączać się ze stanu stałego na płynny

Po raz pierwszy opublikowano: 06-12-2023 o 20:30 czasu wschodniego

Źródło