Technologia

OpenAI ogłasza GPT-4o, aplikację ChatGPT na macOS, konwersacyjną sztuczną inteligencję w trybie głosowym | Wiadomości techniczne

  • 14 maja, 2024
  • 5 min read
OpenAI ogłasza GPT-4o, aplikację ChatGPT na macOS, konwersacyjną sztuczną inteligencję w trybie głosowym |  Wiadomości techniczne


OpenAI ogłosiło GPT-4o, swój pierwszy model sztucznej inteligencji z natywną obsługą rozumowania w zakresie dźwięku, obrazu i tekstu. OpenAI stwierdziło, że „o” w GPT-4o oznacza „Omni”, ponieważ znacznie lepiej rozumie i interpretuje teksty, obrazy i pliki audio niż jego poprzednik. Jednocześnie firma ogłosiła aplikację ChatGPT dla komputerów stacjonarnych Apple z systemem macOS i zaprezentowała konwersacyjną sztuczną inteligencję w trybie głosowym. Poniżej znajdują się szczegóły:

GPT-4o

Kliknij tutaj, aby śledzić nasz kanał WhatsApp

OpenAI nazywa GPT-4o „krokiem w kierunku znacznie bardziej naturalnej interakcji człowiek-komputer”. Nowa wersja firmowego modelu GPT-4 może przyjmować dowolną kombinację tekstu, dźwięku i obrazu jako dane wejściowe i generować dane wyjściowe w ten sam sposób. Model GPT-4o może reagować na sygnały audio w ciągu 232 milisekund, co według firmy jest podobne do czasu reakcji człowieka podczas rozmowy.

Porównując go z istniejącym modelem GPT-4 Turbo, będącym kolejną iteracją firmowego modelu GPT-4, GPT-4o dorównuje jego wydajnością w zakresie rozumienia i kodowania tekstu w języku angielskim, jednocześnie znacznie przewyższając go w zakresie rozumienia dźwięku. Model GPT-4o zapewnia również znaczące ulepszenia w zakresie tekstu w językach innych niż angielski.

OpenAI stwierdziło, że model GPT-4o zapewnia znaczną poprawę rozumienia obrazów. Na przykład dzięki ChatGPT opartemu na GPT-4o użytkownicy mogą udostępniać obraz menu potrawy w różnych językach i prosić chatbota o jego przetłumaczenie, poznać historię potrawy i uzyskać na tej podstawie rekomendacje.

Warto przeczytać!  Jak zostać wielkim kormoranem w GTA Online poprzez rośliny pejotlowe

Tryb głosowy z GPT-4o

Funkcja Talkback w trybie głosowym istnieje już w ChatGPT zarówno w oponach bezpłatnych, jak i płatnych. OpenAI stwierdziło jednak, że nowy model GPT-4o wnosi do niego znaczące ulepszenia. Według OpenAI GPT-4o to najbardziej zaawansowany model, który jest kompleksowo przeszkolony w zakresie tekstu, obrazu i dźwięku, co oznacza, że ​​wszystkie wejścia i wyjścia są przetwarzane przez tę samą sieć neuronową. Zasadniczo zmniejsza to opóźnienia w naturalnej rozmowie i poprawia wyniki, ponieważ wszystkie informacje są przetwarzane w tej samej sieci neuronowej.

Według OpenAI przed GPT-4o można było używać trybu głosowego do rozmowy z ChatGPT z opóźnieniami wynoszącymi średnio 2,8 sekundy (GPT-3.5) i 5,4 sekundy (GPT-4). To opóźnienie jest wynikiem potoku przetwarzania danych składającego się z trzech oddzielnych modeli: jeden prosty model transkrybuje dźwięk na tekst, GPT-3.5 lub GPT-4 pobiera tekst i wysyła tekst, a trzeci prosty model konwertuje ten tekst z powrotem na dźwięk. Według OpenAI proces ten spowodował utratę wielu informacji do głównego źródła informacji wywiadowczych, GPT-4.

Aplikacja ChatGPT dla systemu macOS

Rozszerzając ekosystem aplikacji ChatGPT, OpenAI uruchomiło aplikację chatbot na komputery stacjonarne Apple z systemem macOS. Aplikacja ChatGPT dla systemu macOS będzie miała głębszą integrację z platformą. Za pomocą skrótu klawiaturowego (Opcja + Spacja) użytkownicy zostaną przekierowani na stronę konwersacji ChatGPT, aby zadać chatbotowi pytanie.

Warto przeczytać!  Nowe klasy, atuty i zmiany postaci w Apex Legends w sezonie 16

OpenAI potwierdziło, że obecnie pracuje nad wersją aplikacji dla systemu Windows, która zostanie uruchomiona „jeszcze w tym roku”.

Aplikacja na macOS dla ChatGPT jest obecnie udostępniana subskrybentom Plusa, a w nadchodzących tygodniach będzie również dostępna dla użytkowników poziomu bezpłatnego.

Rozszerzanie większej liczby możliwości dla bezpłatnych użytkowników

Nowy model GPT-4o jest dostępny na ChatGPT dla użytkowników darmowego poziomu, ale z ograniczeniem liczby wiadomości. Limit ten będzie zależał od wykorzystania i zapotrzebowania w momencie użytkowania, a ChatGPT automatycznie przełączy się na GPT-3.5 po osiągnięciu limitu. Jednakże, korzystając z chatGPT z GPT-4o, użytkownik darmowego poziomu uzyska dostęp do niektórych zaawansowanych funkcji, które wcześniej były ograniczone do abonentów płatnego poziomu.

Użytkownik bezpłatnego poziomu z GPT-4o może przesyłać pliki i zdjęcia w celu podsumowań, analiz i nie tylko. Dzięki nowemu modelowi bezpłatni użytkownicy mogą skorzystać z funkcji „Pamięć” i poprosić ChatGPT o zapamiętanie informacji na potrzeby przyszłych rozmów. Dodatkowo użytkownicy poziomu bezpłatnego uzyskają dostęp do sklepu GPT w celu przeglądania i używania niestandardowych botów. Sklep GPT został uruchomiony na początku tego roku dla płatnych subskrybentów, umożliwiając użytkownikom tworzenie własnych chatbotów, zwanych GPT, i udostępnianie ich w sklepie innym użytkownikom. Chociaż użytkownicy bezpłatnego poziomu uzyskają dostęp do sklepu GPT i niestandardowych GPT, nie będą mogli ich tworzyć ani udostępniać.

Warto przeczytać!  Twój telefon z Androidem może wkrótce służyć jako kamera samochodowa

Co pozostaje wyłącznie dla użytkowników płatnego poziomu

Podczas gdy użytkownicy bezpłatnego poziomu otrzymają funkcje, które wcześniej były ograniczone do poziomu płatnego, nowy tryb głosowy z GPT-4o pozostanie wyłącznie dla abonentów płatnego poziomu. Tryb głosowy z obsługą modelu GPT-4o zostanie udostępniony abonentom ChatGPT Plus w nadchodzących tygodniach, a wkrótce będzie dostępny dla użytkowników Team i Enterprise. OpenAI udostępnia także model GPT-4o płatnym subskrybentom z „mniejszymi ograniczeniami”.

Nowy model jest wdrażany dla użytkowników ChatGPT Plus i Team, a w nadchodzących dniach będzie dostępny dla użytkowników Enterprise. Firma podała, że ​​użytkownicy Plusa będą mieli limit wiadomości nawet 5 razy większy niż użytkownicy wersji darmowej, a użytkownicy Team i Enterprise będą mieli jeszcze wyższe limity.


Źródło