OpenAI ogłasza GPT-4o, aplikację ChatGPT na macOS, konwersacyjną sztuczną inteligencję w trybie głosowym | Wiadomości techniczne
![OpenAI ogłasza GPT-4o, aplikację ChatGPT na macOS, konwersacyjną sztuczną inteligencję w trybie głosowym | Wiadomości techniczne](https://oen.pl/wp-content/uploads/2024/05/1715666057-8712.jpg)
GPT-4o
Kliknij tutaj, aby śledzić nasz kanał WhatsApp
OpenAI nazywa GPT-4o „krokiem w kierunku znacznie bardziej naturalnej interakcji człowiek-komputer”. Nowa wersja firmowego modelu GPT-4 może przyjmować dowolną kombinację tekstu, dźwięku i obrazu jako dane wejściowe i generować dane wyjściowe w ten sam sposób. Model GPT-4o może reagować na sygnały audio w ciągu 232 milisekund, co według firmy jest podobne do czasu reakcji człowieka podczas rozmowy.
Porównując go z istniejącym modelem GPT-4 Turbo, będącym kolejną iteracją firmowego modelu GPT-4, GPT-4o dorównuje jego wydajnością w zakresie rozumienia i kodowania tekstu w języku angielskim, jednocześnie znacznie przewyższając go w zakresie rozumienia dźwięku. Model GPT-4o zapewnia również znaczące ulepszenia w zakresie tekstu w językach innych niż angielski.
OpenAI stwierdziło, że model GPT-4o zapewnia znaczną poprawę rozumienia obrazów. Na przykład dzięki ChatGPT opartemu na GPT-4o użytkownicy mogą udostępniać obraz menu potrawy w różnych językach i prosić chatbota o jego przetłumaczenie, poznać historię potrawy i uzyskać na tej podstawie rekomendacje.
Tryb głosowy z GPT-4o
Funkcja Talkback w trybie głosowym istnieje już w ChatGPT zarówno w oponach bezpłatnych, jak i płatnych. OpenAI stwierdziło jednak, że nowy model GPT-4o wnosi do niego znaczące ulepszenia. Według OpenAI GPT-4o to najbardziej zaawansowany model, który jest kompleksowo przeszkolony w zakresie tekstu, obrazu i dźwięku, co oznacza, że wszystkie wejścia i wyjścia są przetwarzane przez tę samą sieć neuronową. Zasadniczo zmniejsza to opóźnienia w naturalnej rozmowie i poprawia wyniki, ponieważ wszystkie informacje są przetwarzane w tej samej sieci neuronowej.
Według OpenAI przed GPT-4o można było używać trybu głosowego do rozmowy z ChatGPT z opóźnieniami wynoszącymi średnio 2,8 sekundy (GPT-3.5) i 5,4 sekundy (GPT-4). To opóźnienie jest wynikiem potoku przetwarzania danych składającego się z trzech oddzielnych modeli: jeden prosty model transkrybuje dźwięk na tekst, GPT-3.5 lub GPT-4 pobiera tekst i wysyła tekst, a trzeci prosty model konwertuje ten tekst z powrotem na dźwięk. Według OpenAI proces ten spowodował utratę wielu informacji do głównego źródła informacji wywiadowczych, GPT-4.
Aplikacja ChatGPT dla systemu macOS
Rozszerzając ekosystem aplikacji ChatGPT, OpenAI uruchomiło aplikację chatbot na komputery stacjonarne Apple z systemem macOS. Aplikacja ChatGPT dla systemu macOS będzie miała głębszą integrację z platformą. Za pomocą skrótu klawiaturowego (Opcja + Spacja) użytkownicy zostaną przekierowani na stronę konwersacji ChatGPT, aby zadać chatbotowi pytanie.
OpenAI potwierdziło, że obecnie pracuje nad wersją aplikacji dla systemu Windows, która zostanie uruchomiona „jeszcze w tym roku”.
Aplikacja na macOS dla ChatGPT jest obecnie udostępniana subskrybentom Plusa, a w nadchodzących tygodniach będzie również dostępna dla użytkowników poziomu bezpłatnego.
Nowy model GPT-4o jest dostępny na ChatGPT dla użytkowników darmowego poziomu, ale z ograniczeniem liczby wiadomości. Limit ten będzie zależał od wykorzystania i zapotrzebowania w momencie użytkowania, a ChatGPT automatycznie przełączy się na GPT-3.5 po osiągnięciu limitu. Jednakże, korzystając z chatGPT z GPT-4o, użytkownik darmowego poziomu uzyska dostęp do niektórych zaawansowanych funkcji, które wcześniej były ograniczone do abonentów płatnego poziomu.
Użytkownik bezpłatnego poziomu z GPT-4o może przesyłać pliki i zdjęcia w celu podsumowań, analiz i nie tylko. Dzięki nowemu modelowi bezpłatni użytkownicy mogą skorzystać z funkcji „Pamięć” i poprosić ChatGPT o zapamiętanie informacji na potrzeby przyszłych rozmów. Dodatkowo użytkownicy poziomu bezpłatnego uzyskają dostęp do sklepu GPT w celu przeglądania i używania niestandardowych botów. Sklep GPT został uruchomiony na początku tego roku dla płatnych subskrybentów, umożliwiając użytkownikom tworzenie własnych chatbotów, zwanych GPT, i udostępnianie ich w sklepie innym użytkownikom. Chociaż użytkownicy bezpłatnego poziomu uzyskają dostęp do sklepu GPT i niestandardowych GPT, nie będą mogli ich tworzyć ani udostępniać.
Co pozostaje wyłącznie dla użytkowników płatnego poziomu
Podczas gdy użytkownicy bezpłatnego poziomu otrzymają funkcje, które wcześniej były ograniczone do poziomu płatnego, nowy tryb głosowy z GPT-4o pozostanie wyłącznie dla abonentów płatnego poziomu. Tryb głosowy z obsługą modelu GPT-4o zostanie udostępniony abonentom ChatGPT Plus w nadchodzących tygodniach, a wkrótce będzie dostępny dla użytkowników Team i Enterprise. OpenAI udostępnia także model GPT-4o płatnym subskrybentom z „mniejszymi ograniczeniami”.
Nowy model jest wdrażany dla użytkowników ChatGPT Plus i Team, a w nadchodzących dniach będzie dostępny dla użytkowników Enterprise. Firma podała, że użytkownicy Plusa będą mieli limit wiadomości nawet 5 razy większy niż użytkownicy wersji darmowej, a użytkownicy Team i Enterprise będą mieli jeszcze wyższe limity.