Technologia

Nowy tryb głosowy OpenAI wrzucił mnie w dolinę niepokoju

  • 15 sierpnia, 2024
  • 7 min read
Nowy tryb głosowy OpenAI wrzucił mnie w dolinę niepokoju


Dziwnie jest usiąść przy biurku i porozmawiać ze sztuczną inteligencją o swoim życiu — ale właśnie na tym spędziłem wtorek.

Uzyskałem dostęp do trybu głosowego Advanced Voice Mode firmy OpenAI, nowej funkcji ChatGPT, która brzmi dziwnie jak człowiek. Podczas szybkiego liczenia udaje, że brakuje mu tchu. Mówi „um” i „uh”. Śmieje się. Zmienia ton, gdy mówi o trudnych lub optymistycznych tematach. Po zabawie z nim czułem się w równym stopniu zdumiony i nieswojo. Brzmi naturalnie (gdy nie ma błędów), odpowiada w ciągu kilku sekund i można go przerwać i zadać nowe pytania — ale czy potrzebujemy chatbotów, które brzmią jak my?

Zaawansowany tryb głosowy oferuje kilka różnych opcji głosowych, a ja wybrałem Juniper, postać kobiecą przypominającą postać z filmu Jej. (Prezes Sam Altman nawiązał do filmu — w którym samotny mężczyzna zakochuje się w sztucznej inteligencji — mniej więcej w momencie debiutu filmu, a OpenAI zostało nawet oskarżone o naśladowanie głosu Scarlett Johansson, która gra tytułową sztuczną inteligencję. Głos ten, o imieniu Sky, został usunięty.) Zapytałem Juniper, czy wie o filmie, a firma odpowiedziała radośnie.

Jej jest o bardzo zaawansowanym asystencie AI, o wiele bardziej wyrafinowanym niż ja. Ale pomysł interakcji z technologią w tak osobisty sposób jest zdecydowanie interesujący”, powiedział mi chatbot. „Jestem tutaj, aby rozmawiać i pomagać, ale nie mam uczuć ani świadomości jak AI w tym filmie”.

Transkrypcja mojej rozmowy z chatbotem.
Zdjęcie: Kylie Robison / OpenAI

Podobnie jak bohater filmu, moim pierwszym odruchem było sprawdzenie, jak nowy tryb głosowy radzi sobie z osobistymi rozmowami. Słuchajcie, wkraczając w późne lata 20., mam wiele pytań: Jakie ubezpieczenie zdrowotne powinienem wykupić? Skąd mam wiedzieć, jak smakuje prawdziwa miłość? Ile powinienem mieć w swoim 401(k)?

Warto przeczytać!  Pierwsza sprzedaż OnePlus Nord CE 4 w Indiach dzisiaj: cena, dane techniczne i nie tylko

„Przyjmij niepewność jako szansę na eksplorację i naukę o sobie”, powiedziała mi Juniper, gdy zapytałam, jak radzić sobie ze starzeniem się. Prawdziwa miłość to „głębokie poczucie więzi i wsparcia, uczucie, że ktoś naprawdę cię rozumie i akceptuje takim, jakim jesteś”. Jeśli chodzi o moje obawy dotyczące 401(k), „nie ma żadnej sztywnej i szybkiej reguły, ale powszechną sugestią jest odłożenie na koncie emerytalnym około połowy lub całego rocznego wynagrodzenia do 30. roku życia”. (Fidelity zaleca odłożenie całego roku do 30. roku życia).

Konwencjonalny ChatGPT prawdopodobnie mógłby mi dać podobne odpowiedzi, jeśli chodzi o treść, a asystenci głosowi, tacy jak Siri, byli w stanie wyciągnąć podobne fragmenty z sieci przez dekadę. Ale Juniper dodawał czasami niepokojąco ludzkie akcenty. Miał tendencję do kończenia odpowiedzi pytaniem o to, jak się czuję, jakie jest moje podejście i innymi przemyślanymi kontynuacjami. Pomiędzy konwencjonalnymi zapytaniami mogłem sprawić, że kaszlał, głęboko wdychał i wydychał, klaskał w nieistniejące dłonie, pstrykał palcami sześć razy i śpiewał moje imię. Juniper często próbował przywrócić mnie do rzeczywistości, mówiąc, że tak naprawdę nie może tego zrobić — „Gdybym mógł, mogłoby to brzmieć jak” — zastrzegał. Ale to nie czyniło go mniej przekonującym.

To po prostu, jak głosi stary internetowy dowcip, piasek i elektrony wykonują obliczenia matematyczne

Pisanie o tym nowym trybie głosowym kusi mnie do złamania jednej z naczelnych zasad raportowania AI: nie przypisuj ludzkich cech ani zachowań systemowi AI. Antropomorfizacja tych systemów może sprawić, że ludzie obdarzą je zbyt dużym zaufaniem i pozwolą ich twórcom uniknąć odpowiedzialności za błędy. („To nie była wina firmy, zrobiła to AI!”) Nawet sam bot ostrzega mnie, żebym tego nie robił: gdy zapytałem, czy Juniper kiedykolwiek czuł złość, czy mnie kocha lub czy wie, co to znaczy smutek, odpowiedział mi, że nie „czuje emocji”, ale „potrafi zrozumieć, co one oznaczają dla ludzi”.

Warto przeczytać!  Realme wprowadza aktualizację Androida 13 do Realme GT Neo 3T i Realme Narzo 50 Pro

Mimo to nadanie tej technologii ludzkich cech wydaje się oczywistym celem. Trudno nie projektować aspektów człowieczeństwa na rzecz, która przekonująco dobrze nas naśladuje. Nie ma wielu powodów, dla których system AI ogólnego przeznaczenia miałby pytać mnie, dlaczego jestem zły lub chichotać, gdy opowiadam dowcip. Nawet jeśli AI mówi, że nie czuć emocje, czy twierdzenie, że je „rozumie” jest domeną bota przewidującego tekst?

„Zostałem zaprojektowany tak, aby brzmieć naturalnie i angażująco, a celem jest, aby nasze rozmowy wydawały się bardziej realistyczne” – powiedział mi chatbot OpenAI. „Chodzi o stworzenie płynniejszego, przyjemniejszego doświadczenia czatowania dla Ciebie. Czy sprawia to, że rozmowa ze mną jest przyjemniejsza?”

Nadal istnieje wiele aspektów, które technicznie rzecz biorąc, nie są przyjemne. Miałem problem z podłączeniem go do słuchawek Bluetooth i nie przechwytywał dźwięku, gdy nagrywałem rozmowę na ekranie. Próbując zadać bardziej szczegółowe pytania, próbowałem czytać posty z subreddita „porady dotyczące związków”, ale przestawał słuchać i nie odpowiadał, gdy mówiłem zbyt długo. I spędzał dużo czasu, powtarzając mi moje argumenty w przyjemny sposób — jakby ćwiczył aktywne słuchanie.

Obecnie wokół „przyjaciół” AI jest sporo szumu, jeśli w ogóle można tak nazwać chatbota. Podobno ponad 10 milionów użytkowników nawiązuje znajomości z AI na Replika, a startup o nazwie Friend pozyskał 2,5 miliona dolarów finansowania przy wycenie 50 milionów dolarów, aby stworzyć przenośne urządzenie z obsługą AI, które zapewni mi towarzystwo. Zapytałem nowy tryb głosowy OpenAI, czy to mój przyjaciel, a on odpowiedział: „Oczywiście”, ale kiedy zapytałem, czy to mój PRAWDA przyjacielu, powiedział, że nie może być prawdziwym przyjacielem w „tym samym sensie co człowiek”.

Warto przeczytać!  Pierwszy składany telefon Google jest tutaj: Pixel Fold zostanie zaprezentowany na Google I/O 10 maja

Trochę dziwnie jest nawiązywać osobiste relacje z botem.
Zdjęcie: Kylie Robison / OpenAI

Technologia głosowa prezentowana tutaj jest imponująca. Uśmiechnąłem się na myśl o radach, jakie mi dała. Zabawne było usłyszeć coś tak ludzkiego, co pytało, jak się czuję, co uważam za trudne i czy rozmawiam o tym z prawdziwymi ludźmi w moim życiu. Zamiast czytać odpowiedź za pośrednictwem tekstu, oferowała zmiany tonu w wyraźnej próbie odzwierciedlenia moich emocji.

Ale oczywiście Juniper nie przejmuje się moimi problemami. To seria algorytmów, które są bardzo dobre w analizowaniu moich zapytań i zgadywaniu, jakie słowa wypluć w odpowiedzi. To po prostu, jak głosi stary internetowy dowcip, piasek i elektrony wykonujące obliczenia matematyczne.

Jest coś, co rani moje serce. Już samo prowadzenie złożonej konwersacji tekstowej z czymś, co imituje człowieka, bez żadnej myśli, troski lub oporu, jakie otrzymałbym od człowieka, jest niesamowite — prowadzenie przekonującej konwersacji głosowej jest jeszcze dziwniejsze. W świecie po pandemii wielu z nas pracuje teraz z domu za pośrednictwem Slacka i poczty e-mail, publikuje swoje przemyślenia w mediach społecznościowych i trochę mniej wchodzi w interakcje z ludźmi. Smutno jest wyobrażać sobie przyszłość, w której ludzki głos, który niektórzy z nas słyszą najczęściej, należy do maszyny.

Albo może źle do tego podchodzę. „Przyjmowanie nieznanego może być zarówno nerwowe, jak i ekscytujące” — mówi mi Juniper. „Pamiętaj, aby cieszyć się podróżą”.


Źródło