Generator obrazów AI firmy Google przechodzi metamorfozę – Wiadomości technologiczne
Google ponownie wprowadza swoją funkcję generowania obrazów AI, która została wcześniej wyłączona, po znacznej reakcji. Zaktualizowana funkcja będzie dostępna dla użytkowników anglojęzycznych czatbota Google AI, Gemini Advanced, i będzie wykorzystywać najnowszy model generowania obrazów firmy, Imagen 3.
W lutym Google usunęło funkcjonalność generowania obrazów ludzi z powodu problemów z wynikami narzędzia. Google przyznało, że funkcja generowania obrazów w aplikacji Gemini generowała niedokładne i czasami obraźliwe obrazy. Firma przyznała, że próba zapewnienia zróżnicowanej reprezentacji przez narzędzie doprowadziła do nadmiernej rekompensaty i nadmiernej ostrożności, co skutkowało problematycznymi wynikami. Google pracuje obecnie nad znaczącymi ulepszeniami tej funkcji, w tym nad obszernymi testami, aby lepiej dostosować ją do oczekiwań użytkowników i standardów etycznych. Firma podkreśliła swoje zaangażowanie w udoskonalanie sztucznej inteligencji, przyznając jednocześnie, że pomimo wszelkich starań, sporadyczne błędy mogą nadal występować.
Kontrowersje wybuchły po tym, jak użytkownicy zwrócili uwagę na problematyczne obrazy wytworzone przez narzędzie, takie jak przedstawienia czarnoskórej kobiety jako ojca założyciela USA oraz czarnoskórych i azjatyckich osób jako niemieckich żołnierzy z czasów nazizmu. Obrazy te podsyciły zarzuty stronniczości i były szeroko krytykowane w mediach społecznościowych, przyciągając uwagę znanych osobistości, w tym właściciela X (dawniej Twittera) Elona Muska, który wcześniej wyraził obawy dotyczące postrzeganych stronniczości narzędzi AI. Dyrektor generalny Google Sundar Pichai przyznał, że część wygenerowanej treści była niedopuszczalna i przyznał, że firma „popełniła błąd”.
„Udoskonaliliśmy nasze możliwości generowania kreatywnych obrazów i w nadchodzących dniach wprowadzimy nasz najnowszy model generowania obrazów, Imagen 3, do aplikacji Gemini i rozszerzymy jego dostępność dla użytkowników we wszystkich językach” — stwierdził Dave Citron, starszy dyrektor w Google, we wpisie na blogu.
Nowy model generowania obrazu, Imagen 3, wprowadza kilka istotnych ulepszeń. Oferuje on lepszą jakość obrazu, tworząc bardzo szczegółowe i dokładne wizualizacje na podstawie tekstowych podpowiedzi i obsługuje szeroki zakres stylów artystycznych. Model ten zawiera zaawansowane zabezpieczenia zapobiegające generowaniu nieodpowiednich treści, zapewniając, że unika tworzenia obrazów identyfikowalnych osób, nieletnich lub scen z nadmierną przemocą lub treściami seksualnymi. Google twierdzi, że użytkownicy mają większą kontrolę nad procesem twórczym, z możliwością żądania modyfikacji, jeśli początkowy obraz nie spełnia ich oczekiwań.