Technologia

Generator obrazów AI firmy Google przechodzi metamorfozę – Wiadomości technologiczne

oen.pl

29 sierpnia, 2024
3 min read

Generator obrazów AI firmy Google przechodzi metamorfozę – Wiadomości technologiczne

Google ponownie wprowadza swoją funkcję generowania obrazów AI, która została wcześniej wyłączona, po znacznej reakcji. Zaktualizowana funkcja będzie dostępna dla użytkowników anglojęzycznych czatbota Google AI, Gemini Advanced, i będzie wykorzystywać najnowszy model generowania obrazów firmy, Imagen 3.

W lutym Google usunęło funkcjonalność generowania obrazów ludzi z powodu problemów z wynikami narzędzia. Google przyznało, że funkcja generowania obrazów w aplikacji Gemini generowała niedokładne i czasami obraźliwe obrazy. Firma przyznała, że próba zapewnienia zróżnicowanej reprezentacji przez narzędzie doprowadziła do nadmiernej rekompensaty i nadmiernej ostrożności, co skutkowało problematycznymi wynikami. Google pracuje obecnie nad znaczącymi ulepszeniami tej funkcji, w tym nad obszernymi testami, aby lepiej dostosować ją do oczekiwań użytkowników i standardów etycznych. Firma podkreśliła swoje zaangażowanie w udoskonalanie sztucznej inteligencji, przyznając jednocześnie, że pomimo wszelkich starań, sporadyczne błędy mogą nadal występować.

Kontrowersje wybuchły po tym, jak użytkownicy zwrócili uwagę na problematyczne obrazy wytworzone przez narzędzie, takie jak przedstawienia czarnoskórej kobiety jako ojca założyciela USA oraz czarnoskórych i azjatyckich osób jako niemieckich żołnierzy z czasów nazizmu. Obrazy te podsyciły zarzuty stronniczości i były szeroko krytykowane w mediach społecznościowych, przyciągając uwagę znanych osobistości, w tym właściciela X (dawniej Twittera) Elona Muska, który wcześniej wyraził obawy dotyczące postrzeganych stronniczości narzędzi AI. Dyrektor generalny Google Sundar Pichai przyznał, że część wygenerowanej treści była niedopuszczalna i przyznał, że firma „popełniła błąd”.

Warto przeczytać! OnePlus 11 5G, Redmi Note 12 5G, Samsung Galaxy S23 Ultra 5G na liście smartfonów 5G teraz dostępne z ogromnymi rabatami

Google udostępnia publicznie swoje narzędzie do generowania tekstu na obrazy oparte na sztucznej inteligencji Imagen 3, ale tylko ci użytkownicy mogą je wypróbować

Członkowie EPFO alarmują! Brak odsetek, surowsze przelewy PF, normy wypłat dla TYCH kont

Aktualizacja EPFO: Brak odsetek od depozytów PF; surowsze normy przelewów i wypłat dla TYCH członków

Akcje Tata Motors spadają o 5% z powodu obaw o niższą sprzedaż samochodów i umiarkowane perspektywy wzrostu

UE zasugerowała, że eksport z Indii mógłby potencjalnie uniknąć podatku CBAM lub zostać objęty niższym podatkiem, gdyby Indie wdrożyły system podatku węglowego, obciążając eksporterów opłatami za emisję dwutlenku węgla w kraju.

Oferta UE w sprawie CBAM bez ulgi: raport

„Udoskonaliliśmy nasze możliwości generowania kreatywnych obrazów i w nadchodzących dniach wprowadzimy nasz najnowszy model generowania obrazów, Imagen 3, do aplikacji Gemini i rozszerzymy jego dostępność dla użytkowników we wszystkich językach” — stwierdził Dave Citron, starszy dyrektor w Google, we wpisie na blogu.

Nowy model generowania obrazu, Imagen 3, wprowadza kilka istotnych ulepszeń. Oferuje on lepszą jakość obrazu, tworząc bardzo szczegółowe i dokładne wizualizacje na podstawie tekstowych podpowiedzi i obsługuje szeroki zakres stylów artystycznych. Model ten zawiera zaawansowane zabezpieczenia zapobiegające generowaniu nieodpowiednich treści, zapewniając, że unika tworzenia obrazów identyfikowalnych osób, nieletnich lub scen z nadmierną przemocą lub treściami seksualnymi. Google twierdzi, że użytkownicy mają większą kontrolę nad procesem twórczym, z możliwością żądania modyfikacji, jeśli początkowy obraz nie spełnia ich oczekiwań.

Warto przeczytać! Równoważenie szans i zagrożeń dla cyberbezpieczeństwa

Źródło