Nowy i ulepszony generator obrazów Imagen 3 AI firmy Google jest niesamowicie realistyczny
Google po cichu wydało ulepszony generator tekstu do obrazu Imagen 3. Dostępny dla użytkowników z USA, obiecuje znaczący skok jakości obrazu i szczegółowości. A sądząc po przykładach… boję się, jak dobry jest.
Po raz pierwszy zaprezentowany na Google I/O w maju, Imagen 3 jest teraz dostępny za pośrednictwem AI Test Kitchen firmy. Według Google, nowy model oferuje „jeszcze lepsze szczegóły, bogatsze oświetlenie i mniej rozpraszających artefaktów” niż poprzednie modele firmy.
Podobnie jak konkurenci, Imagen 3 przekształca tekstowe podpowiedzi w obrazy. Możesz również edytować istniejące obrazy z precyzją, dzięki zdolności narzędzia do rozumienia i modyfikowania określonych elementów. Podczas gdy Google wdrożyło zabezpieczenia, aby zapobiec generowaniu szkodliwych lub wprowadzających w błąd treści, takich jak obrazy osób publicznych lub broni, kreatywność modelu nadal jest imponująca.
„Zaprojektowaliśmy Imagen 3 tak, aby generował wysokiej jakości obrazy w szerokiej gamie formatów i stylów, od fotorealistycznych krajobrazów po obrazy olejne o bogatej fakturze i fantazyjne sceny z animacji poklatkowej” – wyjaśnia Google.
Możliwe obawy
Warto zauważyć, że podejście Imagen 3 do moderowania treści różni się od podejścia innych platform. Na przykład nie możesz po prostu wygenerować obrazu modlącego się Trumpa. Jednak narzędzie może generować obrazy przypominające chronione prawem autorskim postacie i słynne loga, jeśli wiesz, co jest zachętą do użycia. Ludzie z The Verge stworzyli obraz „kreskówkowego niebieskiego jeża biegnącego po polu”, a Imagen 3 zwrócił obraz Sonica the Hedgehog. Podczas gdy Google przyjmuje bardziej ostrożne podejście niż jego konkurenci, oczywiste jest, że nadal można ominąć ograniczenia.
Jeśli chodzi o realizm obrazu, oto przykład, który wydał mi się szczególnie interesujący – i niepokojący, ponieważ jestem szydełkarką. Pojawił się wzrost liczby obrazów szydełkowych generowanych przez AI, po których pojawiły się fałszywe wzory. Pinterest jest nimi wypełniony, a co gorsza – oszuści sprzedają te fałszywe wzory na Etsy. Ale nadal łatwo jest rozpoznać szydełkowanie generowane przez AI (przynajmniej dla mnie). Jednak w przypadku Imagen 3 wydaje mi się, że staje się ono niesamowicie realistyczne, otwierając drzwi jeszcze większej liczbie osób, które padają ofiarą oszustw. A to tylko szydełkowanie…
Przyszłość Imagen 3
Pomimo możliwych obaw, Google ma ambitne plany dotyczące Imagen 3. Firma zamierza wypuścić wiele wersji modelu, z których każda będzie zoptymalizowana pod kątem konkretnych zadań. „Będziemy rozszerzać dostępność Imagen 3 w produktach Google, takich jak aplikacja Gemini i środowisko internetowe, Workspace, Ads i inne” — pisze Google. Ponadto funkcje takie jak inpainting i outpainting, popularne w Imagen 2, mają zostać zintegrowane z Imagen 3.
Ponieważ nie mieszkam w USA, narzędzie jest dla mnie nadal niedostępne do przetestowania osobiście. Ale jeśli jesteście naszymi czytelnikami z USA, możecie wypróbować je teraz za darmo i dajcie mi znać, co o tym myślicie.
[via The Verge; lead image generated with Google Bard]