Fotografia

Nowy i ulepszony generator obrazów Imagen 3 AI firmy Google jest niesamowicie realistyczny

  • 20 sierpnia, 2024
  • 4 min read
Nowy i ulepszony generator obrazów Imagen 3 AI firmy Google jest niesamowicie realistyczny


obraz 3

Google po cichu wydało ulepszony generator tekstu do obrazu Imagen 3. Dostępny dla użytkowników z USA, obiecuje znaczący skok jakości obrazu i szczegółowości. A sądząc po przykładach… boję się, jak dobry jest.

Po raz pierwszy zaprezentowany na Google I/O w maju, Imagen 3 jest teraz dostępny za pośrednictwem AI Test Kitchen firmy. Według Google, nowy model oferuje „jeszcze lepsze szczegóły, bogatsze oświetlenie i mniej rozpraszających artefaktów” niż poprzednie modele firmy.

Podobnie jak konkurenci, Imagen 3 przekształca tekstowe podpowiedzi w obrazy. Możesz również edytować istniejące obrazy z precyzją, dzięki zdolności narzędzia do rozumienia i modyfikowania określonych elementów. Podczas gdy Google wdrożyło zabezpieczenia, aby zapobiec generowaniu szkodliwych lub wprowadzających w błąd treści, takich jak obrazy osób publicznych lub broni, kreatywność modelu nadal jest imponująca.

„Zaprojektowaliśmy Imagen 3 tak, aby generował wysokiej jakości obrazy w szerokiej gamie formatów i stylów, od fotorealistycznych krajobrazów po obrazy olejne o bogatej fakturze i fantazyjne sceny z animacji poklatkowej” – wyjaśnia Google.

Możliwe obawy

Warto zauważyć, że podejście Imagen 3 do moderowania treści różni się od podejścia innych platform. Na przykład nie możesz po prostu wygenerować obrazu modlącego się Trumpa. Jednak narzędzie może generować obrazy przypominające chronione prawem autorskim postacie i słynne loga, jeśli wiesz, co jest zachętą do użycia. Ludzie z The Verge stworzyli obraz „kreskówkowego niebieskiego jeża biegnącego po polu”, a Imagen 3 zwrócił obraz Sonica the Hedgehog. Podczas gdy Google przyjmuje bardziej ostrożne podejście niż jego konkurenci, oczywiste jest, że nadal można ominąć ograniczenia.

Warto przeczytać!  Fotografia techniczna czy kreatywna? Dlatego potrzebujesz obu

Jeśli chodzi o realizm obrazu, oto przykład, który wydał mi się szczególnie interesujący – i niepokojący, ponieważ jestem szydełkarką. Pojawił się wzrost liczby obrazów szydełkowych generowanych przez AI, po których pojawiły się fałszywe wzory. Pinterest jest nimi wypełniony, a co gorsza – oszuści sprzedają te fałszywe wzory na Etsy. Ale nadal łatwo jest rozpoznać szydełkowanie generowane przez AI (przynajmniej dla mnie). Jednak w przypadku Imagen 3 wydaje mi się, że staje się ono niesamowicie realistyczne, otwierając drzwi jeszcze większej liczbie osób, które padają ofiarą oszustw. A to tylko szydełkowanie…

obraz 3obraz 3
Źródło obrazu: Google, wygenerowane za pomocą Imagen 3

Przyszłość Imagen 3

Pomimo możliwych obaw, Google ma ambitne plany dotyczące Imagen 3. Firma zamierza wypuścić wiele wersji modelu, z których każda będzie zoptymalizowana pod kątem konkretnych zadań. „Będziemy rozszerzać dostępność Imagen 3 w produktach Google, takich jak aplikacja Gemini i środowisko internetowe, Workspace, Ads i inne” — pisze Google. Ponadto funkcje takie jak inpainting i outpainting, popularne w Imagen 2, mają zostać zintegrowane z Imagen 3.

Ponieważ nie mieszkam w USA, narzędzie jest dla mnie nadal niedostępne do przetestowania osobiście. Ale jeśli jesteście naszymi czytelnikami z USA, możecie wypróbować je teraz za darmo i dajcie mi znać, co o tym myślicie.

Warto przeczytać!  Nowy Google Pixel 9 może zniszczyć fotografię na zawsze!

[via The Verge; lead image generated with Google Bard]




Źródło