Technologia

Poznaj DragGAN, nowe narzędzie do edycji AI, które pozwala na obróbkę zdjęć za pomocą prostych elementów sterujących przeciąganiem

  • 20 maja, 2023
  • 3 min read
Poznaj DragGAN, nowe narzędzie do edycji AI, które pozwala na obróbkę zdjęć za pomocą prostych elementów sterujących przeciąganiem


Wyobraź sobie świat, w którym każdy mógłby nauczyć się Photoshopa, ale bez konieczności zajmowania się technicznymi kwestiami z nim związanymi. Nowe narzędzie, które wykorzystuje moc generatywnej sztucznej inteligencji, pozwala ludziom właśnie to zrobić. Poznaj DragGAN, przyjazne dla użytkownika narzędzie, które umożliwia dokonywanie znaczących zmian w obrazach za pomocą prostych elementów sterujących wskaż i przeciągnij.

Jak opisano w artykule naukowców z Google, Max Planck Institute of Informatics i MIT CSAIL, DragGAN umożliwia użytkownikom upuszczenie punktu na obrazie, zmieniając strukturę i całe piksele. To odróżnia go od innych popularnych generatywnych narzędzi AI, takich jak Dall-E i Midjourney, które, choć są w stanie przetwarzać bardzo szczegółowe monity, nie mogą precyzyjnie generować pożądanych póz lub układów.


Przykłady w artykule przedstawiają obraz lwa, którego paszcza jest zamknięta, zmanipulowana tak, aby miała otwartą paszczę, zdjęcie samochodu zmienione tak, że wydaje się, że jest sfotografowane z zupełnie innego kąta, oraz góra rozciągnięta do dwukrotnie większej wysokości. Pomimo tak znaczących zmian, obraz nadal wygląda jak prawdziwy dzięki sile generatywnej sztucznej inteligencji.

Warto przeczytać!  Genshin Impact w wersji 3.4: Oto szacunkowa lista wszystkich „darmowych Primogemów”, które możesz zdobyć tym razem

Oprócz imponujących możliwości, dokument badawczy DragGAN podkreśla największą zaletę narzędzia – prostotę i intuicyjność jego interfejsu. W ciągu kilku sekund użytkownicy mogą pojąć funkcjonalność bez konieczności poznawania technologii.

Interfejs polega na dodawaniu punktu początkowego i końcowego do obrazu. Na przykład, aby wywołać uśmiech na twarzy osoby, użytkownicy mogą dodać dwa punkty w kącikach ust i dwa dodatkowe punkty nieco dalej. Naciśnij przycisk Start, a narzędzie w animowany sposób rozszerzy usta od punktów początkowych do końcowych.

Tymczasem generatywna sztuczna inteligencja radzi sobie z wszelkimi lukami, które mogą się pojawić, zachowując realizm. „Nasze podejście może wywołać halucynacje zasłoniętej treści, jak zęby w paszczy lwa, i może odkształcić się pod wpływem sztywności obiektu, jak zgięcie nogi konia” — zauważono w artykule badawczym.

DragGAN oferuje również funkcję maskowania, która pozwala użytkownikom wyróżnić określone części obrazu, które chcą zmienić, pozostawiając resztę nietkniętą.

Ale czym różni się to narzędzie od istniejących narzędzi do edycji zdjęć, które mogą zmieniać mimikę twarzy i inne funkcje, możesz zapytać. Oprócz tego, jak dobrze narzędzie pozornie radzi sobie z edycją, wyróżnia się, umożliwiając użytkownikom zmianę kąta, z którego zrobione jest zdjęcie. Aplikacje do edycji, takie jak Snapseed, pozwalają dostosować „Perspektywę”, ale to tylko korekcja zniekształceń w grze. Tymczasem DragGAN symuluje dane obrazu, inteligentnie generując piksele z powietrza, wypełniając luki, które w przeciwnym razie wymagałyby dużo pracy w Photoshopie, aby odświeżyć je do perfekcji.

Warto przeczytać!  Samsung Electronics przedstawia Samsung Health Stack 1.0 – Samsung Global Newsroom

Podsumowując, DragGAN może pomóc rozwiązać największą wadę narzędzi do generowania obrazów – ich losowy charakter. Jeśli DragGAN zostanie sparowany z narzędziami do generowania obrazu, użytkownicy będą mogli uzyskać wyniki bliższe obrazowi, który mają na myśli. Narzędzie jest obecnie tylko wersją demonstracyjną, ale jego zastosowania będą interesujące, gdy stanie się publicznie dostępne.


Źródło