Fotografia

Sora kontra YouTube – Używanie treści YouTube do szkolenia Sory narusza Warunki korzystania z YouTube

  • 5 kwietnia, 2024
  • 6 min read
Sora kontra YouTube – Używanie treści YouTube do szkolenia Sory narusza Warunki korzystania z YouTube


OpenAI kontra Google / Sora kontra YouTube

Ostatnio dużo mówi się o Sorze i nie bez powodu. Budzi to wiele kontrowersji na wielu frontach. Niektórzy martwią się, że stanowiska pracy staną się przestarzałe, inni natomiast martwią się sposobem szkolenia.

OpenAI twierdzi, że „nie jest pewne”, czy Sora jest szkolony na filmach na YouTube. Jednak w wywiadzie dla Bloomberga dyrektor generalny YouTube Neal Mohan nie krył się. Mówi, że wykorzystywanie filmów z YouTube do szkolenia modeli AI byłoby naruszeniem Warunków korzystania z usługi.

Film z YouTube'aFilm z YouTube'a

Sora z OpenAI kontra YouTube

Sora wydaje się być obecnie najchętniej omawianą rzeczą w Internecie, zwłaszcza od czasu opublikowania najnowszej partii przykładów. Wykorzystano go nawet do stworzenia teledysku. Przeszliśmy od skupiania się na dużych modelach językowych (LLM), takich jak ChatGPT, i narzędziach do generowania pojedynczych obrazów, takich jak Midourney i DALL-E, i przeszliśmy do wideo.

Ale jak Sora jest szkolony? OpenAI to firma, która od jakiegoś czasu nękana jest kontrowersjami. Firma złożyła przeciwko niej pozwy za rzekome szkolenie różnych modelek w oparciu o prywatne dane i skradzione zdjęcia.

Wygląda na to, że kontrowersje w sprawie Sory powróciły. To firmowe narzędzie AI do generowania wideo. I przebył bardzo długą drogę w bardzo krótkim czasie – przynajmniej publicznie. Ale czy szkolił swoje modele na treściach wideo w YouTube?

CTO OpenAI nie ma pojęcia, co robi

W wywiadzie udzielonym w zeszłym miesiącu CTO OpenAI Mira Murati powiedziała, że ​​Sora będzie dostępna publicznie w pewnym momencie w 2024 r. Zapytana konkretnie, na jakich danych modelka była szkolona, ​​„Wall Street Journal” donosi, że stała się wymijająca i nie wdać się w szczegóły.

Nie będę wdawał się w szczegóły danych, które zostały wykorzystane, ale były to dane publicznie dostępne lub licencjonowane

Mira Murati

Potwierdziła, że ​​korzystała z treści pochodzących z Shutterstock, z którym współpracuje. Jednak po naciśnięciu powiedziała, że ​​nie wie, czy przeszkolono ją na treściach wideo z YouTube, Facebooka i Instagrama.

Nazwijcie mnie starym cynikiem, ale według mnie brzmi to tak, jakby ona doskonale znała odpowiedź, a oni absolutnie wykorzystali filmy z YouTube, Facebooka i Instagrama do szkolenia swoich modelek. Oczywiście to tylko moja opinia.

Dyrektor generalny YouTube twierdzi, że jest to stuprocentowe naruszenie warunków korzystania z usługi

W opublikowanym wczoraj wywiadzie dla Bloomberga dyrektor generalny YouTube Neal Mohan został zapytany, czy może potwierdzić, czy OpenAI wykorzystuje treści YouTube do szkolenia swoich modeli. Mówi, że też nie wie.

Dając mu korzyść w postaci wątpliwości, jak mógł? Nie pracuje dla OpenAI i gdyby OpenAI chciało ukryć swoją aktywność na YouTube, przy pomocy niektórych VPN nie byłoby trudno anonimowo pobrać dane wideo. Nie twierdzę, że OpenAI tego dokonało, po prostu hipotetycznie jest to możliwe.

Powiedział jednak, że widział raporty stwierdzające, że mógł on zostać użyty lub nie. Powiedział również, że jeśli OpenAI wykorzystuje treści wideo YouTube do szkolenia swoich modeli, stanowi to naruszenie warunków korzystania z usługi YouTube (TOS).

Mamy jasne warunki świadczenia usług, które mówią, że kiedy… no wiesz… znowu, z perspektywy twórcy, kiedy twórca przesyła swoją, no wiesz, swoją ciężką pracę na naszą platformę, ma pewne oczekiwania. Jednym z tych oczekiwań jest to, że warunki świadczenia usług będą przestrzegane.

Neala Mohana

Wyraźnie był trochę nieprzygotowany na to pytanie i nie wiedział, jak na nie odpowiedzieć. Na pytanie, czy Google trenuje własną sztuczną inteligencję Gemini (dawniej Bard) na danych YouTube, odpowiedź była nieco bardziej niejasna. Mówi, że obowiązują ich te same warunki świadczenia usług, co OpenAI czy każdy inny użytkownik YouTube, chociaż szkolili się na niektórych danych YouTube.

Mówią, że dane te zostały zebrane na podstawie indywidualnych umów z określonymi twórcami na platformie lub w ramach Warunków korzystania z YouTube – które w przypadku YouTube/Google różnią się od wszystkich innych. Przyjrzyjmy się Warunkom korzystania z YouTube lub przynajmniej częściom, które mogą być tutaj istotne.

Prawa, które przyznajesz
Zachowujesz wszystkie swoje prawa własności do swoich Treści. Krótko mówiąc, to, co należy do ciebie, pozostaje twoje. Wymagamy jednak przyznania YouTube i innym użytkownikom Usługi pewnych praw, zgodnie z opisem poniżej.

Licencja na YouTube
Dostarczając Treści do Usługi, udzielasz YouTube ogólnoświatowej, niewyłącznej, wolnej od opłat, zbywalnej i podlegającej sublicencjonowaniu licencji na korzystanie z tej Treści (w tym jej powielanie, rozpowszechnianie, modyfikowanie, wyświetlanie i wykonywanie) w celu obsługi, promowanie i ulepszanie Usługi.

Zasadniczo mówi, że kiedy przesyłasz treści do YouTube, YouTube może zrobić z nimi, co chce, pod warunkiem, że służy to obsłudze, promowaniu lub ulepszaniu usług oferowanych przez YouTube.

Teraz znowu, hipotetycznie, Google może argumentować, że Gemini – lub jakakolwiek inna sztuczna inteligencja, nad którą pracuje – jest tworzona, aby pomóc ulepszyć usługę oferowaną przez YouTube. Trzeba by to sprawdzić w sądzie, ale oznacza to, że tak, pozwalasz im używać Twoich filmów do szkolenia Google Gemini, jeśli się na to zdecydują.

TL; DR – OpenAI nie może, YouTube może

Krótko mówiąc, jeśli OpenAI trenuje swoje modele na danych YouTube, OpenAI łamie Warunki korzystania z YouTube. Jeśli Google używa go do szkolenia Bliźniąt, Google/YouTube nie – ze względu na to, co im zapewniamy, gdy przesyłamy.

Tak czy inaczej, nie wygląda na to, aby sytuacja w zakresie praw autorskich miała się w najbliższej przyszłości wyjaśnić. A zanim zostaną złożone pozwy i wejdą w życie nowe przepisy, i tak będzie już zdecydowanie za późno, aby cokolwiek z tym zrobić.

Każdy z odpowiednich modeli będzie miał więcej niż wystarczającą ilość danych, aby zrobić to, co musi. Prawdopodobnie zobaczymy więcej pozwów zbiorowych. Być może na sali sądowej zobaczymy nawet bitwy technologiczne w wadze ciężkiej.

Jeśli jednak nie chcesz, aby Twoje treści wideo były wykorzystywane do uczenia modeli sztucznej inteligencji, nie publikuj ich w Internecie.

[via The Verge]




Źródło

Warto przeczytać!  DJI wprowadza wydajność 8K/75p do Ronina 4D z kamerą Zenmuse X9-8K: Przegląd fotografii cyfrowej