Technologia

Meta open source, generator muzyki oparty na sztucznej inteligencji

  • 12 czerwca, 2023
  • 4 min read
Meta open source, generator muzyki oparty na sztucznej inteligencji


Kredyty obrazkowe: Bryce’a Durbina / TechCrunch

Aby nie zostać prześcigniętym przez Google, Meta wydała własny generator muzyki oparty na sztucznej inteligencji – i, w przeciwieństwie do Google, udostępniła go jako open source.

Nazywane MusicGen, narzędzie Meta do generowania muzyki, którego wersję demonstracyjną można znaleźć tutaj, może zamienić opis tekstowy (np. daj albo bierz. MusicGen można opcjonalnie „sterować” za pomocą dźwięku referencyjnego, takiego jak istniejąca piosenka, w którym to przypadku spróbuje podążać zarówno za opisem, jak i melodią.

Meta mówi, że MusicGen został przeszkolony w zakresie 20 000 godzin muzyki, w tym 10 000 „wysokiej jakości” licencjonowanych utworów muzycznych i 390 000 utworów zawierających tylko instrumenty z ShutterStock i Pond5, dużej biblioteki multimediów. Firma nie dostarczyła kodu, którego użyła do trenowania modelu, ale tak ma udostępnił wstępnie wytrenowane modele, które może uruchomić każdy, kto ma odpowiedni sprzęt — głównie procesor graficzny z około 16 GB pamięci.

Warto przeczytać!  Wyciekły specyfikacje aparatu Google Pixel z serii 8; Nowe, większe czujniki i funkcje oprogramowania

Jak działa MusicGen? Cóż, powiedziałbym – choć z pewnością nie na tyle dobrze, by pozbawić ludzkich muzyków pracy. Jego piosenki są dość melodyjne, przynajmniej w przypadku podstawowych wskazówek, takich jak „muzyka chiptunów otoczenia” i – dla moich uszu – na równi (jeśli nie nieco lepiej) z wynikami generatora muzyki Google AI, MusicLM. Ale nie zdobędą żadnych nagród.

Oto dane wyjściowe z MusicGen dla „muzyki z windą jazzową”:

A oto ujęcie MusicLM:

Następnie podałem bardziej skomplikowaną zachętę, aby spróbować rzucić MusicGen na pętlę: „Lo-fi slow BPM electro chill z organicznymi samplami”. MusicGen zaskakująco przyćmił MusicLM pod względem spójności muzycznej, tworząc coś, co z łatwością znalazłoby dom w Lofi Girl.

Oto próbka MusicGen:

A oto MusicLM:

Aby nieco zmienić sytuację, spróbowałem użyć obu narzędzi do wygenerowania piosenki fortepianowej w stylu George’a Gershwina. Mówię „próbowałem”, ponieważ w celu zapobieżenia problemom z prawami autorskimi związanymi z generatywnymi narzędziami muzycznymi Google zaimplementował filtr w publicznej wersji MusicLM, który blokuje podpowiedzi dotyczące konkretnych artystów.

MusicGen nie ma takiego filtra. Ale wyniki dla „Muzyki fortepianowej w tle w stylu Gershwina” pozostawiały wiele do życzenia, muszę powiedzieć:

Warto przeczytać!  Seria Galaxy S21 otrzymuje aktualizację zabezpieczeń z maja 2024 r

Wyraźnie poprawia się muzyka generatywna (patrz Riffusion, Dance Diffusion i Jukebox OpenAI). Ale główne kwestie etyczne i prawne nie zostały jeszcze rozwiązane. Sztuczna inteligencja, taka jak MusicGen, „uczy się” na podstawie istniejącej muzyki, aby uzyskać podobne efekty, z czym nie wszyscy artyści — lub generatywni użytkownicy sztucznej inteligencji — czują się komfortowo.

Coraz częściej domowe utwory, które wykorzystują generatywną sztuczną inteligencję do wyczarowywania znajomych dźwięków, które można uznać za autentyczne lub przynajmniej wystarczająco bliskie, stają się wirusowe. Wytwórnie muzyczne szybko zgłaszały je partnerom streamingowym, powołując się na obawy związane z własnością intelektualną – i generalnie wygrywały. Nadal jednak nie ma jasności co do tego, czy muzyka „deepfake” narusza prawa autorskie artystów, wytwórni i innych posiadaczy praw.

Być może niedługo pojawią się wytyczne w tej sprawie. Kilka procesów sądowych toczących się przez sądy prawdopodobnie będzie miało wpływ na sztuczną inteligencję do generowania muzyki, w tym jeden dotyczący praw artystów, których praca jest wykorzystywana do szkolenia systemów sztucznej inteligencji bez ich wiedzy i zgody.

Warto przeczytać!  HyperOS Xiaomi na pierwszy rzut oka przypomina MIUI [Gallery]

Ze swojej strony Meta, która nie nakłada ograniczeń na sposób korzystania z MusicGen, mówi, że cała muzyka, z której MusicGen był szkolony, była „objęta umowami prawnymi z posiadaczami praw”, w tym umową z Shutterstock.






Źródło