Technologia

Jak Spotify zbudował DJ-a AI

  • 13 marca, 2023
  • 4 min read
Jak Spotify zbudował DJ-a AI


Dla Spotify stworzenie DJ-a ze sztuczną inteligencją, które 22 lutego zostało uruchomione w wersji beta dla subskrybentów Premium w USA i Kanadzie, stanowi zwieńczenie tego, nad czym firma pracowała od lat.

„To zawsze była gwiazda polarna” — mówi Ziad Sultan, wiceprezes ds. personalizacji w Spotify Różnorodność. DJ służy jako kurator, analizując aktywność użytkowników, aby odtwarzać utwory, które już lubią, i oferując rekomendacje dotyczące nowej muzyki. Zapewnia również komentarz i kontekst tła dla odtwarzanych utworów i wykonawców. Listy odtwarzania, takie jak Discover Weekly, która przekazuje użytkownikom rekomendacje na podstawie ich aktywności słuchania, lub Spotify Wrapped, która gromadzi najczęściej odtwarzane utwory użytkowników pod koniec roku, naśladują niektóre funkcje AI DJ, ale nowo zadebiutowany produkt służy jako ucieleśnienie tego, co według Sułtana było do tej pory „metaforą” firmy.

Proces tworzenia DJ-a polegał na zebraniu kilku głównych elementów. Technologia personalizacji firmy, a także mechanizm przetwarzania tekstu na mowę AI z niedawnego przejęcia Sonantic i technologia OpenAI stanowiły podstawę produktu. Dodaj głos Xaviera „X” Jernigana, szefa ds. partnerstw kulturalnych Spotify, a także pracę w pokoju pisarzy kierowanym przez Sulinnę Ong, a narodzi się AI DJ.

Warto przeczytać!  Apple zatwierdza aplikację Epic Games Marketplace w Europie Autor: Reuters

Jernigan, weteran branży muzycznej, który pracował w marketingu dla Universal, Sony i Def Jam przed dołączeniem do Spotify w 2016 roku, wcześniej był gospodarzem podcastów Spotify „Showstopper” i „The Get Up”. Zepsuł szkolenie dla DJ-a AI: „Miałem ze sobą reżyserów na sesjach, aby upewnić się, że brzmię jak ja. Następnie wymyślali rzeczy, na których, jak wiemy, musieliśmy się skupić, aby wyszkolić model”. Dodatkowo jego klipy głosowe zostały usunięte z „The Get Up”, a następnie przesłane do modelu.

Z DJ-em chciał wykorzystać kilka różnych cech: „Rzeczy, o których rozmawialiśmy, są przyjazne. Powiązany, jak twój kumpel. Wiedzący, ale nie arogancki”.

Proces tworzenia DJ-a obejmował również zorganizowanie cotygodniowego pokoju scenarzystów, aby napisać scenariusz tego, co powie DJ. Ong, globalny szef redakcji, mówi, że scenarzyści spędzają czas na myśleniu o aktualnych tematach, od wydarzeń z kalendarza po sensacje kulturowe oparte na popkulturze. „Trendy lub nawyki słuchania są dość przewidywalne” – mówi. „Niezależnie od tego, czy to Boże Narodzenie, czy Walentynki, i myślisz o takich momentach tematycznych i kalendarzowych. Powiedzmy, że gdybyśmy mieli w tej chwili na antenie „Stranger Things” lub „The Last of Us”, wiemy, że będzie zainteresowanie tymi piosenkami. To są rzeczy, o których rozmawiamy w pokoju scenarzystów — aktualne momenty”.

Warto przeczytać!  Utajona dyfuzja w długim kontekście upraszcza wysokiej jakości zamianę tekstu na muzykę

Innym czynnikiem jest doskonalenie głosu DJ-a, który w dużej mierze opiera się na stylu konwersacji Jernigana. „Kiedy myślisz o głosach AI, myślisz o czymś, co będzie całkiem robotyczne” – mówi. „X naprawdę ma osobowość w swoim głosie, którą można usłyszeć. Kiedy piszemy coś w pokoju scenarzystów, myślimy przede wszystkim o kontekście i znaczeniu kulturowym. Wtedy X wejdzie i majstruje przy tym, aby upewnić się, że jest to jego własnym głosem”.

Ong ma nadzieję, że w przyszłości Spotify rozważy możliwość dodania wielu głosów.

AI DJ był w centrum uwagi podczas wydarzenia Stream On w Spotify 8 marca, kiedy to firma zadebiutowała swoim nowym interfejsem użytkownika i ogłosiła nowe partnerstwa na wyłączność. Według danych firmy od 22 lutego do 1 marca użytkownicy, którzy mają dostęp do DJ-a, poświęcili mu jedną czwartą swojego czasu słuchania, a ponad połowa słuchaczy, którzy słuchają go po raz pierwszy, ponownie korzysta z produktu następnego dnia.

Analiza VIP+: czego AI DJ może nauczyć streamerów wideo




Źródło