Technologia

Nowy samodoskonalący się robot DeepMind szybko się dostosowuje i uczy nowych umiejętności

oen.pl

25 czerwca, 2023
4 min read

Nowy samodoskonalący się robot DeepMind szybko się dostosowuje i uczy nowych umiejętności

Pomimo szybkiego postępu w sztucznej inteligencji, roboty pozostają uparcie głupie. Ale nowe badania przeprowadzone przez DeepMind sugerują, że ta sama technologia, która stoi za dużymi modelami językowymi (LLM), może pomóc w stworzeniu bardziej adaptowalnych mózgów dla ramion robotów.

Chociaż autonomiczne roboty zaczęły wychodzić z laboratoriów do realnego świata, pozostają delikatne. Niewielkie zmiany w środowisku lub warunkach oświetleniowych mogą z łatwością zrzucić kontrolującą je sztuczną inteligencję, a modele te muszą zostać gruntownie przeszkolone w zakresie określonych konfiguracji sprzętowych, zanim będą mogły wykonywać przydatne zadania.

Stanowi to wyraźny kontrast z najnowszymi LLM, które okazały się biegłeT uogólnianie swoich umiejętności na szeroki zakres zadań, często w nieznanych im kontekstach. To spowodowało rosnące zainteresowanie sprawdzeniem, czy podstawowa technologia – architektura znana jako transformator – może doprowadzić do przełomu w robotyce.

W nowych wynikach, badacze Na Pokaz DeepMindwyd że sztuczna inteligencja oparta na transformatorze o nazwie RoboCat może nie tylko nauczyć się szerokiego zakresu umiejętności, ale może również łatwo przełączać się między różnymi ciałami robotów i zdobywać nowe umiejętności znacznie szybciej niż normalnie. Być może najważniejsze jest to, że jest w stanie przyspieszyć proces uczenia się, generując własne dane treningowe.

Warto przeczytać! RTRO uruchamia pozbawioną algorytmów aplikację społecznościową dla przyjaciół, twórców i marek

“Zdolność RoboCata do niezależnego uczenia się umiejętności i szybkiego samodoskonalenia, zwłaszcza w przypadku zastosowania do różnych urządzeń robotycznych, pomoże utorować drogę do nowej generacji bardziej pomocnych agentów robotów ogólnego przeznaczenia” – piszą naukowcy.ote w a post na blogu.

Nowa sztuczna inteligencja jest oparta na modelu Gato, który badacze DeepMind zaprezentowali w zeszłym miesiącu. Jego w stanie rozwiązywać różnorodne zadania, od napisów do obrazów po granie w gry wideo, a nawet sterowanie ramionami robotów. Wymagało to szkolenia w zakresie zróżnicowanego zestawu danych, w tym wszystkiego, od tekstu, przez obrazy, po dane dotyczące sterowania robotami.

Dla RoboCZespół stworzył jednak zestaw danych skoncentrowany w szczególności na wyzwaniach związanych z robotyką. Wygenerowali dziesiątki tysięcy demonstracji czterech różnych robotycznych ramion wykonujących setki różnych zadań, takich jak układanie kolorowych klocków we właściwej kolejności lub wybieranie właściwego owocu z kosza.

Demonstracje te zostały przeprowadzone zarówno przez ludzi teleoperujących ramionami robotów, jak i przez sztuczną inteligencję kontrolującą symulowane ramiona robotów w środowisku wirtualnym. Dane te zostały następnie wykorzystane do wytrenowania jednego dużego modelu.

Warto przeczytać! Apple Watch do przełomowych badań nad zdrowiem serca

Naukowcy zauważają jedną z głównych zalet architektury opartej na transformatorach artykuł opublikowany w dn arXiv, to zdolność do przyjmowania znacznie większej ilości danych niż poprzednie formy sztucznej inteligencji. IW podobny sposób szkolenie z wykorzystaniem ogromnej ilości tekstu umożliwiło LLM rozwinięcie ogólnych umiejętności językowych. TBadacze twierdzą, że byli w stanie stworzyć „ogólnego” agenta, który mógłby wykonywać szeroki zakres zadań robotyki przy użyciu różnych konfiguracji sprzętowych.

Co więcej, naukowcy wykazali, że model może również wykonywać nowe zadania, dostrajając od 100 do 1000 demonstracji ramienia robota sterowanego przez człowieka. To jest znaczney mniej demonstracje niż byłoby to normalnie wymagane do szkolenia w zakresie zadania, co sugeruje, że model opiera się na bardziej ogólnych umiejętnościach sterowania robotami, a nie rozpoczynaniu od zera.

“Ta zdolność pomoże przyspieszyć badania nad robotyką, ponieważ zmniejsza potrzebę szkolenia nadzorowanego przez człowieka i jest ważnym krokiem w kierunku stworzenia robota ogólnego zastosowania”, naukowcy wrote.

Co jednak najciekawsze, naukowcy zademonstrowali zdolność RoboCdo samodoskonalenia. Stworzyli kilka modeli spin-off, dostosowanych do konkretnych zadań, a następnie wykorzystali te modele do wygenerowania około 10 000 dodatkowych demonstracji zadania. Zostały one następnie dodane do istniejącego zestawu danych i wykorzystane do wyszkolenia nowej wersji RoboCat o ulepszonej wydajności.

Warto przeczytać! Apple dominuje w smartwatchach, ale stoi przed wyzwaniami

Kiedy pierwszej wersji RoboCata pokazano 500 demonstracji wcześniej niewidzianego zadania, udało mu się pomyślnie ukończyć je w 36 procentach przypadków. Ale po wielu rundach samodoskonalenia i szkolenia w zakresie nowych zadań liczba ta wzrosła ponad dwukrotnie do 74 procent.

Trzeba przyznać, że model nadal nie radzi sobie dobrze z niektórymi problemami, ze wskaźnikami sukcesu poniżej 50 procent w kilku zadaniach i punktacją zaledwie 13 procent w jednym. Ale zdolność RoboCat do radzenia sobie z wieloma różnymi wyzwaniami i szybkiego podejmowania nowych sugeruje, że bardziej elastyczne mózgi robotów mogą nie być tak daleko.

Źródło obrazu: DeepMind

Źródło