Technologia

Apple przedstawia OpenELM, modele języka open source przeznaczone do zadań na urządzeniu | Wiadomości technologiczne

  • 25 kwietnia, 2024
  • 3 min read
Apple przedstawia OpenELM, modele języka open source przeznaczone do zadań na urządzeniu |  Wiadomości technologiczne


Nawet gdy giganci technologiczni starają się przewodzić wyścigowi zbrojeń AI, Apple działa powoli. Tak jednak nie jest, Apple od dawna pracuje nad sztuczną inteligencją. Ponieważ marka jest synonimem tajemnicy, niewiele wiadomo o jej wielkich planach. Jednak niedawno firma Apple wprowadziła generatywny model sztucznej inteligencji o nazwie OpenELM, który według doniesień przewyższa kilka innych modeli językowych wytrenowanych na publicznych danych.

OpenELM to rodzina małych modeli języków open source zaprojektowanych do wydajnego działania na urządzeniach takich jak iPhone i Mac. Apple twierdzi, że OpenELM to najnowocześniejszy model językowy, który wykorzystuje strategię skalowania warstwowego w celu wydajnego przydzielania parametrów w każdej warstwie modelu transformatora, co zapewnia większą dokładność. Podobno OpenELM składa się z ośmiu modeli z czterema różnymi rozmiarami parametrów – 270M, 450M, 1.1B i 3B – z których wszystkie są szkolone na publicznych zbiorach danych.

Co to jest OpenELM?

Według doniesień rodzina modeli jest zoptymalizowana do użytku na urządzeniu, co pozwala na wykonywanie zadań opartych na sztucznej inteligencji bez polegania na serwerach w chmurze. Według doniesień OpenELM przewyższa podobne modele open source, takie jak OLMo, mimo że wymaga 2 razy mniej danych szkoleniowych. Według doniesień OpenELM był szkolony w CoreNet, bibliotece open source, wraz z innymi modelami, które umożliwiają „efektywne wnioskowanie i dostrajanie na urządzeniach Apple”.

Warto przeczytać!  iOS 17 już wkrótce na iPhone'y i podobno zawiera te 8 nowych funkcji

„Odbiegając od wcześniejszych praktyk, które zapewniały jedynie wagi modeli i kod wnioskowania oraz wstępne uczenie na prywatnych zbiorach danych, nasza wersja zawiera pełną platformę do uczenia i ewaluacji modelu językowego na publicznie dostępnych zbiorach danych, w tym dzienniki szkoleniowe, wiele punktów kontrolnych i wstępne -konfiguracje szkoleniowe. Udostępniamy także kod do konwersji modeli do biblioteki MLX w celu wnioskowania i dostrajania na urządzeniach Apple. Celem tej kompleksowej publikacji jest wzmocnienie pozycji społeczności otwartych badaczy i utorowanie drogi przyszłym wysiłkom w zakresie otwartych badań naukowych” – czytamy w artykule badawczym udostępnionym przez firmę Apple.

Premiera nastąpi na kilka tygodni przed czerwcową WWDC, podczas której Apple prawdopodobnie zadebiutuje ze swoim systemem iOS 18. Oczekuje się, że najnowsza wersja mobilnego systemu operacyjnego firmy Apple będzie zawierać zbiór nowych funkcji sztucznej inteligencji. Jednak wydanie OpenELM daje wgląd w to, co dzieje się za kulisami.

Oferta świąteczna

Wygląda na to, że giganci technologiczni zaczynają podążać za trendem małych modeli, począwszy od Microsoftu z modelami Phi-3 po OpenELM firmy Apple. Najnowsza wersja Apple pokazuje, w jaki sposób gigant technologiczny może w przyszłości wykorzystywać sztuczną inteligencję na urządzeniach. Innym godnym uwagi aspektem jest to, że Apple udostępniło tę wersję o otwartym kodzie źródłowym, co stanowi wyraźny zwrot w stosunku do wcześniej restrykcyjnych i tajnych sposobów Apple.

Warto przeczytać!  Microsoft Copilot może teraz zastąpić Asystenta Google




Źródło