Technologia

Apple przedstawia technologię klonowania głosu na urządzeniu — Twój własny klon głosu w zaledwie 15 minut

  • 20 maja, 2023
  • 3 min read
Apple przedstawia technologię klonowania głosu na urządzeniu — Twój własny klon głosu w zaledwie 15 minut


Apple ma wprowadzić szereg nowych funkcji ułatwień dostępu dla swoich urządzeń, w tym iPhone’ów, iPadów i komputerów Mac, jeszcze w tym roku. Jedna z tych funkcji, Personal Voice, ma na celu pomóc osobom mającym trudności z wyraźnym lub pewnym mówieniem. Dzięki bezpłatnej aktualizacji oprogramowania użytkownicy mogą wpisywać wiadomości lub zamówienia na swoich iPhone’ach i słyszeć głos lub podobny głos wypowiadający je na głos.

Personal Voice eliminuje potrzebę instalowania dodatkowych aplikacji lub kont i umożliwia użytkownikom zapisywanie często używanych zdań lub fraz jako skrótów do szybkiego odtwarzania. Ta funkcja pomaga w rozmowach twarzą w twarz i integruje dźwięk mówiony z rozmowami telefonicznymi i FaceTime.

Użytkownicy mogą stworzyć model Personal Voice, aby uzyskać bardziej spersonalizowany głos. Wiąże się to z dostarczeniem około 15 minut próbek mówionych, które można wygodnie wypełnić. Następnie urządzenie przetwarza próbki przez noc, umożliwiając użytkownikom pisanie wiadomości i odsłuchiwanie ich w swoim głosie.

? Sprawdź narzędzia sztucznej inteligencji firmy 100 w naszym klubie narzędzi sztucznej inteligencji

Warto zauważyć, że model Personal Voice jest domyślnie specyficzny dla urządzenia. Proces uczenia należy powtórzyć, aby używać modelu na innych urządzeniach, chyba że udzielono wyraźnej zgody na udostępnianie go na różnych urządzeniach.

Warto przeczytać!  Top 5 społecznych gier dedukcyjnych, w które warto zagrać w 2023 roku

Kolejna funkcja ułatwień dostępu, Assistive Access, jest przeznaczona dla osób z upośledzeniem funkcji poznawczych. Upraszcza interfejs użytkownika, usuwając niepotrzebne elementy wizualne, umożliwiając bezpośrednią interakcję z iPhonem lub iPadem. Na przykład ulubione kontakty można skonfigurować w celu szybkiego dostępu do połączeń głosowych lub wideo, usprawniając proces nawiązywania połączeń. Dostęp wspomagający zapewnia również uproszczoną obsługę wiadomości.

Aplikacja Apple Magnifier będzie zawierać funkcję o nazwie Point and Speak. Ta funkcja wykorzystuje wbudowany czujnik Lidar urządzenia do odczytywania tekstu, gdy użytkownik wskazuje go palcem za pomocą aparatu aplikacji. Może być używany do odczytywania małego tekstu na przyciskach kuchenki mikrofalowej. Jednak Point and Speak będzie dostępny tylko na urządzeniach Apple z czujnikiem lidar, który jest obecnie dostępny wyłącznie dla iPhone’ów i iPadów Pro firmy.

Oficjalna data premiery tych nowych funkcji ułatwień dostępu nie jest znana, ale zazwyczaj zbiega się to z jesienną premierą nowych wersji iOS, iPadOS i oprogramowania macOS. Te funkcje mają na celu zwiększenie dostępności i integracji urządzeń Apple, umożliwiając osobom z zaburzeniami mowy lub zaburzeniami poznawczymi łatwiejszą interakcję ze światem i skuteczną komunikację.

Warto przeczytać!  Jak zmniejszyć wizualny odrzut w sezonie 1 Reloaded

Sprawdź Artykuł referencyjny. Nie zapomnij dołączyć nasz 21k+ ML SubReddit, Kanał DiscordaI Biuletyn e-mailowy, gdzie dzielimy się najnowszymi wiadomościami z badań nad sztuczną inteligencją, fajnymi projektami AI i nie tylko. Jeśli masz jakiekolwiek pytania dotyczące powyższego artykułu lub jeśli coś przeoczyliśmy, napisz do nas na adres Asif@marktechpost.com

? Sprawdź narzędzia AI 100 w AI Tools Club

Niharika jest stażystką ds. doradztwa technicznego w Marktechpost. Jest studentką trzeciego roku, obecnie kontynuuje naukę na B.Tech w Indyjskim Instytucie Technologii (IIT) w Kharagpur. Jest bardzo entuzjastyczną osobą, która żywo interesuje się uczeniem maszynowym, nauką o danych i sztuczną inteligencją oraz zapalonym czytelnikiem najnowszych osiągnięć w tych dziedzinach.

➡️ Poznaj Bright Data: internetową platformę danych nr 1 na świecie


Źródło