Korzystanie z Gemini AI w aplikacjach na Androida z nowym pakietem SDK Google AI
Google wprowadziło nowy zestaw SDK Google AI, aby uprościć integrację Gemini Pro, jego najlepiej działającego jak dotąd modelu, z aplikacjami na Androida. Korzystając z tego pakietu SDK, programiści nie muszą budować własnej infrastruktury zaplecza ani nią zarządzać.
Według Google Gemini Pro to ich najlepszy model z funkcjami do szerokiego zakresu zadań związanych z wnioskowaniem tekstu i obrazu. Gemini Pro działa poza urządzeniem, w centrach danych Google i można uzyskać do niego dostęp za pośrednictwem interfejsu API Gemini. Google twierdzi, że najłatwiejszym sposobem wykorzystania Gemini jest Google AI Studio, narzędzie internetowe, które umożliwia prototypowanie i uruchamianie podpowiedzi w przeglądarce. Gdy wyniki będą zadowalające, możesz wyeksportować swój model do kodu i używać go w preferowanym języku, na przykład Pythonie, działającym na Twoim zapleczu.
W przypadku aplikacji na Androida Google udostępnia pakiet SDK klienta Google AI dla Androida, który łączy interfejs API REST Gemini w idiomatyczny interfejs API Kotlin. Dzięki niemu programiści nie będą musieli bezpośrednio pracować z interfejsem API REST ani wdrażać usługi po stronie serwera umożliwiającej dostęp do modeli Gemini w aplikacjach na Androida.
Poniższy fragment pokazuje, jak wygenerować tekst z podpowiedzi tekstowej za pomocą pakietu Google AI SDK:
val generativeModel = GenerativeModel(
modelName = "gemini-pro",
apiKey = BuildConfig.apiKey
)
val prompt = "Write a story about a magic backpack."
val response = generativeModel.generateContent(prompt)
print(response.text)
Oprócz modelu tekstowego Gemini udostępnia również model multimodalny umożliwiający generowanie tekstu na podstawie wprowadzonego tekstu i obrazu (gemini-pro-vision
) i obsługuje przesyłanie strumieniowe w celu szybszych interakcji. W tym przypadku użyłbyś generateContentStream
zamiast generateContent
jak pokazano niżej:
var fullResponse = ""
generativeModel.generateContentStream(inputContent).collect { chunk ->
print(chunk.text)
fullResponse += chunk.text
}
Aby jeszcze bardziej uprościć pracę programistów, najnowsza wersja zapoznawcza Android Studio wprowadza nowy szablon projektu, który poprowadzi programistów przez kroki wymagane do korzystania z Gemini Pro, zaczynając od wygenerowania klucza API w Google AI Studio.
Oprócz Gemini Pro Google udostępnia także mniejszy model Gemini Nano, który można uruchomić na urządzeniu. Umożliwia to zastosowanie aplikacji, w których dane nigdy nie powinny opuszczać urządzenia, i zapewnia przewidywalne opóźnienia, nawet gdy sieć nie jest dostępna. Gemini Nano jest dostępny na wybranych urządzeniach za pośrednictwem AICore – nowej usługi systemowej dla Androida 14, której celem jest uproszczenie włączania sztucznej inteligencji do aplikacji na Androida poprzez dbanie o zarządzanie modelami, czas działania, bezpieczeństwo i nie tylko.