Na konferencji Google I/O 2024 przedstawiliśmy nową wizję Androida, w której sztuczna inteligencja odgrywa kluczową rolę. W tym filmie znajdziesz 3 najważniejsze aktualizacje dotyczące tworzenia aplikacji z wykorzystaniem AI na Androida.
Wybierz rozwiązanie z generatywnej AI odpowiednie dla siebie
Ten dokument zawiera omówienie generatywnej AI na Androidzie, w tym dostępnych modeli Gemini i powiązanych pakietów SDK.
Wysokowydajna sztuczna inteligencja na urządzeniu
Na obsługiwanych urządzeniach z Androidem możesz korzystać z bogatych funkcji generatywnej AI bez konieczności łączenia się z internetem ani przesyłania danych z urządzenia. Modele generatywnej AI działające na urządzeniu, takie jak Gemini Nano, to świetne rozwiązanie w przypadku zastosowań, w których najważniejsze są niskie opóźnienia, niskie koszty i zabezpieczenia prywatności.
Przykłady zastosowań
- Przetwarzanie treści z wykorzystaniem AI: podsumowywanie tekstu, odpowiadanie na pytania dotyczące dokumentów i wyodrębnianie encji.
- Generowanie treści z pomocą AI: sprawdzanie pisowni, poprawianie błędów gramatycznych, pomoc w pisaniu i inteligentne odpowiedzi w kontekście.
- Klasyfikacja tekstu: analiza nastawienia lub nastroju
- Prywatność: funkcja odblokowuje funkcje generatywnej AI, zachowując dane na urządzeniu.
Rozwiązania
Użyj pakietu Google AI Edge SDK, aby korzystać z wnioskowania Gemini Nano na urządzeniu. Gemini Nano jest teraz dostępny publicznie w ramach dostępu eksperymentalnego.
Więcej informacji o Gemini Nano
Za pomocą Play for On-device AI możesz sprawniej dostarczać niestandardowe modele do funkcji AI na urządzeniu. Google Play upraszcza uruchamianie, kierowanie, wersjonowanie, pobieranie i aktualizowanie modeli na urządzeniu, co pomaga poprawić wrażenia użytkowników przy jednoczesnym zoptymalizowaniu rozmiaru aplikacji. Graj za pomocą AI na urządzeniu bez dodatkowych kosztów. Jeśli chcesz uzyskać wcześniejszy dostęp do Play for On-device AI, wypełnij ten formularz.
Rejestracja w Google Play w celu uzyskania wczesnego dostępu do funkcji AI na urządzeniu
Cloud AI multimodalny z najbardziej zaawansowanymi modelami Google
Możesz tworzyć w swoich aplikacjach multimodalne funkcje generatywnej AI, korzystając z modeli podstawowych, które wykonują wnioskowanie w chmurze, np. modeli Gemini Pro. Te modele to świetne rozwiązanie, jeśli chcesz obsługiwać jak największą liczbę urządzeń z Androidem.
Przykłady zastosowań
- Opis i napisy do obrazu lub filmu: identyfikowanie obiektów i opisywanie ich w tekście.
- Rozumowanie multimodalne: przetwarzanie treści tekstowych, graficznych i wideo.
- Generowanie tekstu: streszczanie artykułów, udzielanie odpowiedzi na pytania dotyczące treści tekstowych, wyodrębnianie jednostek.
- Formatowanie odpowiedzi: możesz sformatować odpowiedź modelu w formacie JSON lub Markdown.
Rozwiązania
Aby tworzyć prototypy funkcji opartych na generatywnej AI, możesz zacząć od pakietu SDK klienta Google AI. Ten pakiet SDK zapewnia dostęp do interfejsu Gemini API i ułatwia interakcje aplikacji z modelami Gemini. Pakiet SDK klienta Google AI jest w wersji podglądowej i powinien być używany tylko do tworzenia prototypów.
Więcej informacji o pakiecie Google AI Client SDK
Aby wdrożyć rozwiązania AI w produkcji, użyj Vertex AI w Firebase. Podobnie jak pakiet SDK klienta Google AI, ten pakiet Firebase SDK zapewnia dostęp do modeli Gemini, ale oferuje też opcje zabezpieczeń i konfiguracji, które są kluczowe w przypadku aplikacji produkcyjnych. Firebase obejmuje też obsługę na poziomie produkcji i funkcje na różnych platformach mobilnych.
Więcej informacji o Vertex AI w Firebase
Sztuczna inteligencja dla firm
Vertex AI to w pełni zarządzana, ujednolicona platforma do tworzenia rozwiązań AI od Google. Firmy mogą korzystać z platformy Vertex AI firmy Google, aby dostarczać spersonalizowane rozwiązania AI na urządzeniach z Androidem, korzystając z integracji z backendem. Tworzenie, trenowanie i wdrażanie aplikacji AI w skalowanej, światowej klasy infrastrukturze Google. Jest to świetne rozwiązanie do tworzenia AI na potrzeby przedsiębiorstw, które zapewnia dostęp do ponad 130 modeli i narzędzi, w tym AI Studio, narzędzia Agent Builder i modele Gemini.
Przykłady zastosowań
- Trenowanie i dostarczanie modeli niestandardowych
- generowanie obrazów i filmów;
- Wirtualni asystenci, obsługa klienta
- przekształcanie mowy na tekst i przetwarzanie języka naturalnego;
Rozwiązanie
Używaj platformy Vertex AI od Google do tworzenia niestandardowych aplikacji AI i łączenia aplikacji na Androida z poziomem usług.
Dodatkowe materiały
- Omówienie Vertex AI
- Vertex AI z Gemini 1.5 Pro
- Generatywna AI – ścieżka szkoleniowa dla programistów
Zestaw narzędzi odpowiedzialnej generatywnej AI
Modele AI powinny być zgodne z zasadami bezpieczeństwa, oceniane pod kątem sprawiedliwości i dokładności oraz zaprojektowane w sposób przejrzysty. Zestaw narzędzi do odpowiedzialnego tworzenia generatywnej AI zawiera wskazówki, które pomogą Ci odpowiedzialnie projektować, tworzyć, oceniać i wdrażać otwarte modele AI.
Gemini w Android Studio
Gemini w Android Studio to asystent kodowania do tworzenia aplikacji na Androida. Jest ona obsługiwana przez sztuczną inteligencję i rozumie język naturalny. Pomaga zwiększyć produktywność, odpowiadając na pytania dotyczące programowania na Androida. Gemini może pomóc Ci znaleźć odpowiednie zasoby, dowiedzieć się o sprawdzonych metodach i zaoszczędzić czas.
Szablon podstawowy interfejsu Gemini API
Szablon startowy Gemini API jest zgodny z internetowym przewodnikiem po Gemini na Androida. Wykorzystuje on pakiet SDK klienta Google AI na Androida i pokazuje, jak pracować z promptami tekstowymi i modelami odpowiedzi.
Źródła wiedzy
Interfejsy API i pakiety SDK Google do Generative AI na Androida
Środowisko |
Interfejs API lub pakiet SDK |
Obsługiwane modele |
Dostępność |
Zalecane użycie |
Integracja z Androidem z wykorzystaniem wnioskowania na urządzeniu |
Gemini Nano |
Public experimental access |
Eksperymentalny |
|
Integracja z Androidem z wykorzystaniem wnioskowania w chmurze |
Gemini 1.5 Flash |
Publiczna wersja przedpremierowa |
Tylko prototypowanie |
|
Gemini 1.5 Flash |
Ogólna dostępność |
Zalecane w środowisku produkcyjnym |
||
Integracja backendu z przetwarzaniem w chmurze |
Ponad 130 modeli podstawowych (w tym modele Gemini 1.5) |
Ogólna dostępność |
Zalecane w środowisku produkcyjnym |
|
Integracja z Androidem z wykorzystaniem wnioskowania na urządzeniu |
Gemma 2B |
Eksperymentalny |
Modele generatywnej AI od Google
Google udostępnia wiele modeli generatywnej AI, których możesz używać w aplikacji na Androida.
Środowisko |
Model |
Typ (koszt) |
Obsługiwane formaty danych wejściowych |
Dane wyjściowe |
Na urządzeniu |
Gemini Nano |
Bezpłatnie |
Tekst, obraz |
Tekst |
Chmura |
Gemini 1.5 Flash |
Bezpłatny/płatny |
tekst, obraz, film, dźwięk |
Tekst |
Gemini 1.5 Pro |
Bezpłatny/płatny |
tekst, obraz, film, dźwięk |
Tekst |
|
Gemini 1.0 Pro |
Bezpłatny/płatny |
Tekst |
Tekst |
|
Na urządzeniu, w chmurze |
Gemma i Gemma 2 |
Bezpłatny (model otwarty) |
Tekst |
Tekst |
Szczegółowe informacje o możliwościach poszczególnych modeli, w tym o limitach tokenów i częstotliwości, znajdziesz w artykule Modele Gemini.