Auf der Google I/O 2024 haben wir eine neue Version von Android vorgestellt, die auf KI basiert. In diesem Video erfahren Sie, welche drei Updates für Android-Entwickler die wichtigsten sind, wenn sie KI auf Android-Geräten nutzen.
Passende Lösung für generative KI auswählen
In diesem Dokument finden Sie einen Überblick über die generative KI auf Android, einschließlich der verfügbaren Gemini-Modelle und der zugehörigen SDKs.
Leistungsstarke KI auf dem Gerät
Auf unterstützten Android-Geräten können Sie umfangreiche generative KI-Funktionen nutzen, ohne eine Netzwerkverbindung herstellen oder Daten vom Gerät übertragen zu müssen. On-Device-Modelle für generative KI wie Gemini Nano sind eine gute Lösung für Anwendungsfälle, bei denen niedrige Latenz, geringe Kosten und Datenschutzmaßnahmen im Vordergrund stehen.
Anwendungsfälle
- KI-gestützte Inhalte: Textzusammenfassung, Beantwortung von Fragen zu Dokumenten und Entitätsextraktion.
- KI-gestützte Inhaltserstellung: Korrekturlesen, Grammatikkorrektur, Unterstützung beim Schreiben und kontextbezogene intelligente Antworten.
- Text klassifizieren: Sentiment- oder Stimmungsanalyse
- Datenschutz: Sie können Funktionen der generativen KI nutzen, während die Daten auf dem Gerät bleiben.
Lösungen
Verwenden Sie das Google AI Edge SDK, um die Gemini Nano-Inferenz auf dem Gerät zu nutzen. Gemini Nano ist jetzt öffentlich für den experimentellen Zugriff verfügbar.
Weitere Informationen zu Gemini Nano
Mit Play for On-Device AI können Sie benutzerdefinierte Modelle für On-Device-KI-Funktionen effizienter bereitstellen. Google Play vereinfacht die Einführung, das Targeting, die Versionierung, das Herunterladen und das Aktualisieren Ihrer On-Device-Modelle. So können Sie die Nutzerfreundlichkeit verbessern und gleichzeitig die Größe Ihrer App optimieren. Die On-Device-KI von Google Play ist kostenlos verfügbar. Wenn Sie am Early Access für Play for On-Device AI interessiert sind, füllen Sie das Formular aus.
Für den Vorabzugriff auf Play for On-Device AI registrieren
Multimodale Cloud-KI mit den leistungsstärksten Modellen von Google
Sie können multimodale generative KI-Funktionen in Ihren Apps erstellen, indem Sie Foundation Models wie die Gemini Pro-Modelle nutzen, die die Inferenz in der Cloud ausführen. Diese Modelle sind eine gute Lösung, wenn Sie möglichst viele Android-Geräte unterstützen möchten.
Anwendungsfälle
- Bild- und Videobeschreibungen und Untertitel: Objekte identifizieren und in Text beschreiben
- Multimodale Argumentation: Verarbeitung von Text-, Bild- und Videoinhalten
- Textgenerierung: Artikel zusammenfassen, Fragen zu Textinhalten beantworten, Entitäten extrahieren.
- Antwortformat: Formatieren Sie die Modellantwort in JSON oder Markdown.
Lösungen
Wenn Sie Ihre KI-Funktionen in die Produktion übernehmen möchten, verwenden Sie Vertex AI in Firebase. Das Firebase SDK bietet nicht nur Zugriff auf Gemini-Modelle, sondern auch Sicherheits- und Konfigurationsoptionen, die für Produktions-Apps entscheidend sind. Außerdem bietet Firebase Support und Funktionen auf Produktionsebene für verschiedene mobile Plattformen.
Weitere Informationen zu Vertex AI in Firebase
KI für Unternehmen
Vertex AI ist die vollständig verwaltete, einheitliche KI-Entwicklungsplattform von Google. Unternehmen können die Vertex AI-Plattform von Google verwenden, um mithilfe von Backend-Integrationen personalisierte KI-Funktionen auf Android-Geräten bereitzustellen. KI-Anwendungen in der skalierbaren, erstklassigen Infrastruktur von Google erstellen, trainieren und bereitstellen Es ist eine hervorragende Lösung für KI im Unternehmensmaßstab mit Zugriff auf über 130 Modelle und Tools, darunter AI Studio, Agent Builder und Gemini-Modelle.
Anwendungsfälle
- Training und Bereitstellung benutzerdefinierter Modelle
- Bild- und Videogenerierung
- Virtuelle Kundenservicemitarbeiter
- Spracherkennung, Verarbeitung natürlicher Sprache
Lösung
Verwenden Sie die Vertex AI-Plattform von Google, um benutzerdefinierte KI-Anwendungen zu erstellen und Android-Apps mit der Dienstebene zu verbinden.
Weitere Informationen zu Vertex AI
Weitere Informationen
Toolkit für verantwortungsbewusste generative KI
KI-Modelle sollten den Sicherheitsrichtlinien entsprechen, auf Fairness und Genauigkeit geprüft und transparent gestaltet sein. Das Responsible Generative AI-Toolkit bietet Hilfe und Anleitungen zum verantwortungsvollen Entwerfen, Erstellen, Bewerten und Bereitstellen offener KI-Modelle.
Gemini in Android Studio
Gemini in Android Studio ist ein Coding-Assistent für die Android-Entwicklung. Sie basiert auf künstlicher Intelligenz und kann natürliche Sprache verstehen. Außerdem beantwortet er Ihnen Fragen zur Entwicklung unter Android und hilft Ihnen so, produktiver zu werden. Gemini kann Ihnen helfen, relevante Ressourcen zu finden, Best Practices zu erlernen und Zeit zu sparen.
Google APIs und SDKs für generative KI auf Android-Geräten
Die folgende Tabelle bietet einen kurzen Überblick über die unterstützten Modelle für Vertex AI in Firebase und ihre neuesten stabilen Modellnamen. In dieser Tabelle sind auch Vorabversionen und experimentelle Modelle aufgeführt, die für Prototyping-Anwendungsfälle verfügbar sind. Weitere Informationen zu den Funktionen der einzelnen Modelle, einschließlich Token- und Ratenlimits, finden Sie unter Gemini-Modelle.
Modell | Eingabe | Ausgabe | Beschreibung |
---|---|---|---|
Gemini-Modelle mit stabilen Versionen | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
Text, Code, PDFs, Bilder, Video, Audio |
Text, Code, JSON (Bilder und Audio bald verfügbar) |
Bietet Funktionen und Geschwindigkeit der nächsten Generation für eine Vielzahl von Aufgaben (Multimodale Generierung bald verfügbar) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
Text, Code, PDFs, Bilder, Video, Audio | Text, Code, JSON | Bietet eine kostengünstige Leistung mit geringer Latenz und unterstützt einen hohen Durchsatz. |
Gemini-Modelle mit nur Vorab- und experimentellen Versionen (nur für Prototyping-Anwendungsfälle empfohlen) | |||
Gemini 2.0 Progemini-2.0-pro-exp-02-05
|
Text, Code, PDFs, Bilder, Video, Audio | Text, Code, JSON | Bietet die höchste Modellqualität, insbesondere für Code und Weltwissen; 2 Mio. Zeichen langer Kontext |
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
|
Text, Code, PDFs, Bilder | Text, Code, JSON | Bietet stärkere Argumentationskompetenzen und bezieht den Denkprozess in die Antworten ein |
Imagen 3-Modelle (bei Verwendung mit Vertex AI in Firebase) | |||
Imagen 3imagen-3.0-generate-002
|
Text | Bilder | Er generiert realistische, hochwertige Bilder aus Textprompts in natürlicher Sprache. |
Imagen 3 Fastimagen-3.0-fast-generate-001
|
Text | Bilder | Er generiert Bilder für das Prototyping oder Anwendungsfälle mit niedriger Latenz. |