Produktneuheiten

Prompt API von ML Kit: Individuelle Gemini Nano-Erlebnisse auf dem Gerät

Lesezeit: 2 Minuten

KI erleichtert die Erstellung personalisierter App-Erlebnisse, bei denen Inhalte in das richtige Format für Nutzer umgewandelt werden. Bisher konnten Entwickler Gemini Nano über ML Kit GenAI APIs einbinden, die auf bestimmte Anwendungsfälle wie Zusammenfassungen und Bildbeschreibungen zugeschnitten waren.

Heute ist ein wichtiger Meilenstein für generative KI auf Android-Geräten. Wir geben die Alpha-Version der ML Kit GenAI Prompt API bekannt. Mit dieser API können Sie Anfragen in natürlicher Sprache und multimodale Anfragen an Gemini Nano senden. So wird der Bedarf nach mehr Kontrolle und Flexibilität bei der Entwicklung mit generativen Modellen erfüllt.

Partner wie Kakao entwickeln bereits mit der Prompt API und schaffen einzigartige Erlebnisse mit realen Auswirkungen. Sie können die leistungsstarken Funktionen der Prompt API schon heute mit minimalem Code testen.

 

 

Von vordefinierten zu benutzerdefinierten GenAI-Lösungen auf dem Gerät

Die Prompt API geht über die vordefinierten Funktionen hinaus und unterstützt benutzerdefinierte, app-spezifische GenAI-Anwendungsfälle. So können Sie einzigartige Funktionen mit komplexer Datentransformation erstellen. Die Prompt API verwendet Gemini Nano auf dem Gerät, um Daten lokal zu verarbeiten. Dadurch sind Offline-Funktionen und ein verbesserter Datenschutz möglich.

Wichtige Anwendungsfälle für die Prompt API

Die Prompt API ermöglicht hochgradig angepasste GenAI-Anwendungsfälle. Hier sind einige empfohlene Beispiele: 

  • Bildverständnis: Analysieren von Fotos zur Klassifizierung (z.B. Erstellen eines Entwurfs für einen Social-Media-Beitrag oder Identifizieren von Tags wie „Haustiere“, „Essen“ oder „Reisen“).
  • Intelligentes Scannen von Dokumenten: Extrahieren von Text aus einer Quittung mit einem herkömmlichen ML-Modell und anschließendes Kategorisieren der einzelnen Elemente mit der Prompt API.
  • Daten für die UI umwandeln: Analysieren von langen Inhalten, um einen kurzen, ansprechenden Benachrichtigungstitel zu erstellen.
  • Inhalte vorschlagen: Themen für neue Tagebucheinträge basierend auf den Themenpräferenzen eines Nutzers vorschlagen.
  • Inhaltsanalyse: Kundenrezensionen in eine positive, neutrale oder negative Kategorie einordnen.
  • Informationen extrahieren: Wichtige Details zu einem bevorstehenden Ereignis aus einem E‑Mail-Thread extrahieren.

Implementierung
Mit der Prompt API können Sie mit nur wenigen Codezeilen benutzerdefinierte Prompts erstellen und optionale Generierungsparameter festlegen:

Generation.getClient().generateContent(
   generateContentRequest(
       ImagePart(bitmapImage),
       TextPart("Categorize this image as one of the following: car, motorcycle, bike, scooter, other. Return only the category as the response."),
   ) {
       // Optional parameters
       temperature = 0.2f
       topK = 10
       candidateCount = 1
       maxOutputTokens = 10
   },
)

Weitere Beispiele für die Implementierung der Prompt API finden Sie in der offiziellen Dokumentation und im Beispiel auf GitHub.

Gemini Nano, Leistung und Prototyping

Die Prompt API funktioniert derzeit am besten auf der Pixel 10-Geräteserie, auf der die neueste Version von Gemini Nano (nano-v3) ausgeführt wird. Diese Version von Gemini Nano basiert auf derselben Architektur wie Gemma 3n, das Modell, das wir der Open-Source-Community auf der I/O vorgestellt haben.

Die gemeinsame Grundlage von Gemma 3n und nano-v3 erleichtert Entwicklern das Prototyping von Funktionen. Wenn Sie kein Pixel 10-Gerät haben, können Sie noch heute mit Prompts experimentieren, indem Sie lokal mit Gemma 3n Prototypen erstellen.

Eine vollständige Liste der Geräte, die GenAI APIs unterstützen, finden Sie in unserer Dokumentation zur Geräteunterstützung.

Weitere Informationen

Beginnen Sie noch heute mit der Implementierung der Prompt API in Ihren Android-Apps. Die offizielle Dokumentation und das Beispiel auf GitHub helfen Ihnen dabei.

Geschrieben von:

Weiterlesen