Integration mit der Gemini Live API für Audio- und Displaybrillen

XR‑Geräte, für die der Leitfaden gilt
Dieser Leitfaden hilft Ihnen dabei, Erlebnisse für die folgenden Arten von XR-Geräten zu entwickeln.
Audio- und
Displaybrillen

Die Gemini Live API bietet eine umfassende Lösung für die Implementierung von Konversationsschnittstellen mit Ihren Nutzern. Wenn Sie für Android XR entwickeln, können Sie die Gemini Live API über Firebase AI Logic einbinden. Im Gegensatz zur Verwendung von Text-to-Speech (TTS) und automatischer Spracherkennung (ASR) verarbeitet die Gemini Live API sowohl Audioeingaben als auch Audioausgaben nahtlos. Die Gemini Live API erfordert eine dauerhafte Internet verbindung, verursacht Kosten, unterstützt eine begrenzte Anzahl gleichzeitiger Verbindungen pro Projekt und ist möglicherweise nicht ideal für die Verarbeitung von Fehlerbedingungen oder anderer kritischer Nutzer kommunikation, insbesondere bei Audiobrillen, da diese kein Display haben.

Neben der Unterstützung von Audioschnittstellen können Sie die Gemini Live API auch verwenden, um agentenbasierte Erlebnisse zu entwickeln.

Eine Einführung in die Gemini Live API finden Sie im Leitfaden zur Gemini Live API. Dort wird beschrieben, wie Sie ein LiveGenerativeModel instanziieren und konfigurieren, eine LiveSession einrichten und benutzerdefinierte FunctionDeclaration-Instanzen erstellen, mit denen Ihre App Anfragen von Gemini verarbeiten kann.