Gemini Live API は、ユーザーとの会話型インターフェースを実装するための包括的なソリューションを提供します。Android XR 向けにビルドする際は、Firebase AI Logic を通じて Gemini Live API と統合できます。テキスト読み上げ(TTS)と自動音声認識(ASR)を使用する場合とは異なり、Gemini Live API は音声の入力と出力をシームレスに処理します。Gemini Live API は、永続的なインターネット接続が必要で、費用が発生します。また、プロジェクトあたりの同時接続数に制限があり、エラー条件やその他の重要なユーザー通信の処理には適していない可能性があります。特に、ディスプレイのない AI メガネでは、その傾向が顕著です。
音声インターフェースのサポートに加えて、Gemini Live API を使用してエージェント エクスペリエンスを構築することもできます。