整合 Gemini Live API,打造 AI 眼鏡

適用 XR 裝置
這份指南可協助您為這類 XR 裝置打造體驗。
AI 眼鏡

Gemini Live API 提供全方位解決方案,可協助你建置使用者對話介面。開發 Android XR 應用服務時,可以透過 Firebase AI Logic 整合 Gemini Live API。與使用文字轉語音 (TTS)自動語音辨識 (ASR) 不同,Gemini Live API 能夠以無縫接軌的方式,同時處理音訊輸入和輸出。Gemini Live API 需要持續與網路保持連線,除了會產生費用之外,每個專案支援的並行連線數量也有限制,可能不適合處理錯誤狀況或其他重要使用者通訊,尤其不適用於沒有螢幕的 AI 眼鏡。

除了支援音訊介面,您也可以使用 Gemini Live API 來打造具備代理功能的服務體驗。

如要開始使用 Gemini Live API,請按照 Gemini Live API 指南中的步驟操作。這份指南將逐步說明如何例項化及設定 LiveGenerativeModel、建立 LiveSession,以及建立自訂 FunctionDeclaration 例項,讓應用程式處理來自 Gemini 的要求。