AI 안경용 Gemini Live API와 통합

해당 XR 기기
이 안내는 이러한 유형의 XR 기기용 환경을 구축하는 데 도움이 됩니다.
AI 글래스

Gemini Live API는 사용자와의 대화형 인터페이스를 구현하기 위한 포괄적인 솔루션을 제공합니다. Android XR용으로 빌드할 때 Firebase AI Logic을 통해 Gemini Live API와 통합할 수 있습니다. TTS (텍스트 음성 변환)자동 음성 인식 (ASR)을 사용하는 것과 달리 Gemini Live API는 오디오 입력과 출력을 원활하게 처리합니다. Gemini Live API에는 지속적인 인터넷 연결이 필요하며 비용이 발생하고 프로젝트당 동시 연결 수가 제한되어 있으며, 특히 디스플레이가 없는 AI 안경에서 오류 조건이나 기타 중요한 사용자 커뮤니케이션을 처리하는 데 적합하지 않을 수 있습니다.

오디오 인터페이스를 지원하는 것 외에도 Gemini Live API를 사용하여 에이전트 환경을 빌드할 수 있습니다.

Gemini Live API를 시작하려면 Gemini Live API 가이드에 설명된 단계를 따르세요. LiveGenerativeModel를 인스턴스화하고 구성하고, LiveSession를 설정하고, 앱이 Gemini의 요청을 처리할 수 있도록 맞춤 FunctionDeclaration 인스턴스를 만드는 방법을 안내합니다.