API Gemini Live предоставляет комплексное решение для реализации диалоговых интерфейсов с вашим пользователем. При разработке для Android XR вы можете интегрировать API Gemini Live через Firebase AI Logic . В отличие от преобразования текста в речь (TTS) и автоматического распознавания речи (ASR) , API Gemini Live обеспечивает бесперебойную обработку аудиовхода и аудиовыходов. API Gemini Live требует постоянного подключения к Интернету, является платным, поддерживает ограниченное количество одновременных подключений на проект и может не подходить для обработки ошибок или других критически важных пользовательских взаимодействий, особенно в очках с искусственным интеллектом без дисплея.
Помимо поддержки аудиоинтерфейсов, вы также можете использовать API Gemini Live для создания агентских интерфейсов.
Чтобы начать работу с API Gemini Live, следуйте инструкциям, изложенным в руководстве по API Gemini Live . Оно поможет вам создать экземпляр и настроить LiveGenerativeModel , создать сеанс LiveSession и создать пользовательские экземпляры FunctionDeclaration , которые позволят вашему приложению обрабатывать запросы от Gemini.