Os óculos de IA oferecem uma oportunidade única para um novo design de interação com a sobreposição de um formato novo, altamente contextual e pessoal com padrões de IA em evolução. Para óculos de IA, você terá acesso ao hardware e aos recursos dos dispositivos, incluindo câmera, microfone e touchpad, para explorar totalmente novos padrões de interação entre a IA, seu app e os óculos com conforto e princípios de segurança do usuário em mente.
Os óculos de IA trazem recursos de IA para os olhos e ouvidos do usuário. Ao criar essas experiências, considere padrões que reconheçam a IA como um assistente com recursos visuais rápidos.
Conversa natural
Os modelos de IA permitem uma interação contínua em linguagem natural em vez de transferências curtas ou árvores de conversa estáticas. Priorize conversas úteis e contínuas com atendentes em vez de sessões curtas.
Pausar e parar
Permita que o usuário faça uma pausa e interrompa a conversa ou tarefa. Pode ser um toque físico, um gesto ou uma interação falada. O agente pode continuar ouvindo outras dicas de interação e estabelecer um padrão personalizado para continuar aprendendo com o usuário. Permitir que os usuários saiam da sessão deslizando para trás nos óculos de IA sem tela ou deslizando para baixo nos óculos de IA com tela.
Multimodal
Os óculos podem usar vários recursos de hardware com IA para oferecer experiências mais ricas. Por exemplo, você pode usar a câmera para assistência contextual, permitindo que o usuário a ative durante a conversa para entender o mundo ao redor.
Não deixe a câmera funcionando, porque isso afeta o desempenho da bateria. Em vez disso, permita que o usuário ative a câmera para mais entradas.
Consciência ambiental
Verifique se as interações de áudio com IA podem fornecer mais informações ou repetir respostas conforme necessário. Considere fornecer recursos visuais quando uma tela estiver disponível como uma interface contextual que harmoniza com a saída de áudio. Permitir que o usuário permaneça focado no mundo real, fornecendo informações legíveis e rápidas.
Neste exemplo, um tutor de idiomas combina estes padrões: o usuário consegue
falar em um ritmo de conversa, usar gestos físicos e a câmera para
interagir e ter uma experiência de aprendizado natural e imersiva.