Okulary AI zapewniają perspektywę pierwszoosobową i wielomodową, dzięki czemu użytkownik może wchodzić w interakcje z otoczeniem. W połączeniu z wejściem głosowym i czujnikami sprzętowymi może dostarczać aplikacji bezprecedensowy poziom informacji kontekstowych. Aby wykorzystać ten kontekst w aplikacji, możesz użyć agenta w aplikacji i przekierować te dane wejściowe do modelu LLM. Aplikacja może korzystać z interfejsu Gemini Live API lub zintegrować niestandardowego agenta AI.
Odpowiedzialne korzystanie z AI
Projektowanie z uwzględnieniem wszystkich aspektów wygody użytkownika, w tym wygody sensorycznej, poznawczej, społecznej i wygody związanej z AI.
Projektuj aplikacje zgodnie z zasadą „Najpierw zgoda użytkownika”:
- Nie zakładaj, że możesz nagrywać, ponieważ aplikacja jest otwarta.
- Przed aktywowaniem czujników używaj wyraźnych aktywatorów, takich jak gest fizyczny.
- Poproś agenta o włączenie kamery, jeśli uzna to za konieczne.
- Zbieraj minimalną ilość danych niezbędnych do dostarczania wartości, przetwarzaj je, a następnie usuwaj.
Uwagi dotyczące projektowania agenta
W przypadku okularów AI funkcje AI zapewniają skuteczny sposób wykonywania zadań takich jak zamiana tekstu na mowę i rozpoznawanie obrazów. Sztuczna inteligencja umożliwia interakcję w języku naturalnym, a nie za pomocą statycznych drzew.
Sztuczna inteligencja może sprawić, że wykonywanie zadań na telefonie i okularach będzie bardziej naturalne dzięki naturalnym wskazówkom dźwiękowym i subtelnym elementom wizualnym.
Podczas integrowania agenta z aplikacją weź pod uwagę te kwestie:
- Głos i ton
- Konteksty użytkownika w życiu codziennym
- Bezpieczeństwo użytkowników
- Nie przytłaczaj użytkownika
- Projektowanie z myślą o komforcie społecznym
W przypadku okularów AI agent AI powinien być zwięzły i nieinwazyjny, a jego działanie powinno być zgodne ze sprawdzonymi metodami dotyczącymi wygody użytkownika w konwersacjach i wzorcami AI.