No Google I/O 2024, apresentamos uma visão do Android reimaginado com a IA no centro. Confira as três principais atualizações para criar com IA no Android para desenvolvedores Android neste vídeo.
Escolha a solução de IA generativa ideal para você
Este documento apresenta uma visão geral da IA generativa no Android, incluindo os modelos Gemini disponíveis e os SDKs associados.
IA no dispositivo com alto desempenho
Em dispositivos Android com suporte, é possível oferecer experiências ricas de IA generativa sem precisar de uma conexão de rede ou mover dados para fora do dispositivo. Modelos de IA generativa no dispositivo, como o Gemini Nano, são ótimas soluções para casos de uso em que baixa latência, baixo custo e proteção de privacidade são as principais preocupações.
Casos de uso
- Consumo de conteúdo aprimorado por IA: resumo de texto, resposta a perguntas de documentos e extração de entidades.
- Criação de conteúdo com tecnologia de IA: revisão, correção gramatical, assistência na escrita e respostas inteligentes contextuais.
- Classificação de texto: análise de sentimento ou humor
- Privacidade: desbloqueia recursos de IA generativa e mantém os dados no dispositivo
Soluções
Use o SDK da Google AI Edge para aproveitar a inferência do Gemini Nano no dispositivo. O Gemini Nano agora está disponível publicamente para acesso experimental.
Saiba mais sobre o Gemini Nano
Forneça modelos personalizados para recursos de IA no dispositivo com mais eficiência com o Google Play para IA no dispositivo. O Google Play simplifica a inicialização, a segmentação, a versão, o download e a atualização dos modelos no dispositivo, ajudando você a melhorar a experiência do usuário e manter o tamanho do app otimizado. O recurso AI On-device está disponível sem custo extra. Preencha o formulário se você tiver interesse no acesso antecipado ao Google Play para IA no dispositivo.
Inscrever-se no acesso antecipado ao Google Play para IA no dispositivo
IA multimodal na nuvem com os modelos mais avançados do Google
É possível criar experiências de IA generativa multimodais nos seus apps usando modelos de fundação que executam inferência na nuvem, como os modelos Pro do Gemini. Esses modelos são uma ótima solução quando você quer oferecer suporte à maior variedade possível de dispositivos Android.
Casos de uso
- Descrição e legendagem de imagens e vídeos: identificar objetos e descrevê-los em texto
- Raciocínio multimodal: processamento de conteúdo de texto, imagem e vídeo
- Geração de texto: resuma artigos, responda a perguntas sobre conteúdo textual e extraia entidades.
- Formatação da resposta: formate a resposta do modelo para JSON ou Markdown.
Soluções
Para levar suas experiências de IA para a produção, use a Vertex AI no Firebase. O SDK do Firebase oferece acesso aos modelos Gemini, mas também oferece opções de segurança e configuração essenciais para apps de produção. Além disso, o Firebase inclui suporte e recursos de produção em várias plataformas móveis.
Saiba mais sobre a Vertex AI no Firebase
IA para empresas
A Vertex AI é uma plataforma de desenvolvimento de IA unificada e totalmente gerenciada do Google. As empresas podem usar a plataforma Vertex AI do Google para oferecer experiências de IA personalizadas a dispositivos Android usando integrações de back-end. Crie, treine e implante aplicativos de IA na infraestrutura escalonável e de nível internacional do Google. É uma ótima solução para IA em escala empresarial, com acesso a mais de 130 modelos e ferramentas, incluindo o AI Studio, o Agent Builder e os modelos Gemini.
Casos de uso
- Treinamento e envio de modelos personalizados
- Geração de imagens e vídeos
- Agentes virtuais, suporte ao cliente
- Processamento de linguagem natural e conversão de voz em texto
Solução
Use a plataforma Vertex AI do Google para criar aplicativos de IA personalizados e conectar apps Android à camada de serviço.
Outros recursos
- Visão geral da Vertex AI
- Vertex AI com Gemini 1.5 Pro
- Programa de aprendizado "Generative AI for Developers"
Toolkit para IA generativa responsável
Os modelos de IA precisam estar alinhados às políticas de segurança, ser avaliados quanto à imparcialidade e precisão e projetados para serem transparentes. O Kit de ferramentas de IA generativa responsável oferece ajuda e orientação para projetar, criar, avaliar e implantar modelos abertos de IA com responsabilidade.
Gemini no Android Studio
O Gemini no Android Studio é um parceiro de programação para desenvolvimento Android. Ele é baseado em inteligência artificial e pode entender a linguagem natural. Ele ajuda a aumentar a produtividade ao responder perguntas sobre desenvolvimento Android. O Gemini pode ajudar você a encontrar recursos relevantes, aprender as práticas recomendadas e economizar tempo.
APIs e SDKs do Google para IA generativa no Android
A tabela a seguir é uma breve visão geral dos modelos compatíveis com a Vertex AI no Firebase e os nomes dos modelos estáveis mais recentes. Essa tabela também lista modelos de pré-lançamento e experimentais disponíveis para casos de uso de protótipos. Para mais detalhes sobre os recursos de cada modelo, incluindo limites de taxa e de token, consulte Modelos Gemini.
Modelo | Entrada | Saída | Descrição |
---|---|---|---|
Modelos Gemini com versões estáveis | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
texto, código, PDFs, imagens, vídeo, áudio |
texto, código, JSON (imagens e áudio em breve) |
Oferece recursos e velocidade de última geração para uma variedade de
tarefas (geração multimodal em breve) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Oferece desempenho econômico e de baixa latência e oferece suporte a alta taxa de transferência |
Gemini 1.5 Progemini-1.5-pro-002
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Suporte a tarefas de raciocínio complexas que exigem mais inteligência; contexto 2 milhões de tokens |
Gemini 1.5 Flashgemini-1.5-flash-002
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Oferece desempenho rápido e versátil em diversas tarefas |
Modelos Gemini com somente versões de pré-lançamento e experimentais (recomendado apenas para casos de uso de prototipagem) | |||
Gemini 2.0 Progemini-2.0-pro-exp-02-05
|
texto, código, PDFs, imagens, vídeo, áudio | texto, código, JSON | Oferece a melhor qualidade de modelo, especialmente para código e conhecimento mundial; contexto de 2 milhões |
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
|
texto, código, PDFs, imagens | texto, código, JSON | Oferece recursos de raciocínio mais fortes e inclui o processo de pensamento nas respostas |
Modelos Imagen 3 (ao usar com Vertex AI in Firebase) | |||
Imagen 3imagen-3.0-generate-002
|
texto | imagens | Gera imagens realistas e de alta qualidade com base em comandos de texto em linguagem natural |
Imagen 3 Fastimagen-3.0-fast-generate-001
|
texto | imagens | Gera imagens para prototipagem ou casos de uso de baixa latência |