Lors de Google I/O 2024, nous avons dévoilé une vision d'Android repensé avec l'IA comme fondement. Découvrez les trois principales nouveautés pour les développeurs Android concernant la création avec l'IA sur Android dans cette vidéo.
Choisir la solution d'IA générative qui vous convient
Ce document présente l'IA générative sur Android, y compris les modèles Gemini disponibles et les SDK associés.
IA hautes performances sur l'appareil
Sur les appareils Android compatibles, vous pouvez proposer des expériences d'IA générative enrichies sans avoir besoin d'une connexion réseau ni de déplacer des données hors de l'appareil. Les modèles d'IA générative sur l'appareil tels que Gemini Nano sont d'excellentes solutions pour les cas d'utilisation où la faible latence, le faible coût et les mesures de protection de la confidentialité sont vos principales préoccupations.
Cas d'utilisation
- Consommation de contenu optimisée par l'IA: synthèse de texte, réponse aux questions sur les documents et extraction d'entités.
- Génération de contenu assistée par l'IA: relecture, correction grammaticale, assistance à la rédaction et réponses intelligentes contextuelles.
- Classer du texte: analyse des sentiments ou de l'humeur
- Confidentialité: permet de profiter des fonctionnalités d'IA générative tout en conservant les données sur l'appareil.
Solutions
Utilisez le SDK Google AI Edge pour exploiter l'inférence Gemini Nano sur l'appareil. Gemini Nano est désormais disponible en accès expérimental pour le public.
En savoir plus sur Gemini Nano
Fournissez des modèles personnalisés pour les fonctionnalités d'IA sur l'appareil plus efficacement avec Play pour l'IA sur l'appareil. Google Play simplifie le lancement, le ciblage, la gestion des versions, le téléchargement et la mise à jour de vos modèles sur l'appareil, ce qui vous aide à améliorer l'expérience utilisateur tout en optimisant la taille de votre application. Play for AI est disponible sans frais supplémentaires. Remplissez le formulaire si vous souhaitez accéder en avant-première à Play pour l'IA sur l'appareil.
Inscrivez-vous pour bénéficier d'un accès anticipé à Play pour l'IA sur l'appareil
IA Cloud multimodale avec les modèles les plus performants de Google
Vous pouvez créer des expériences d'IA générative multimodale dans vos applications en profitant des modèles de fondation exécutant l'inférence dans le cloud, comme les modèles Gemini Pro. Ces modèles constituent une excellente solution lorsque vous souhaitez prendre en charge la plus large gamme d'appareils Android possible.
Cas d'utilisation
- Description et sous-titrage des images et des vidéos: identification des objets et description de ceux-ci sous forme de texte
- Raisonnement multimodal: traitement du contenu textuel, visuel et vidéo
- Génération de texte: résumer des articles, répondre à des questions sur le contenu textuel, extraire des entités.
- Mise en forme de la réponse: mettez en forme la réponse du modèle au format JSON ou Markdown.
Solutions
Pour mettre en production vos expériences d'IA, utilisez Vertex AI in Firebase. Le SDK Firebase permet d'accéder aux modèles Gemini, mais offre également des options de sécurité et de configuration essentielles pour les applications de production. De plus, Firebase inclut une assistance et des fonctionnalités de niveau production sur différentes plates-formes mobiles.
En savoir plus sur Vertex AI in Firebase
IA pour les entreprises
Vertex AI est la plate-forme de développement d'IA unifiée et entièrement gérée de Google. Les entreprises peuvent utiliser la plate-forme Vertex AI de Google pour proposer des expériences d'IA personnalisées sur les appareils Android à l'aide d'intégrations backend. Créez, entraînez et déployez des applications d'IA sur l'infrastructure évolutive de pointe de Google. Il s'agit d'une excellente solution pour l'IA à grande échelle, avec un accès à plus de 130 modèles et outils, y compris AI Studio, Agent Builder et les modèles Gemini.
Cas d'utilisation
- Entraînement et diffusion de modèles personnalisés
- Génération d'images et de vidéos
- Agents virtuels, service client
- Conversion de la parole en texte, traitement du langage naturel
Solution
Utilisez la plate-forme Vertex AI de Google pour créer des applications d'IA personnalisées et connecter des applications Android à la couche de service.
Ressources supplémentaires
- Présentation de Vertex AI
- Vertex AI avec Gemini 2.0 Flash
- Parcours de formation sur l'IA générative pour les développeurs
Boîte à outils pour l'IA générative responsable
Les modèles d'IA doivent être conformes aux règles de sécurité, évalués pour leur impartialité et leur précision, et conçus pour être transparents. Le kit d'outils pour une IA générative responsable vous aide et vous conseille à concevoir, développer, évaluer et déployer de manière responsable des modèles d'IA ouverts.
Gemini dans Android Studio
Gemini dans Android Studio est un assistant de codage pour le développement Android. Il est basé sur l'intelligence artificielle et peut comprendre le langage naturel. Il vous aide à être plus productif en répondant à vos questions sur le développement Android. Gemini peut vous aider à trouver des ressources pertinentes, à découvrir les bonnes pratiques et à gagner du temps.
API et SDK Google pour l'IA générative sur Android
Le tableau suivant présente un bref aperçu des modèles compatibles avec Vertex AI dans Firebase et leurs derniers noms de modèles stables. Ce tableau liste également les modèles en version preview et expérimentaux disponibles pour le prototypage de cas d'utilisation. Pour en savoir plus sur les fonctionnalités de chaque modèle, y compris les limites de jetons et de débit, consultez la section Modèles Gemini.
Modèle | Entrée | Sortie | Description |
---|---|---|---|
Modèles Gemini avec versions stables | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
texte, code, PDF, images, vidéo, audio |
texte, code, JSON (images et audio bientôt disponibles) |
Fournit des fonctionnalités et une vitesse de nouvelle génération pour une grande variété de tâches (génération multimodale bientôt disponible) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
texte, code, PDF, images, vidéo, audio | texte, code, JSON | Offre des performances économiques et à faible latence, et prend en charge un débit élevé |
Versions preview et expérimentales uniquement des modèles Gemini (recommandées pour les cas d'utilisation de prototypage uniquement) | |||
Gemini 2.0 Progemini-2.0-pro-exp-02-05
|
texte, code, PDF, images, vidéo, audio | texte, code, JSON | Offre la qualité de modèle la plus élevée, en particulier pour le code et la connaissance du monde ; contexte long de 2 millions |
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
|
texte, code, PDF, images | texte, code, JSON | Offre des capacités de raisonnement plus efficaces et inclut le processus de réflexion dans les réponses |
Imagen 3 modèles (à utiliser avec Vertex AI in Firebase) | |||
Imagen 3imagen-3.0-generate-002
|
text | images | Génère des images réalistes et de haute qualité à partir de requêtes textuelles en langage naturel. |
Imagen 3 Fastimagen-3.0-fast-generate-001
|
text | images | Génère des images pour le prototypage ou les cas d'utilisation à faible latence |