在 2024 年的 Google I/O 大会上,我们公布了以 AI 为核心重塑 Android 的美好愿景。观看此视频,了解面向 Android 开发者的 Android 上 AI 赋能的构建功能的 3 大更新。
选择适合您的生成式 AI 解决方案
本文档简要介绍了 Android 上的生成式 AI,包括可用的 Gemini 模型和关联的 SDK。
高性能设备端 AI
在受支持的 Android 设备上,您无需连接到网络或将数据移出设备,即可提供丰富的生成式 AI 体验。对于将低延迟、低成本和隐私保护作为主要关注点的应用场景,设备端生成式 AI 模型(例如 Gemini Nano)是理想的解决方案。
用例
- AI 赋能的优质内容消费体验:文本摘要、文档问答和实体提取。
- AI 辅助内容生成:校对、语法纠正、写作辅助和情境智能回复。
- 对文本进行分类:情感或情绪分析
- 隐私:解锁生成式 AI 功能,同时将数据保留在设备端
解决方案
使用 Google AI Edge SDK 在设备端利用 Gemini Nano 推理。 Gemini Nano 现已面向公众提供实验版访问权限。
借助 Play for On-device AI,您可以更高效地为设备端 AI 功能提供自定义模型。Google Play 简化了设备端模型的发布、定位、版本控制、下载和更新流程,可帮助您在优化应用大小的同时提升用户体验。Play for On-device AI 免费提供。如果您有兴趣抢先体验 Play for On-device AI,请填写此表单。
采用 Google 最强大的模型的多模态 Cloud AI
您可以利用在云端运行推理的基准模型(例如 Gemini Pro 模型),在应用中打造多模态生成式 AI 体验。如果您希望支持尽可能广泛的 Android 设备,这些模型非常适合。
用例
- 图片和视频说明和字幕:识别对象并以文本形式对其进行描述
- 多模态推理:处理文本、图片和视频内容
- 文本生成:总结文章、回答有关文本内容的问题、提取实体。
- 响应格式:将模型响应设置为 JSON 或 Markdown 格式
解决方案
如需对生成式 AI 功能进行原型设计,您可以先使用 Google AI Client SDK。借助此 SDK,您可以访问 Gemini API,并简化应用与 Gemini 模型的交互。Google AI 客户端 SDK 处于预览版阶段,应仅用于原型设计。
如需将 AI 体验投入生产环境,请使用 Vertex AI in Firebase。 与 Google AI 客户端 SDK 类似,此 Firebase SDK 可提供对 Gemini 模型的访问权限,但也提供对生产应用至关重要的安全和配置选项。此外,Firebase 还提供适用于各种移动平台的正式版支持和功能。
面向企业的 AI
Vertex AI 是 Google 的全托管式统一 AI 开发平台。企业可以使用 Google 的 Vertex AI 平台,通过后端集成向 Android 设备提供量身定制的 AI 体验。在 Google 可伸缩的世界级基础架构上构建、训练和部署 AI 应用。Vertex AI 非常适合企业级 AI 应用,可让您使用 130 多种模型和工具,包括 AI Studio、Agent Builder 和 Gemini 模型。
用例
- 自定义模型训练和交付
- 图片和视频生成
- 虚拟客服、客户服务
- 语音转文字、自然语言处理
解决方案
使用 Google 的 Vertex AI 平台构建自定义 AI 应用,并将 Android 应用连接到服务层。
其他资源
Responsible Generative AI 工具包
AI 模型应符合安全政策,经过公平性和准确性评估,并以透明的方式设计。Responsible Generative AI 工具包可为您提供帮助和指导,助您负责任地设计、构建、评估和部署开放式 AI 模型。
Android Studio 中的 Gemini
Android Studio 中的 Gemini 是 Android 开发的编码助手。它由人工智能提供支持,能够理解自然语言。它可以回答您的 Android 开发查询,帮助您提高工作效率。Gemini 可以帮助你查找相关资源、了解最佳实践并节省时间。
Gemini API 起始模板
Gemini API 起始模板紧密遵循在 Android 中开始使用 Gemini 的在线快速入门。该示例利用适用于 Android 的 Google AI 客户端 SDK,并展示了如何使用文本提示和模型响应。
参考文档
适用于 Android 上的生成式 AI 的 Google API 和 SDK
环境 |
API 或 SDK |
支持的模型 |
适用范围 |
建议的用法 |
将 Android 与设备端推理集成 |
Gemini Nano |
公开实验性访问 |
实验性功能 |
|
将 Android 与云端推理集成 |
Gemini 1.5 Flash |
公开试用功能 |
仅用于原型设计 |
|
Gemini 1.5 Flash |
正式版 (GA) |
建议用于生产环境 |
||
后端与云端推理集成 |
130 多种基础模型(包括 Gemini 1.5 模型) |
正式版 (GA) |
建议用于生产环境 |
|
将 Android 与设备端推理集成 |
Gemma 2B |
实验性功能 |
Google 生成式 AI 模型
Google 提供了多种生成式 AI 模型,可供您在 Android 应用中使用。
环境 |
型号 |
类型(费用) |
支持的输入格式 |
输出数据 |
设备上的音乐 |
Gemini Nano |
免费 |
文字、图片 |
文本 |
云端 |
Gemini 1.5 Flash |
免费/付费 |
文本、图片、视频、音频 |
文本 |
Gemini 1.5 Pro |
免费/付费 |
文本、图片、视频、音频 |
文本 |
|
Gemini 1.0 Pro |
免费/付费 |
文本 |
文本 |
|
设备端、云端 |
Gemma 和 Gemma 2 |
免费(开放式模型) |
文本 |
文本 |
如需详细了解每种模型的功能(包括令牌和速率限制),请参阅 Gemini 模型。