Android 上的生成式 AI

在 2024 年的 Google I/O 大会上,我们公布了以 AI 为核心重塑 Android 的美好愿景。观看此视频,了解面向 Android 开发者的 Android 上 AI 赋能的构建功能的 3 大更新。

选择适合您的生成式 AI 解决方案

本文档简要介绍了 Android 上的生成式 AI,包括可用的 Gemini 模型和关联的 SDK。

高性能设备端 AI

Gemini 图标

在受支持的 Android 设备上,您无需连接到网络或将数据移出设备,即可提供丰富的生成式 AI 体验。对于将低延迟、低成本和隐私保护作为主要关注点的应用场景,设备端生成式 AI 模型(例如 Gemini Nano)是理想的解决方案。

用例

  • AI 赋能的优质内容消费体验:文本摘要、文档问答和实体提取。
  • AI 辅助内容生成:校对、语法纠正、写作辅助和情境智能回复。
  • 对文本进行分类:情感或情绪分析
  • 隐私:解锁生成式 AI 功能,同时将数据保留在设备端

解决方案

使用 Google AI Edge SDK 在设备端利用 Gemini Nano 推理。 Gemini Nano 现已面向公众提供实验版访问权限。

详细了解 Gemini Nano

借助 Play for On-device AI,您可以更高效地为设备端 AI 功能提供自定义模型。Google Play 简化了设备端模型的发布、定位、版本控制、下载和更新流程,可帮助您在优化应用大小的同时提升用户体验。Play for On-device AI 免费提供。如果您有兴趣抢先体验 Play for On-device AI,请填写此表单。

注册抢先体验 Play for On-device AI

采用 Google 最强大的模型的多模态 Cloud AI

您可以利用在云端运行推理的基准模型(例如 Gemini Pro 模型),在应用中打造多模态生成式 AI 体验。如果您希望支持尽可能广泛的 Android 设备,这些模型非常适合。

用例

  • 图片和视频说明和字幕:识别对象并以文本形式对其进行描述
  • 多模态推理:处理文本、图片和视频内容
  • 文本生成:总结文章、回答有关文本内容的问题、提取实体。
  • 响应格式:将模型响应设置为 JSON 或 Markdown 格式

解决方案

如需对生成式 AI 功能进行原型设计,您可以先使用 Google AI Client SDK。借助此 SDK,您可以访问 Gemini API,并简化应用与 Gemini 模型的交互。Google AI 客户端 SDK 处于预览版阶段,应仅用于原型设计

详细了解 Google AI 客户端 SDK

如需将 AI 体验投入生产环境,请使用 Vertex AI in Firebase。 与 Google AI 客户端 SDK 类似,此 Firebase SDK 可提供对 Gemini 模型的访问权限,但也提供对生产应用至关重要的安全和配置选项。此外,Firebase 还提供适用于各种移动平台的正式版支持和功能。

详细了解 Vertex AI in Firebase

面向企业的 AI

Vertex AI 图标

Vertex AI 是 Google 的全托管式统一 AI 开发平台。企业可以使用 Google 的 Vertex AI 平台,通过后端集成向 Android 设备提供量身定制的 AI 体验。在 Google 可伸缩的世界级基础架构上构建、训练和部署 AI 应用。Vertex AI 非常适合企业级 AI 应用,可让您使用 130 多种模型和工具,包括 AI Studio、Agent Builder 和 Gemini 模型。

用例

  • 自定义模型训练和交付
  • 图片和视频生成
  • 虚拟客服、客户服务
  • 语音转文字、自然语言处理

解决方案

使用 Google 的 Vertex AI 平台构建自定义 AI 应用,并将 Android 应用连接到服务层。

详细了解 Vertex AI

其他资源

Responsible Generative AI 工具包

AI 模型应符合安全政策,经过公平性和准确性评估,并以透明的方式设计。Responsible Generative AI 工具包可为您提供帮助和指导,助您负责任地设计、构建、评估和部署开放式 AI 模型。

Android Studio 中的 Gemini

Android Studio 中的 Gemini 是 Android 开发的编码助手。它由人工智能提供支持,能够理解自然语言。它可以回答您的 Android 开发查询,帮助您提高工作效率。Gemini 可以帮助你查找相关资源、了解最佳实践并节省时间。

Gemini API 起始模板

Gemini API 起始模板紧密遵循在 Android 中开始使用 Gemini 的在线快速入门。该示例利用适用于 Android 的 Google AI 客户端 SDK,并展示了如何使用文本提示和模型响应。

参考文档

适用于 Android 上的生成式 AI 的 Google API 和 SDK

环境

API 或 SDK

支持的模型

适用范围

建议的用法

将 Android 与设备端推理集成

Google AI Edge SDK

Gemini Nano

公开实验性访问

实验性功能

将 Android 与云端推理集成

Google AI 客户端 SDK

Gemini 1.5 Flash
Gemini 1.5 Pro
Gemini 1.0 Pro

公开试用功能

仅用于原型设计

Vertex AI in Firebase SDK

Gemini 1.5 Flash
Gemini 1.5 Pro
Gemini 1.0 Pro

正式版 (GA)

建议用于生产环境

后端与云端推理集成

Vertex AI Platform

130 多种基础模型(包括 Gemini 1.5 模型)

正式版 (GA)

建议用于生产环境

将 Android 与设备端推理集成

MediaPipe LLM Inference

Gemma 2B
Falcon 1B
Stable LM 3B
Phi-2

实验性功能

Google 生成式 AI 模型

Google 提供了多种生成式 AI 模型,可供您在 Android 应用中使用。

环境

型号

类型(费用)

支持的输入格式

输出数据

设备上的音乐

Gemini Nano

免费

文字、图片

文本

云端

Gemini 1.5 Flash

免费/付费

文本、图片、视频、音频

文本

Gemini 1.5 Pro

免费/付费

文本、图片、视频、音频

文本

Gemini 1.0 Pro

免费/付费

文本

文本

设备端、云端

Gemma 和 Gemma 2

免费(开放式模型)

文本

文本

如需详细了解每种模型的功能(包括令牌和速率限制),请参阅 Gemini 模型