Android 生成式 AI

在 Google I/O '24 大會上,我們揭露了以 AI 為核心的 Android 願景。請觀看這部影片,瞭解 Android 開發人員在 Android 上使用 AI 建構應用程式時的 3 大最新功能。

選擇適合您的生成式 AI 解決方案

本文將概略說明 Android 上的生成式 AI,包括可用的 Gemini 模型和相關 SDK。

高效能裝置端 AI

Gemini 圖示

在支援的 Android 裝置上,您可以提供豐富的生成式 AI 體驗,而無需連上網路或將資料移出裝置。在 Gemini Nano 等裝置端生成式 AI 模型中,如果您主要考量低延遲、低成本和隱私權保護,這些都是絕佳的解決方案。

用途

  • AI 強化內容消費功能:文字摘要、文件問答和實體擷取。
  • AI 輔助內容產生功能:校對、文法校正、寫作輔助,以及情境智慧回覆。
  • 分類文字:情緒或心情分析
  • 隱私權:啟用生成式 AI 功能,同時將資料保留在裝置上

解決方案

使用 Google AI Edge SDK 在裝置上運用 Gemini Nano 推論。Gemini Nano 實驗功能現已開放一般使用者體驗。

進一步瞭解 Gemini Nano

透過 Play for On-device AI,更有效率地為裝置端 AI 功能提供自訂模型。Google Play 簡化了裝置端模型的啟動、指定、版本、下載和更新作業,有助於您改善使用者體驗,同時維持應用程式大小。Play for On-device AI 可免費使用。如果您有興趣搶先體驗 Play 裝置端 AI 技術,請填寫這份表單。

申請裝置端 AI 技術 Play 搶先體驗版

使用 Google 最強大的模型,打造多模態雲端 AI

您可以利用在雲端執行推論的基礎模型 (例如 Gemini Pro 模型),在應用程式中建立多模態生成式 AI 體驗。如果您想支援盡可能廣泛的 Android 裝置,這些模型就是絕佳的解決方案。

用途

  • 圖片和影片說明和字幕:識別物件並以文字描述
  • 多模態推理:處理文字、圖片和影片內容
  • 文字生成:摘要文章、回答有關文字內容的問題,以及擷取實體。
  • 回應格式:將模型回應格式化為 JSON 或 Markdown

解決方案

如要製作生成式 AI 功能的原型,您可以先使用 Google AI 用戶端 SDK。這個 SDK 可讓您存取 Gemini API,並協助簡化應用程式與 Gemini 模型的互動。Google AI 用戶端 SDK 目前為預覽版,應僅用於製作原型

進一步瞭解 Google AI 用戶端 SDK

如要將 AI 體驗導入正式環境,請使用 Firebase 中的 Vertex AI。與 Google AI 用戶端 SDK 類似,這個 Firebase SDK 可讓您存取 Gemini 模型,同時提供實際工作環境應用程式所需的安全性和設定選項。此外,Firebase 也提供各行動平台的正式版支援和功能。

進一步瞭解 Firebase 中的 Vertex AI

企業 AI

Vertex AI 圖示

Vertex AI 是 Google 全代管的統合式 AI 開發平台。企業可以使用 Google 的 Vertex AI 平台,透過後端整合功能,為 Android 裝置提供客製化 AI 體驗。運用 Google 可擴充的世界級基礎架構,建構、訓練及部署 AI 應用程式。這項解決方案非常適合企業級 AI 應用,可存取超過 130 個模型和工具,包括 AI Studio、Agent Builder 和 Gemini 模型。

用途

  • 自訂模型訓練和提交
  • 圖像和影片生成
  • 虛擬服務專員、客戶服務
  • 語音轉文字、自然語言處理

解決方案

使用 Google 的 Vertex AI 平台建構自訂 AI 應用程式,並將 Android 應用程式連結至服務層。

進一步瞭解 Vertex AI

其他資源

負責任的生成式 AI 技術工具包

AI 模型應符合安全政策,並經過公平性和準確性的評估,且設計上應具備透明度。負責任的生成式 AI 工具包提供協助和指引,協助您負責地設計、建構、評估及部署開放式 AI 模型。

Gemini 版 Android Studio

Android Studio 中的 Gemini 是 Android 開發人員的程式碼編寫好幫手。這項服務採用人工智慧技術,可以理解自然語言。它可回答您的 Android 開發相關問題,協助您提高工作效率。Gemini 可協助您尋找相關資源、瞭解最佳做法,並節省時間。

Gemini API Starter 範本

Gemini API Starter 範本緊密遵循線上快速入門指南,協助您開始使用 Android 版 Gemini。這份文件會運用 Android 版 Google AI 用戶端 SDK,並說明如何使用文字提示和模型回應。

參考資料

Android 版 Gen AI 適用的 Google API 和 SDK

環境

API 或 SDK

支援的模型

適用範圍

建議用途

整合 Android 與裝置端推論

Google AI Edge SDK

Gemini Nano

公開實驗性存取權

實驗功能版

Android 與雲端推論整合

Google AI 用戶端 SDK

Gemini 1.5 Flash
Gemini 1.5 Pro
Gemini 1.0 Pro

公開預先發布版

僅限原型設計

Vertex AI in Firebase SDK

Gemini 1.5 Flash
Gemini 1.5 Pro
Gemini 1.0 Pro

正式發布 (GA)

建議用於正式環境

後端與雲端推論整合

Vertex AI 平台

超過 130 個基礎模型 (包括 Gemini 1.5 模型)

正式發布版 (GA)

建議用於正式環境

整合 Android 與裝置端推論

MediaPipe LLM 推論

Gemma 2B
Falcon 1B
Stable LM 3B
Phi-2

實驗功能版

Google 生成式 AI 模型

Google 提供多種生成式 AI 模型,可用於 Android 應用程式。

環境

機型

類型 (費用)

支援的輸入格式

輸出資料

裝置上

Gemini Nano

免付費

文字、圖片

文字

雲端

Gemini 1.5 Flash

免付費/付費

文字、圖片、影片、音訊

文字

Gemini 1.5 Pro

免付費/付費

文字、圖片、影片、音訊

文字

Gemini 1.0 Pro

免付費/付費

文字

文字

裝置端、雲端

Gemma 和 Gemma 2

免付費 (開放式模型)

文字

文字

如要進一步瞭解各個模型的功能 (包括符記和費率限制),請參閱「Gemini 模型」。