Google I/O 2024 では、AI を中核として Android を再構築するビジョンを発表しました。Android デベロッパー向けの Android で AI を活用した開発に関する最新情報のトップ 3 を、この動画でご確認ください。
目的に合った生成 AI ソリューションを選択する
このドキュメントでは、利用可能な Gemini モデルと関連する SDK など、Android での生成 AI の概要について説明します。
高性能なオンデバイス AI
対応している Android デバイスでは、ネットワーク接続やデバイス外へのデータの移動を必要とせずに、豊富な生成 AI エクスペリエンスを提供できます。Gemini Nano などのオンデバイス生成 AI モデルは、低レイテンシ、低コスト、プライバシー保護を主に重視するユースケースに最適なソリューションです。
ユースケース
- AI を活用したコンテンツの利用: テキストの要約、ドキュメントの質問応答、エンティティの抽出。
- AI を活用したコンテンツ生成: 校正、文法の修正、文章作成の支援、コンテキストに応じたスマート リプライ。
- テキストの分類: センチメントまたはムード分析
- プライバシー: データをデバイス上に保持しながら生成 AI 機能を利用できる
ソリューション
Google AI Edge SDK を使用して、デバイス上の Gemini Nano 推論を活用します。Gemini Nano の試験運用版が一般公開されました。
オンデバイス AI のための Google Play を使用すると、オンデバイス AI 機能のカスタムモデルをより効率的に提供できます。Google Play では、オンデバイス モデルの起動、ターゲティング、バージョニング、ダウンロード、更新が簡素化されているため、アプリのサイズを最適化しながらユーザー エクスペリエンスを向上させることができます。オンデバイス AI のための Google Play は追加料金なしで利用できます。オンデバイス AI のための Google Play の早期アクセスにご興味をお持ちの場合は、こちらのフォームにご記入ください。
オンデバイス AI のための Google Play の早期アクセスに登録する
Google の最上位モデルを搭載したマルチモーダル Cloud AI
Gemini Pro モデルなど、クラウドで推論を実行する基盤モデルを利用することで、アプリにマルチモーダル生成 AI エクスペリエンスを作成できます。これらのモデルは、可能な限り幅広い Android デバイスをサポートする場合に最適なソリューションです。
ユースケース
- 画像と動画の説明と字幕: オブジェクトを特定し、テキストで説明する
- マルチモーダル推論: テキスト、画像、動画のコンテンツを処理する
- テキスト生成: 記事の要約、テキスト コンテンツに関する質問への回答、エンティティの抽出。
- レスポンスのフォーマット: モデルのレスポンスを JSON または Markdown にフォーマットします。
ソリューション
生成 AI 機能のプロトタイプを作成するには、Google AI クライアント SDK から始めることができます。この SDK を使用すると、Gemini API にアクセスし、アプリと Gemini モデルのやり取りを簡素化できます。Google AI クライアント SDK はプレビュー版であり、プロトタイピングのみに使用してください。
AI エクスペリエンスを本番環境に導入するには、Firebase で Vertex AI を使用します。Google AI クライアント SDK と同様に、この Firebase SDK は Gemini モデルへのアクセスを提供しますが、本番環境アプリに不可欠なセキュリティと構成オプションも提供します。また、Firebase には、さまざまなモバイル プラットフォームで本番環境レベルのサポートと機能が含まれています。
エンタープライズ向け AI
Vertex AI は、AI 向けの Google のフルマネージド統合 AI 開発プラットフォームです。企業は、Google の Vertex AI プラットフォームを使用して、バックエンド統合を使用して Android デバイスにカスタマイズされた AI エクスペリエンスを提供できます。Google のスケーラブルで世界クラスのインフラストラクチャで AI アプリケーションを構築、トレーニング、デプロイします。AI Studio、Agent Builder、Gemini モデルなど、130 を超えるモデルとツールにアクセスできるため、エンタープライズ スケールの AI に最適なソリューションです。
ユースケース
- カスタムモデルのトレーニングと配信
- 画像と動画の生成
- 仮想エージェント、カスタマー サポート
- 音声文字変換、自然言語処理
解決策
Google の Vertex AI プラットフォームを使用してカスタム AI アプリケーションを構築し、Android アプリをサービスレイヤに接続します。
参考情報
責任ある生成 AI ツールキット
AI モデルは、安全性に関するポリシーに準拠し、公平性と精度が評価され、透明性を確保するように設計する必要があります。責任ある生成 AI ツールキットは、オープン AI モデルを責任を持って設計、構築、評価、デプロイするためのヘルプとガイダンスを提供します。
Gemini in Android Studio
Android Studio の Gemini は、Android 開発用のコーディング コンパニオンです。人工知能を活用し、自然言語を理解できます。Android 開発に関する質問に回答することで、生産性を高めることができます。Gemini は、関連するリソースの検索、ベスト プラクティスの学習、時間の節約に役立ちます。
Gemini API スターター テンプレート
Gemini API スターター テンプレートは、Android で Gemini を使ってみるオンライン クイックスタートに準拠しています。Android 向け Google AI クライアント SDK を活用し、テキスト プロンプトとモデルのレスポンスを操作する方法を示します。
リファレンス
Android の生成 AI 向けの Google API と SDK
環境 |
API または SDK |
サポートされているモデル |
利用可能な国と地域 |
推奨される使用方法 |
Android とオンデバイス推論の統合 |
Gemini Nano |
一般公開の試験運用版 |
試験運用版 |
|
Android とクラウド推論の統合 |
Gemini 1.5 Flash |
パブリック プレビュー |
プロトタイピングのみ |
|
Gemini 1.5 Flash |
一般提供(GA) |
本番環境に推奨 |
||
クラウド推論とのバックエンドの統合 |
130 を超える基盤モデル(Gemini 1.5 モデルを含む) |
一般提供(GA) |
本番環境に推奨 |
|
Android とオンデバイス推論の統合 |
Gemma 2B |
試験運用版 |
Google の生成 AI モデル
Google は、Android アプリで使用できる複数の生成 AI モデルを提供しています。
環境 |
モデル |
タイプ(費用) |
サポートされている入力形式 |
出力データ |
デバイス上 |
Gemini Nano |
無料 |
テキスト、画像 |
テキスト |
Cloud |
Gemini 1.5 Flash |
無料/有料 |
テキスト、画像、動画、音声 |
テキスト |
Gemini 1.5 Pro |
無料/有料 |
テキスト、画像、動画、音声 |
テキスト |
|
Gemini 1.0 Pro |
無料/有料 |
テキスト |
テキスト |
|
デバイス、クラウド |
Gemma と Gemma 2 |
無料(オープンモデル) |
テキスト |
テキスト |
トークンとレートの上限など、各モデルの機能の詳細については、Gemini モデルをご覧ください。