プロダクト ニュース

Android のパフォーマンスを向上: カーネル向けの AutoFDO を発表

4 分で読了
Yabin Cui
ソフトウェア エンジニア

Android LLVM ツールチェーン チームです。私たちの最優先事項の一つは、LLVM エコシステムの最適化手法を通じて Android のパフォーマンスを向上させることです。Android をより高速、スムーズ、効率的にする方法を常に探しています。最適化作業の多くはユーザー空間で行われますが、カーネルはシステムの中心です。今回は、Android カーネルに Automatic Feedback-Directed Optimization(AutoFDO)を導入し、ユーザーに大きなパフォーマンス向上をもたらす方法をご紹介します。

AutoFDO とは

標準的なソフトウェア ビルドでは、コンパイラは静的コードのヒントに基づいて、関数のインライン化や条件分岐の選択など、数千もの小さな決定を行います。これらのヒューリスティックは便利ですが、実際のスマートフォンの使用状況におけるコード実行を常に正確に予測できるとは限りません。

AutoFDO は、実際の実行パターンを使用してコンパイラをガイドすることで、この問題を解決します。これらのパターンは、実際の使用時にコードがたどる最も一般的な命令実行パスを表しており、CPU の分岐履歴を記録することで取得されます。このデータはフリート デバイスから収集できますが、カーネルの場合は、人気の高いアプリの上位 100 個を実行するなど、代表的なワークロードを使用してラボ環境で合成します。サンプリング プロファイラを使用してこのデータを取得し、コードのどの部分が「ホット」(頻繁に使用される)で、どの部分が「コールド」であるかを特定します。これらのプロファイルを使用してカーネルを再ビルドすると、コンパイラは実際の Android ワークロードに合わせて最適化された、よりスマートな決定を行うことができます。

この最適化の影響を理解するために、次の重要な事実を考慮してください。

  • Android では、カーネルが CPU 時間の約 40% を占めています。
  • AutoFDO を使用してユーザー空間のネイティブ実行可能ファイルとライブラリを最適化し、コールドアプリの起動を約 4% 改善し、起動時間を 1% 短縮しています。

実際のパフォーマンス向上

管理されたラボ環境のプロファイルを利用することで、主要な Android 指標全体で目覚ましい改善が見られました。これらのプロファイルは、アプリのクロールと起動を使用して収集され、6.1、6.6、6.12 カーネルの Google Pixel デバイスで測定されました。

最も顕著な改善点は次のとおりです。これらのカーネル バージョンの AutoFDO プロファイルの詳細については、android16-6.12 カーネルと android15-6.6 カーネルのそれぞれの Android カーネル リポジトリをご覧ください。

boosting_2.png

これらは単なる理論上の数値ではありません。インターフェースの操作性の向上、アプリの切り替えの高速化、バッテリー駆動時間の延長、エンドユーザーにとってデバイス全体の応答性の向上につながります。

仕組み: パイプライン

Google のデプロイ戦略では、プロファイルの関連性を維持し、パフォーマンスを安定させるために、高度なパイプラインを使用しています。

boosting_3.png

ステップ 1: プロファイルの収集

ユーザー空間バイナリのプロファイリングには内部テスト フリートを使用していますが、Generic Kernel Image(GKI)では管理されたラボ環境に移行しました。プロファイリングをデバイス リリース サイクルから切り離すことで、デプロイされたカーネル バージョンに関係なく、柔軟かつ迅速な更新が可能になります。重要なことに、テストでは、このラボベースのデータが実際のフリートと同等のパフォーマンス向上をもたらすことが確認されています。

  • ツールと環境: 最新のカーネル イメージをテスト デバイスに書き込み、simpleperf を使用して命令実行ストリームをキャプチャします。このプロセスでは、分岐履歴を記録するためにハードウェア機能に依存しており、特に Google Pixel デバイスの  ARM Embedded Trace Extension(ETE)ARM Trace Buffer Extension(TRBE) を利用しています。
  • ワークロード: Android アプリ互換性テストスイート(C-Suite) の人気の高いアプリの上位 100 個を使用して、代表的なワークロードを構築します。最も正確なデータを取得するために、次の点に重点を置いています。
    • アプリの起動: ユーザーが最も認識しやすい遅延を最適化する
    • AI によるアプリのクロール: 連続的で進化するユーザー インタラクションをシミュレートする
    • システム全体のモニタリング: フォアグラウンド アプリのアクティビティだけでなく、重要なバックグラウンド ワークロードとプロセス間通信もキャプチャする
  • 検証: この合成ワークロードは、内部フリートから収集された実行パターンと85% の類似性 を示しています。
  • ターゲット データ: これらのテストを十分に繰り返すことで、人気の高いアプリケーションに対する実際のユーザー インタラクションを正確に表す、忠実度の高い実行パターンをキャプチャします。さらに、この拡張可能なフレームワークにより、追加のワークロードとベンチマークをシームレスに統合して、カバレッジを拡大できます。

ステップ 2: プロファイルの処理

未加工のトレースデータを後処理して、クリーンで効果的で、コンパイラで使用できる状態にします。

  • 集計: 複数のテスト実行とデバイスのデータを 1 つのシステムビューに統合します。
  • 変換: 未加工のトレースを AutoFDO プロファイル形式に変換し、必要に応じて不要なシンボルを除外します。
  • プロファイルのトリミング: プロファイルをトリミングして、「コールド」関数のデータを削除し、標準の最適化を使用できるようにします。これにより、使用頻度の低いコードでの回帰を防ぎ、バイナリサイズの不要な増加を回避できます。

ステップ 3: プロファイルのテスト

デプロイ前に、プロファイルに対して厳格な検証を行い、安定性のリスクなしに一貫したパフォーマンス向上を実現できるようにします。

  • プロファイルとバイナリの分析: 新しいプロファイルの内容(ホット関数、サンプル数、プロファイル サイズなど)を以前のバージョンと厳密に比較します。また、プロファイルを使用して新しいカーネル イメージをビルドし、バイナリを分析して、テキスト セクションの変更が想定どおりであることを確認します。
  • パフォーマンスの検証: 新しいカーネル イメージでターゲット ベンチマークを実行します。これにより、以前のベースラインで確立されたパフォーマンスの改善が維持されることを確認します。

継続的な更新

コードは時間の経過とともに自然に「ドリフト」するため、静的プロファイルは最終的に効果を失います。最高のパフォーマンスを維持するために、パイプラインを継続的に実行して定期的な更新を行います。

  • 定期的な更新: 各 GKI リリースの前に Android カーネル LTS ブランチのプロファイルを更新し、すべてのビルドに最新のプロファイル データが含まれるようにします。
  • 今後の拡張: 現在、これらの更新は android16-6.12 ブランチと android15-6.6 ブランチに配信されており、今後の android17-6.18 などの新しい GKI バージョンにもサポートを拡大する予定です。

安定性の確保

プロファイル ガイド付き最適化では、安定性のリスクが生じるかどうかという疑問がよくあります。AutoFDO は、ソースコードのロジックを変更するのではなく、主にコンパイラのヒューリスティック(関数のインライン化やコード レイアウトなど)に影響するため、カーネルの機能的な整合性を維持します。この技術はすでに大規模に実証されており、Android プラットフォーム ライブラリ、ChromeOS、Google 独自のサーバー インフラストラクチャの標準的な最適化として長年使用されています。

動作の一貫性をさらに保証するために、「デフォルトで保守的」な戦略を適用しています。忠実度の高いプロファイルでキャプチャされていない関数は、標準のコンパイラ メソッドを使用して最適化されます。これにより、カーネルの「コールド」または実行頻度の低い部分が標準ビルドと同じように動作し、パフォーマンスの低下やエッジケースでの予期しない動作を防ぐことができます。

今後

現在、android16-6.12 ブランチと android15-6.6 ブランチに AutoFDO をデプロイしています。この最初のロールアウト以外にも、この技術をさらに強化するための有望な方法がいくつかあります。

  • リーチの拡大: 現在の aarch64 サポートに加えて、新しい GKI カーネル バージョンと追加のビルドターゲットに AutoFDO プロファイルをデプロイすることを楽しみにしています。
  • GKI モジュールの最適化: 現在、最適化はメインのカーネル バイナリ(vmlinux)に重点を置いています。AutoFDO を GKI モジュールに拡張することで、カーネル サブシステムのより大きな部分でパフォーマンスのメリットを得ることができます。
  • ベンダー モジュールのサポート: ドライバ開発キット(DDK)を使用してビルドされたベンダー モジュールに対する AutoFDO のサポートにも関心があります。ビルドシステム(Kleaf)とプロファイリング ツール(simpleperf)でサポートがすでに提供されているため、ベンダーはこれらの最適化手法を特定のハードウェア ドライバに適用できます。
  • プロファイル カバレッジの拡大: より広範なクリティカル ユーザー ジャーニー(CUJ)からプロファイルを収集して最適化できる可能性があります。

AutoFDO を Android カーネルに導入することで、OS の基盤が、デバイスを毎日使用する方法に合わせて最適化されるようにしています。

執筆者:

続きを読む