代理模式

Android Studio 的 Gemini 代理程式模式專為處理複雜的多階段開發工作而設計,這類工作不只是與 Gemini 對話就能完成。您可以描述高階目標,代理程式就會建立及執行計畫、叫用必要的工具、跨多個檔案進行變更,並反覆修正錯誤。這項有專員輔助的工作流程可協助您解決複雜難題,加快開發程序。

系統需求

Android Studio Narwhal 功能推送 Canary 4 以上版本提供代理程式模式。下載最新版 Android Studio 預先發布版

開始使用

如要在 Android Studio 中開始使用代理程式模式,請按照下列步驟操作:

  1. 按一下側欄中的「Gemini」。如有需要,請登入並完成新手上路程序。
  2. 選取「代理人」分頁標籤。
  3. 說明您希望代理程式執行的工作。
  4. 當專員逐步完成工作時,您可以選擇查看並核准任何變更。

    代理人模式會等待您接受或拒絕變更。
  5. 選用:如要自動核准變更,請依序選取「代理商選項」 >「自動核准變更」

    自動核准代理建議的變更。

用途

以下列舉幾個代理程式可協助處理的應用情境:

  • 修正建構錯誤。當您使用「修正專案中的建構錯誤」等提示要求代理程式修正建構錯誤時,代理程式會套用建議的修正方式、建構專案來驗證解決方案,並反覆執行,直到問題解決為止。

    代理程式會建構專案,並評估是否有錯誤。
  • 代理程式模式可以自行新增或更新 UI 元素。舉例來說,要求代理程式「將使用者偏好設定中的深色模式設為預設模式」,代理程式就會搜尋相關檔案,並建議變更內容來完成這項工作。您可以在「Running devices」工具視窗中,立即預覽 UI 更新。

  • 在製作應用程式原型和測試時,模擬資料很有幫助。您可以將建立虛假資料的工作交給代理程式,不必手動建立。這裡我們要求代理程式「在虛假資料中再新增兩個工作階段」。它會找出相關檔案,並在 mockSessions 清單中新增兩個事件。

其他建議提示詞:

  • 「Write unit tests for <class> in <module>」(在 <module> 中為 <class> 撰寫單元測試)。
  • 「Generate documentation for the currently open file.」(為目前開啟的檔案產生文件。)
  • 「將應用程式名稱從『<目前名稱>』變更為『<新名稱>』。」
  • 「Resolve the null pointer exception.」
  • 「Refactor my code by moving the <composable name> composable to a new file. 請務必更新所有匯入作業。
  • 「在應用程式主畫面新增名為『追蹤』的按鈕,點選後會前往主題清單。」
  • 「在 <可組合函式名稱> 可組合函式中,減少 <修飾符名稱> 修飾符的邊框間距。」
  • 「建立分享按鈕,以便分享至社群媒體。」

新增 Gemini API 金鑰

Android Studio 的預設代理程式模式提供免付費的每日配額,但內容視窗有限。如要擴大脈絡窗口,可以新增自己的 Gemini API 金鑰,透過 Gemini 2.5 Pro 運用最多 100 萬個權杖。

加入自己的 API 金鑰,擴大內容視窗。

脈絡窗口越大,您就能傳送更多指令、程式碼和附件給 Gemini,進而獲得更高品質的回覆。這在與代理程式協作時特別實用,因為較大的脈絡可讓 Gemini 2.5 Pro 推論複雜或長時間執行的工作。

取得 API 金鑰的方法如下:

  1. 登入 Google AI Studio,然後按一下「取得 API 金鑰」按鈕取得金鑰。
  2. 在 Android Studio 中,依序前往「File」(macOS 上的「Android Studio」) >「Settings」>「Tools」>「Gemini」,然後輸入 Gemini API 金鑰。
  3. 重新啟動 Android Studio 中的 Gemini,透過「代理程式」模式取得更優質的回覆。
在 Gemini 設定中新增自己的 API 金鑰。

請務必妥善保管 Gemini API 金鑰,因為使用個人 API 金鑰時,Gemini API 使用量會產生額外費用。如要監控 Gemini API 金鑰用量,請前往 AI Studio,然後依序點選「取得 API 金鑰」>「用量和帳單」

新增 MCP 伺服器

Android Studio 的 Gemini 代理程式可使用模型內容通訊協定 (MCP) 與外部工具互動。這項功能提供標準化方式,讓代理人模式使用工具,並透過外部環境擴展知識和能力。

您可以在 Android Studio 中連結至 MCP 主機的工具有很多,舉例來說,您可以整合 GitHub MCP 伺服器,直接從 Android Studio 建立提取要求。如需更多想法,請參閱 MCP 範例伺服器

如要新增 MCP 伺服器,請建立 mcp.json 檔案,並將其放在 Studio 的設定目錄中。mcp.json 檔案應符合以下格式:

{
  "mcpServers": {
    "memory": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-memory"
      ]
    },
    "sequential-thinking": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-sequential-thinking"
      ]
    },
    "github": {
      "command": "docker",
      "args": [
        "run",
        "-i",
        "--rm",
        "-e",
        "GITHUB_PERSONAL_ACCESS_TOKEN",
        "ghcr.io/github/github-mcp-server"
      ],
      "env": {
        "GITHUB_PERSONAL_ACCESS_TOKEN": "<YOUR_TOKEN>"
      }
    }
  }
}

請參閱您要整合的 MCP 伺服器說明文件,瞭解應在此檔案中列出的確切 commandargs。您可能也需要安裝 Node.js 或 Docker 等工具,視 MCP 伺服器的軟體需求而定。

限制

Android Studio 的 MCP 整合功能有幾項重要限制:

  • MCP 伺服器必須實作 stdio 傳輸。
  • 目前不支援串流 HTTP 傳輸、MCP 資源和提示範本。

代理程式的運作方式

在「代理程式」模式中,系統會將提示連同可用工具清單傳送至 Gemini API。您可以將工具視為技能,包括搜尋檔案、讀取檔案、搜尋檔案中的文字、使用您設定的任何 MCP 伺服器等。

當您指派工作給代理程式時,代理程式會擬定計畫並找出所需工具。部分工具可能需要你授予權限,代理程式才能使用。授予權限後,代理程式會使用工具執行必要動作,並將結果傳回 Gemini API。Gemini 會處理動作結果,並生成其他回覆。這個行動和評估的循環會持續進行,直到工作完成為止。