Chế độ Agent của Gemini trong Android Studio được thiết kế để xử lý các tác vụ phát triển phức tạp, nhiều giai đoạn, vượt xa những gì bạn có thể trải nghiệm chỉ bằng cách trò chuyện với Gemini. Bạn có thể mô tả một mục tiêu cấp cao và tác nhân sẽ tạo cũng như thực thi một kế hoạch, gọi các công cụ cần thiết, thực hiện các thay đổi trên nhiều tệp và sửa lỗi lặp đi lặp lại. Quy trình có sự hỗ trợ của đặc vụ này giúp bạn giải quyết những thách thức phức tạp, đẩy nhanh quá trình phát triển.
Yêu cầu hệ thống
Chế độ trợ lý có trong Bản cập nhật tính năng Narwhal Canary 4 của Android Studio trở lên. Tải phiên bản xem trước mới nhất của Android Studio xuống.
Bắt đầu
Để bắt đầu ở chế độ Agent trong Android Studio, hãy làm theo các bước sau:
- Nhấp vào Gemini
trong thanh bên. Đăng nhập và tham gia nếu cần.
- Chọn thẻ Nhân viên hỗ trợ.
- Mô tả việc bạn muốn tác nhân thực hiện.
Khi nhân viên hỗ trợ thực hiện các bước để hoàn thành nhiệm vụ, bạn sẽ có thể xem xét và phê duyệt mọi thay đổi.
Không bắt buộc: Để tự động phê duyệt các thay đổi, hãy chọn Tuỳ chọn về tác nhân
> Tự động phê duyệt các thay đổi.
Trường hợp sử dụng
Sau đây là một số ví dụ về các trường hợp sử dụng mà trợ lý có thể giúp bạn:
Khắc phục lỗi bản dựng. Khi bạn yêu cầu tác nhân khắc phục lỗi bản dựng bằng một câu lệnh như "Khắc phục lỗi bản dựng trong dự án của tôi", tác nhân sẽ áp dụng một giải pháp khắc phục được đề xuất, tạo bản dựng dự án để xác minh giải pháp và lặp lại cho đến khi vấn đề được giải quyết.
Chế độ tác nhân có thể tự thêm hoặc cập nhật các phần tử giao diện người dùng. Ví dụ: yêu cầu tác nhân "Đặt chế độ tối làm chế độ mặc định trong lựa chọn ưu tiên của người dùng" và tác nhân sẽ tìm kiếm các tệp liên quan rồi đề xuất các thay đổi để hoàn thành nhiệm vụ. Bạn có thể xem trước ngay các nội dung cập nhật giao diện người dùng trong cửa sổ công cụ Running devices (Thiết bị đang chạy).
Việc có dữ liệu mô phỏng sẽ rất hữu ích khi tạo mẫu và kiểm thử ứng dụng. Thay vì tự tạo dữ liệu giả theo cách thủ công, bạn có thể giao nhiệm vụ đó cho tác nhân. Ở đây, chúng ta đã yêu cầu trợ lý "Thêm 2 phiên nữa vào dữ liệu giả." Thao tác này sẽ tìm thấy tệp có liên quan và thêm 2 sự kiện khác vào danh sách
mockSessions
.
Một số câu lệnh khác bạn có thể thử:
- "Viết mã kiểm thử đơn vị cho <class> trong <module>."
- "Tạo tài liệu cho tệp đang mở."
- "Thay đổi tiêu đề ứng dụng từ <tên hiện tại> thành <tên mới>."
- "Giải quyết trường hợp ngoại lệ về con trỏ rỗng."
- "Tái cấu trúc mã của tôi bằng cách di chuyển thành phần kết hợp <composable name> sang một tệp mới. Đảm bảo tất cả dữ liệu nhập đều được cập nhật."
- "Thêm một nút mới có tên "Theo dõi" vào màn hình chính của ứng dụng để đưa bạn đến danh sách các chủ đề."
- "Trong thành phần kết hợp <composable name>, hãy giảm khoảng đệm của đối tượng sửa đổi <modifier name>."
- "Tạo nút chia sẻ để chia sẻ lên mạng xã hội."
Thêm khoá Gemini API
Chế độ Agent mặc định trong Android Studio có hạn mức hằng ngày miễn phí với một cửa sổ ngữ cảnh hạn chế. Để mở rộng cửa sổ ngữ cảnh, bạn có thể thêm khoá API Gemini của riêng mình để tận dụng tối đa 1 triệu token với Gemini 2.5 Pro.

Cửa sổ ngữ cảnh lớn hơn cho phép bạn gửi thêm hướng dẫn, mã và tệp đính kèm cho Gemini, từ đó nhận được câu trả lời có chất lượng cao hơn nữa. Điều này đặc biệt hữu ích khi làm việc với các trợ lý AI vì ngữ cảnh lớn hơn giúp Gemini 2.5 Pro có khả năng suy luận về các nhiệm vụ phức tạp hoặc kéo dài.
Cách lấy khoá API:
- Đăng nhập vào Google AI Studio rồi lấy khoá bằng cách nhấp vào nút Lấy khoá API.
- Trong Android Studio, hãy chuyển đến File (Tệp) (Android Studio trên macOS) > Settings (Cài đặt) > Tools (Công cụ) > Gemini để nhập khoá API Gemini.
- Khởi chạy lại Gemini trong Android Studio và nhận được câu trả lời chính xác hơn nữa từ chế độ Agent.

Đừng quên bảo vệ khoá Gemini API của bạn vì các khoản phí bổ sung sẽ áp dụng cho việc sử dụng Gemini API liên kết với khoá API cá nhân. Bạn có thể theo dõi mức sử dụng khoá Gemini API trong AI Studio thông qua Lấy khoá API > Mức sử dụng và thanh toán.
Thêm máy chủ MCP
Tác nhân Gemini trong Android Studio có thể tương tác với các công cụ bên ngoài bằng Giao thức bối cảnh mô hình (MCP). Tính năng này cung cấp một cách thức chuẩn hoá để Chế độ người dùng có thể sử dụng các công cụ, mở rộng kiến thức và khả năng với môi trường bên ngoài.
Có nhiều công cụ mà bạn có thể kết nối với MCP Host trong Android Studio. Ví dụ: bạn có thể tích hợp với Máy chủ MCP của Github để tạo yêu cầu kéo trực tiếp từ Android Studio. Để biết thêm ý tưởng, hãy xem các máy chủ ví dụ về MCP.
Để thêm một máy chủ MCP, hãy tạo một tệp mcp.json
rồi đặt tệp đó vào thư mục cấu hình của Studio. Tệp mcp.json
phải tuân theo định dạng sau:
{
"mcpServers": {
"memory": {
"command": "npx",
"args": [
"-y",
"@modelcontextprotocol/server-memory"
]
},
"sequential-thinking": {
"command": "npx",
"args": [
"-y",
"@modelcontextprotocol/server-sequential-thinking"
]
},
"github": {
"command": "docker",
"args": [
"run",
"-i",
"--rm",
"-e",
"GITHUB_PERSONAL_ACCESS_TOKEN",
"ghcr.io/github/github-mcp-server"
],
"env": {
"GITHUB_PERSONAL_ACCESS_TOKEN": "<YOUR_TOKEN>"
}
}
}
}
Hãy tham khảo tài liệu về máy chủ MCP mà bạn đang tích hợp để biết chính xác command
và args
mà bạn nên liệt kê trong tệp này. Bạn cũng có thể cần cài đặt các công cụ như Node.js hoặc Docker, tuỳ thuộc vào yêu cầu về phần mềm của máy chủ MCP.
Các điểm hạn chế
Việc tích hợp MCP của Android Studio có một số hạn chế quan trọng:
- Các máy chủ MCP phải triển khai phương thức truyền tải stdio.
- Chúng tôi chưa hỗ trợ giao thức truyền tải HTTP truyền trực tuyến, cũng như các tài nguyên MCP và mẫu câu lệnh.
Cách hoạt động của trợ lý
Ở chế độ Agent, câu lệnh của bạn sẽ được gửi đến Gemini API cùng với danh sách công cụ có sẵn. Bạn có thể coi các công cụ là kỹ năng: chúng bao gồm khả năng tìm kiếm tệp, đọc tệp, tìm kiếm văn bản trong tệp, sử dụng mọi máy chủ MCP mà bạn đã định cấu hình, v.v.
Khi bạn giao cho tác nhân một nhiệm vụ, tác nhân sẽ đưa ra kế hoạch và xác định những công cụ cần thiết. Bạn có thể cần cấp quyền cho một số công cụ này trước khi trợ lý có thể sử dụng. Sau khi bạn cấp quyền, tác nhân sẽ sử dụng công cụ này để thực hiện hành động cần thiết và gửi kết quả trở lại Gemini API. Gemini xử lý kết quả của hành động và tạo một câu trả lời khác. Chu trình hành động và đánh giá này sẽ tiếp tục cho đến khi nhiệm vụ hoàn tất.