Tryb agenta Gemini w Android Studio został zaprojektowany do obsługi złożonych, wieloetapowych zadań programistycznych, które wykraczają poza możliwości zwykłej rozmowy z Gemini. Możesz opisać ogólny cel, a agent utworzy i zrealizuje plan, wywołując niezbędne narzędzia, wprowadzając zmiany w wielu plikach i iteracyjnie naprawiając błędy. Ten proces z udziałem agenta umożliwia rozwiązywanie złożonych problemów i przyspiesza proces tworzenia.
Wymagania systemowe
Tryb agenta jest dostępny od wersji Android Studio Narwhal Feature Drop Canary 4. Pobierz najnowszą wersję testową Android Studio
Rozpocznij
Aby rozpocząć korzystanie z trybu agenta w Android Studio, wykonaj te czynności:
- Na pasku bocznym kliknij Gemini
. W razie potrzeby zaloguj się i przejdź proces rejestracji.
- Kliknij kartę Agent.
- Opisz zadanie, które ma wykonać agent.
Gdy agent będzie wykonywać kolejne kroki, aby zrealizować zadanie, będziesz mieć możliwość sprawdzenia i zatwierdzenia wszystkich zmian.
Opcjonalnie: aby automatycznie zatwierdzać zmiany, wybierz Opcje agenta
> Automatycznie zatwierdzaj zmiany.
Przypadki użycia
Oto kilka przykładów zastosowań, w których agent może Ci pomóc:
Napraw błędy kompilacji. Gdy poprosisz agenta o naprawienie błędu kompilacji za pomocą promptu, np. „Napraw błędy kompilacji w moim projekcie”, zastosuje on zalecaną poprawkę, skompiluje projekt, aby zweryfikować rozwiązanie, i będzie powtarzać te czynności, dopóki problem nie zostanie rozwiązany.
Tryb agenta może samodzielnie dodawać i aktualizować elementy interfejsu. Możesz na przykład poprosić agenta o „Ustawienie trybu ciemnego jako domyślnego w ustawieniach użytkownika”. Wyszuka on odpowiednie pliki i zaproponuje zmiany, które pozwolą wykonać to zadanie. Możesz od razu wyświetlić podgląd zmian w interfejsie w oknie narzędzia Uruchomione urządzenia.
Podczas tworzenia prototypu i testowania aplikacji przydatne są dane testowe. Zamiast ręcznie tworzyć fałszywe dane, możesz zlecić to zadanie agentowi. W tym przypadku poprosiliśmy agenta o „dodanie do fałszywych danych 2 kolejnych sesji”. Wyszuka odpowiedni plik i doda do listy
mockSessions
2 kolejne zdarzenia.
Inne prompty do wypróbowania:
- „Napisz testy jednostkowe dla <klasy> w <module>”.
- „Wygeneruj dokumentację dla aktualnie otwartego pliku”.
- „Zmień tytuł aplikacji z <obecna nazwa> na <nowa nazwa>”.
- „Rozwiąż problem z wyjątkiem wskaźnika o wartości null”.
- „Refaktoruj mój kod, przenosząc funkcję kompozycyjną <composable name> do nowego pliku. Sprawdź, czy wszystkie importy są zaktualizowane”.
- „Dodaj do ekranu głównego aplikacji nowy przycisk „Obserwuj”, który przenosi użytkownika do listy tematów”.
- „W funkcji kompozycyjnej <composable name> zmniejsz dopełnienie modyfikatora <modifier name>”.
- „Utwórz przycisk udostępniania w mediach społecznościowych”.
Dodawanie klucza interfejsu Gemini API
Domyślny tryb agenta w Android Studio ma bezpłatny dzienny limit z ograniczonym oknem kontekstowym. Aby powiększyć okno kontekstu, możesz dodać własny klucz interfejsu Gemini API, aby korzystać z nawet miliona tokenów w Gemini 2.5 Pro.

Większe okno kontekstu umożliwia przesyłanie do Gemini większej liczby instrukcji, kodu i załączników, co przekłada się na jeszcze lepszą jakość odpowiedzi. Jest to szczególnie przydatne podczas pracy z agentami, ponieważ większy kontekst umożliwia Gemini 2.5 Pro wnioskowanie w przypadku złożonych lub długotrwałych zadań.
Aby uzyskać klucz interfejsu API:
- Zaloguj się w Google AI Studio i uzyskaj klucz, klikając przycisk Uzyskaj klucz interfejsu API.
- W Android Studio kliknij Plik (Android Studio na macOS) > Ustawienia > Narzędzia > Gemini, aby wpisać klucz interfejsu Gemini API.
- Uruchom ponownie Gemini w Android Studio i uzyskaj jeszcze lepsze odpowiedzi w trybie agenta.

Zadbaj o bezpieczeństwo klucza Gemini API, ponieważ za korzystanie z Gemini API powiązane z osobistym kluczem interfejsu API obowiązują dodatkowe opłaty. Wykorzystanie klucza interfejsu Gemini API możesz monitorować w AI Studio, klikając Pobierz klucz interfejsu API > Wykorzystanie i płatności.
Dodawanie serwera MCP
Agent Gemini w Android Studio może wchodzić w interakcje z narzędziami zewnętrznymi za pomocą protokołu Model Context Protocol (MCP). Ta funkcja zapewnia standardowy sposób korzystania z narzędzi w trybie agenta oraz rozszerzania wiedzy i możliwości w środowisku zewnętrznym.
Z hostem MCP w Android Studio możesz połączyć wiele narzędzi. Możesz na przykład zintegrować serwer MCP GitHub, aby tworzyć żądania pull bezpośrednio z Androida Studio. Więcej pomysłów znajdziesz w artykule Przykładowe serwery MCP.
Aby dodać serwer MCP, utwórz plik mcp.json
i umieść go w katalogu konfiguracji Studio. Plik mcp.json
powinien mieć taki format:
{
"mcpServers": {
"memory": {
"command": "npx",
"args": [
"-y",
"@modelcontextprotocol/server-memory"
]
},
"sequential-thinking": {
"command": "npx",
"args": [
"-y",
"@modelcontextprotocol/server-sequential-thinking"
]
},
"github": {
"command": "docker",
"args": [
"run",
"-i",
"--rm",
"-e",
"GITHUB_PERSONAL_ACCESS_TOKEN",
"ghcr.io/github/github-mcp-server"
],
"env": {
"GITHUB_PERSONAL_ACCESS_TOKEN": "<YOUR_TOKEN>"
}
}
}
}
W dokumentacji serwera MCP, z którym integrujesz usługę, znajdziesz dokładne wartości command
i args
, które należy umieścić w tym pliku. W zależności od wymagań oprogramowania serwera MCP może być też konieczne zainstalowanie narzędzi takich jak Node.js czy Docker.
Ograniczenia
Integracja MCP w Android Studio ma kilka ważnych ograniczeń:
- Serwery MCP muszą implementować transport stdio.
- Obsługa transportu HTTP w przypadku transmisji strumieniowej, a także zasobów MCP i szablonów promptów nie jest jeszcze dostępna.
Jak działa agent
W trybie agenta prompt jest wysyłany do interfejsu Gemini API wraz z listą dostępnych narzędzi. Narzędzia można traktować jako umiejętności: obejmują one możliwość wyszukiwania plików, odczytywania plików, wyszukiwania tekstu w plikach, korzystania z dowolnych skonfigurowanych przez Ciebie serwerów MCP i nie tylko.
Gdy zlecisz agentowi zadanie, opracuje on plan i określi, jakich narzędzi potrzebuje. Niektóre z tych narzędzi mogą wymagać przyznania uprawnień, zanim agent będzie mógł ich używać. Gdy przyznasz uprawnienia, agent użyje narzędzia do wykonania niezbędnej czynności i prześle wynik z powrotem do interfejsu Gemini API. Gemini przetwarza wynik działania i generuje kolejną odpowiedź. Ten cykl działania i oceny trwa do momentu ukończenia zadania.