Tryb agenta

Tryb agenta Gemini w Android Studio został zaprojektowany do obsługi złożonych, wieloetapowych zadań programistycznych, które wykraczają poza możliwości zwykłej rozmowy z Gemini. Możesz opisać ogólny cel, a agent utworzy i zrealizuje plan, wywołując niezbędne narzędzia, wprowadzając zmiany w wielu plikach i iteracyjnie naprawiając błędy. Ten proces z udziałem agenta umożliwia rozwiązywanie złożonych problemów i przyspiesza proces tworzenia.

Wymagania systemowe

Tryb agenta jest dostępny od wersji Android Studio Narwhal Feature Drop Canary 4. Pobierz najnowszą wersję testową Android Studio

Rozpocznij

Aby rozpocząć korzystanie z trybu agenta w Android Studio, wykonaj te czynności:

  1. Na pasku bocznym kliknij Gemini . W razie potrzeby zaloguj się i przejdź proces rejestracji.
  2. Kliknij kartę Agent.
  3. Opisz zadanie, które ma wykonać agent.
  4. Gdy agent będzie wykonywać kolejne kroki, aby zrealizować zadanie, będziesz mieć możliwość sprawdzenia i zatwierdzenia wszystkich zmian.

    W trybie agenta musisz zaakceptować lub odrzucić zmianę.
  5. Opcjonalnie: aby automatycznie zatwierdzać zmiany, wybierz Opcje agenta> Automatycznie zatwierdzaj zmiany.

    Automatycznie zatwierdzaj zmiany sugerowane przez agenta.

Przypadki użycia

Oto kilka przykładów zastosowań, w których agent może Ci pomóc:

  • Napraw błędy kompilacji. Gdy poprosisz agenta o naprawienie błędu kompilacji za pomocą promptu, np. „Napraw błędy kompilacji w moim projekcie”, zastosuje on zalecaną poprawkę, skompiluje projekt, aby zweryfikować rozwiązanie, i będzie powtarzać te czynności, dopóki problem nie zostanie rozwiązany.

    Agent tworzy projekt i sprawdza, czy nie ma w nim błędów.
  • Tryb agenta może samodzielnie dodawać i aktualizować elementy interfejsu. Możesz na przykład poprosić agenta o „Ustawienie trybu ciemnego jako domyślnego w ustawieniach użytkownika”. Wyszuka on odpowiednie pliki i zaproponuje zmiany, które pozwolą wykonać to zadanie. Możesz od razu wyświetlić podgląd zmian w interfejsie w oknie narzędzia Uruchomione urządzenia.

  • Podczas tworzenia prototypu i testowania aplikacji przydatne są dane testowe. Zamiast ręcznie tworzyć fałszywe dane, możesz zlecić to zadanie agentowi. W tym przypadku poprosiliśmy agenta o „dodanie do fałszywych danych 2 kolejnych sesji”. Wyszuka odpowiedni plik i doda do listy mockSessions 2 kolejne zdarzenia.

Inne prompty do wypróbowania:

  • „Napisz testy jednostkowe dla <klasy> w <module>”.
  • „Wygeneruj dokumentację dla aktualnie otwartego pliku”.
  • „Zmień tytuł aplikacji z <obecna nazwa> na <nowa nazwa>”.
  • „Rozwiąż problem z wyjątkiem wskaźnika o wartości null”.
  • „Refaktoruj mój kod, przenosząc funkcję kompozycyjną <composable name> do nowego pliku. Sprawdź, czy wszystkie importy są zaktualizowane”.
  • „Dodaj do ekranu głównego aplikacji nowy przycisk „Obserwuj”, który przenosi użytkownika do listy tematów”.
  • „W funkcji kompozycyjnej <composable name> zmniejsz dopełnienie modyfikatora <modifier name>”.
  • „Utwórz przycisk udostępniania w mediach społecznościowych”.

Dodawanie klucza interfejsu Gemini API

Domyślny tryb agenta w Android Studio ma bezpłatny dzienny limit z ograniczonym oknem kontekstowym. Aby powiększyć okno kontekstu, możesz dodać własny klucz interfejsu Gemini API, aby korzystać z nawet miliona tokenów w Gemini 2.5 Pro.

Dodaj własny klucz interfejsu API, aby zwiększyć okno kontekstu.

Większe okno kontekstu umożliwia przesyłanie do Gemini większej liczby instrukcji, kodu i załączników, co przekłada się na jeszcze lepszą jakość odpowiedzi. Jest to szczególnie przydatne podczas pracy z agentami, ponieważ większy kontekst umożliwia Gemini 2.5 Pro wnioskowanie w przypadku złożonych lub długotrwałych zadań.

Aby uzyskać klucz interfejsu API:

  1. Zaloguj się w Google AI Studio i uzyskaj klucz, klikając przycisk Uzyskaj klucz interfejsu API.
  2. W Android Studio kliknij Plik (Android Studio na macOS) > Ustawienia > Narzędzia > Gemini, aby wpisać klucz interfejsu Gemini API.
  3. Uruchom ponownie Gemini w Android Studio i uzyskaj jeszcze lepsze odpowiedzi w trybie agenta.
Dodaj własny klucz interfejsu API w ustawieniach Gemini.

Zadbaj o bezpieczeństwo klucza Gemini API, ponieważ za korzystanie z Gemini API powiązane z osobistym kluczem interfejsu API obowiązują dodatkowe opłaty. Wykorzystanie klucza interfejsu Gemini API możesz monitorować w AI Studio, klikając Pobierz klucz interfejsu API > Wykorzystanie i płatności.

Dodawanie serwera MCP

Agent Gemini w Android Studio może wchodzić w interakcje z narzędziami zewnętrznymi za pomocą protokołu Model Context Protocol (MCP). Ta funkcja zapewnia standardowy sposób korzystania z narzędzi w trybie agenta oraz rozszerzania wiedzy i możliwości w środowisku zewnętrznym.

Z hostem MCP w Android Studio możesz połączyć wiele narzędzi. Możesz na przykład zintegrować serwer MCP GitHub, aby tworzyć żądania pull bezpośrednio z Androida Studio. Więcej pomysłów znajdziesz w artykule Przykładowe serwery MCP.

Aby dodać serwer MCP, utwórz plik mcp.json i umieść go w katalogu konfiguracji Studio. Plik mcp.json powinien mieć taki format:

{
  "mcpServers": {
    "memory": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-memory"
      ]
    },
    "sequential-thinking": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-sequential-thinking"
      ]
    },
    "github": {
      "command": "docker",
      "args": [
        "run",
        "-i",
        "--rm",
        "-e",
        "GITHUB_PERSONAL_ACCESS_TOKEN",
        "ghcr.io/github/github-mcp-server"
      ],
      "env": {
        "GITHUB_PERSONAL_ACCESS_TOKEN": "<YOUR_TOKEN>"
      }
    }
  }
}

W dokumentacji serwera MCP, z którym integrujesz usługę, znajdziesz dokładne wartości commandargs, które należy umieścić w tym pliku. W zależności od wymagań oprogramowania serwera MCP może być też konieczne zainstalowanie narzędzi takich jak Node.js czy Docker.

Ograniczenia

Integracja MCP w Android Studio ma kilka ważnych ograniczeń:

  • Serwery MCP muszą implementować transport stdio.
  • Obsługa transportu HTTP w przypadku transmisji strumieniowej, a także zasobów MCP i szablonów promptów nie jest jeszcze dostępna.

Jak działa agent

W trybie agenta prompt jest wysyłany do interfejsu Gemini API wraz z listą dostępnych narzędzi. Narzędzia można traktować jako umiejętności: obejmują one możliwość wyszukiwania plików, odczytywania plików, wyszukiwania tekstu w plikach, korzystania z dowolnych skonfigurowanych przez Ciebie serwerów MCP i nie tylko.

Gdy zlecisz agentowi zadanie, opracuje on plan i określi, jakich narzędzi potrzebuje. Niektóre z tych narzędzi mogą wymagać przyznania uprawnień, zanim agent będzie mógł ich używać. Gdy przyznasz uprawnienia, agent użyje narzędzia do wykonania niezbędnej czynności i prześle wynik z powrotem do interfejsu Gemini API. Gemini przetwarza wynik działania i generuje kolejną odpowiedź. Ten cykl działania i oceny trwa do momentu ukończenia zadania.