Agent-Modus

Der Agent-Modus von Gemini in Android Studio ist für komplexe Entwicklungsaufgaben mit mehreren Phasen konzipiert, die über das hinausgehen, was Sie durch einfaches Chatten mit Gemini erreichen können. Sie können ein übergeordnetes Ziel beschreiben. Der Agent erstellt und führt dann einen Plan aus, ruft die erforderlichen Tools auf, nimmt Änderungen an mehreren Dateien vor und behebt Fehler iterativ. Dieser agentengestützte Workflow ermöglicht es Ihnen, komplexe Herausforderungen zu meistern und den Entwicklungsprozess zu beschleunigen.

Systemanforderungen

Der Agent-Modus ist ab Android Studio Narwhal Feature Drop Canary 4 verfügbar. Laden Sie die aktuelle Vorschauversion von Android Studio herunter.

Erste Schritte

So starten Sie den Agent-Modus in Android Studio:

  1. Klicken Sie in der Seitenleiste auf Gemini . Melden Sie sich an und führen Sie das Onboarding durch, falls erforderlich.
  2. Wählen Sie den Tab Agent aus.
  3. Beschreiben Sie die Aufgabe, die der Agent ausführen soll.
  4. Während der Kundenservicemitarbeiter die Schritte zur Erledigung der Aufgabe durchgeht, haben Sie die Möglichkeit, alle Änderungen zu prüfen und zu genehmigen.

    Im Agent-Modus müssen Sie Änderungen akzeptieren oder ablehnen.
  5. Optional: Wenn Sie Änderungen automatisch genehmigen möchten, wählen Sie Agent-Optionen  Änderungen automatisch genehmigen aus.

    Vom Agent vorgeschlagene Änderungen automatisch genehmigen

Anwendungsfälle

Hier sind einige Beispiele für Anwendungsfälle, bei denen der Agent Sie unterstützen kann:

  • Beheben Sie Build-Fehler. Wenn Sie den Agenten mit einem Prompt wie „Fix build errors in my project“ (Behebe Build-Fehler in meinem Projekt) auffordern, einen Build-Fehler zu beheben, wendet er eine empfohlene Korrektur an, führt einen Build des Projekts aus, um die Lösung zu überprüfen, und wiederholt den Vorgang, bis das Problem behoben ist.

    Der Agent erstellt Ihr Projekt und prüft, ob Fehler vorhanden sind.
  • Im Agent-Modus können UI-Elemente automatisch hinzugefügt oder aktualisiert werden. Sie können den Agenten beispielsweise bitten, den „Dark Mode als Standard in den Nutzereinstellungen festzulegen“. Er sucht dann nach den entsprechenden Dateien und schlägt Änderungen vor, um die Aufgabe zu erledigen. Sie können sich die UI-Aktualisierungen sofort im Toolfenster Running Devices (Aktive Geräte) ansehen.

  • Beim Prototyping und Testen Ihrer App sind Mock-Daten hilfreich. Anstatt gefälschte Daten manuell zu erstellen, können Sie diese Aufgabe dem Agenten überlassen. Hier haben wir den Agenten gebeten, den gefälschten Daten zwei weitere Sitzungen hinzuzufügen. Die entsprechende Datei wird gefunden und der Liste mockSessions werden zwei weitere Ereignisse hinzugefügt.

Weitere Prompts zum Ausprobieren:

  • „Schreibe Unittests für <class> in <module>.“
  • „Generiere Dokumentation für die aktuell geöffnete Datei.“
  • „Ändere den App-Titel von <aktueller Name> zu <neuer Name>.“
  • „Behebe die NullPointerException.“
  • „Lagere die Composable-Funktion <composable name> in eine neue Datei aus.“ Achten Sie darauf, dass alle Importe aktualisiert werden.“
  • „Füge dem Startbildschirm der App eine neue Schaltfläche mit dem Namen ‚Folgen‘ hinzu, über die du zu einer Liste von Themen gelangst.“
  • „Reduziere im Composable <composable name> das Padding des Modifiers <modifier name>.“
  • „Erstelle eine Schaltfläche zum Teilen in sozialen Medien.“

Gemini API-Schlüssel hinzufügen

Der Standard-Agent-Modus in Android Studio hat ein kostenloses Tageskontingent mit einem begrenzten Kontextfenster. Wenn Sie das Kontextfenster erweitern möchten, können Sie Ihren eigenen Gemini API-Schlüssel hinzufügen, um mit Gemini 2.5 Pro bis zu 1 Million Tokens zu nutzen.

Fügen Sie Ihren eigenen API-Schlüssel hinzu, um das Kontextfenster zu erweitern.

Mit einem größeren Kontextfenster können Sie mehr Anweisungen, Code und Anhänge an Gemini senden, was zu noch hochwertigeren Antworten führt. Das ist besonders nützlich, wenn Sie mit Agents arbeiten, da der größere Kontext Gemini 2.5 Pro die Möglichkeit gibt, komplexe oder langwierige Aufgaben zu bearbeiten.

So rufen Sie einen API-Schlüssel ab:

  1. Melden Sie sich in Google AI Studio an und rufen Sie einen Schlüssel ab, indem Sie auf die Schaltfläche „API-Schlüssel abrufen“ klicken.
  2. Geben Sie in Android Studio unter File (Android Studio unter macOS) > Settings > Tools > Gemini Ihren Gemini API-Schlüssel ein.
  3. Starten Sie Gemini in Android Studio neu, um noch bessere Antworten im Agent-Modus zu erhalten.
Fügen Sie in den Gemini-Einstellungen Ihren eigenen API-Schlüssel hinzu.

Schützen Sie Ihren Gemini API-Schlüssel, da für die Nutzung der Gemini API mit einem persönlichen API-Schlüssel zusätzliche Gebühren anfallen. Sie können die Nutzung Ihres Gemini API-Schlüssels in AI Studio unter API-Schlüssel abrufen > Nutzung und Abrechnung überwachen.

MCP-Server hinzufügen

Der Agent von Gemini in Android Studio kann über das Model Context Protocol (MCP) mit externen Tools interagieren. Diese Funktion bietet eine standardisierte Möglichkeit für den Agent-Modus, Tools zu verwenden und Wissen und Funktionen mit der externen Umgebung zu erweitern.

Es gibt viele Tools, die Sie in Android Studio mit dem MCP-Host verbinden können. Sie können beispielsweise den Github MCP Server einbinden, um Pull-Anfragen direkt in Android Studio zu erstellen. Weitere Ideen finden Sie auf den MCP-Beispielservern.

Wenn Sie einen MCP-Server hinzufügen möchten, erstellen Sie eine mcp.json-Datei und legen Sie sie im Konfigurationsverzeichnis von Studio ab. Die Datei mcp.json sollte dieses Format haben:

{
  "mcpServers": {
    "memory": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-memory"
      ]
    },
    "sequential-thinking": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-sequential-thinking"
      ]
    },
    "github": {
      "command": "docker",
      "args": [
        "run",
        "-i",
        "--rm",
        "-e",
        "GITHUB_PERSONAL_ACCESS_TOKEN",
        "ghcr.io/github/github-mcp-server"
      ],
      "env": {
        "GITHUB_PERSONAL_ACCESS_TOKEN": "<YOUR_TOKEN>"
      }
    }
  }
}

In der Dokumentation für den MCP-Server, den Sie einbinden, finden Sie die genauen command und args, die Sie in dieser Datei angeben sollten. Je nach Softwareanforderungen des MCP-Servers müssen Sie möglicherweise auch Tools wie Node.js oder Docker installieren.

Beschränkungen

Die MCP-Integration in Android Studio hat einige wichtige Einschränkungen:

  • MCP-Server müssen den stdio-Transport implementieren.
  • Die Unterstützung für den Streaming-HTTP-Transport sowie für MCP-Ressourcen und Prompt-Vorlagen ist noch nicht verfügbar.

Funktionsweise des Agents

Im Agent-Modus wird Ihr Prompt zusammen mit einer Liste der verfügbaren Tools an die Gemini API gesendet. Tools können als Fähigkeiten betrachtet werden: Sie umfassen die Möglichkeit, nach Dateien zu suchen, Dateien zu lesen, den Text in Dateien zu durchsuchen und alle konfigurierten MCP-Server zu verwenden.

Wenn Sie dem Agent eine Aufgabe zuweisen, erstellt er einen Plan und ermittelt, welche Tools erforderlich sind. Für einige dieser Tools müssen Sie möglicherweise eine Berechtigung erteilen, bevor der Agent sie verwenden kann. Sobald Sie die Berechtigung erteilt haben, verwendet der Agent das Tool, um die erforderliche Aktion auszuführen, und sendet das Ergebnis zurück an die Gemini API. Gemini verarbeitet das Ergebnis der Aktion und generiert eine weitere Antwort. Dieser Zyklus aus Aktion und Bewertung wird fortgesetzt, bis die Aufgabe abgeschlossen ist.