Agent-Modus

Gemini im Android Studio-Agent-Modus ist für komplexe, mehrstufige Entwicklungsaufgaben konzipiert, die über das hinausgehen, was Sie mit Gemini per Chat erleben können. Sie können ein allgemeines Ziel beschreiben. Der Kundenservicemitarbeiter erstellt und führt dann einen Plan aus, ruft die erforderlichen Tools auf, nimmt Änderungen an mehreren Dateien vor und behebt schrittweise Fehler. Mit diesem agentenunterstützten Workflow können Sie komplexe Herausforderungen bewältigen und Ihren Entwicklungsprozess beschleunigen.

Systemanforderungen

Der Kundenservicemitarbeitermodus ist ab Android Studio Narwhal Feature Drop Canary 4 verfügbar. Laden Sie die neueste Vorabversion von Android Studio herunter.

Erste Schritte

So starten Sie den Agentenmodus in Android Studio:

  1. Klicken Sie in der Seitenleiste auf Gemini . Melden Sie sich an und führen Sie die Einrichtung durch, falls erforderlich.
  2. Wählen Sie den Tab Kundenservicemitarbeiter aus.
  3. Beschreiben Sie die Aufgabe, die der Kundenservicemitarbeiter ausführen soll.
  4. Während der Kundenservicemitarbeiter die Schritte zur Erledigung der Aufgabe durchführt, können Sie alle Änderungen prüfen und genehmigen.

    Im Kundenservicemitarbeitermodus wird darauf gewartet, dass Sie eine Änderung akzeptieren oder ablehnen.
  5. Optional: Wenn Sie Änderungen automatisch genehmigen möchten, wählen Sie Kundenservicemitarbeiteroptionen > Änderungen automatisch genehmigen aus.

    Von Kundenservicemitarbeitern vorgeschlagene Änderungen automatisch genehmigen.

Anwendungsfälle

Hier sind einige Beispiele für Anwendungsfälle, bei denen der Kundenservicemitarbeiter Ihnen helfen kann:

  • Beheben Sie Build-Fehler. Wenn Sie den Kundenservicemitarbeiter bitten, einen Buildfehler zu beheben, indem Sie beispielsweise „Buildfehler in meinem Projekt beheben“ sagen, wird eine empfohlene Fehlerbehebung angewendet, das Projekt wird erstellt, um die Lösung zu überprüfen, und der Vorgang wird wiederholt, bis das Problem behoben ist.

    Der Kundenservicemitarbeiter kompiliert Ihr Projekt und prüft, ob Fehler vorhanden sind.
  • Im Kundenservicemitarbeitermodus können UI-Elemente automatisch hinzugefügt oder aktualisiert werden. Wenn Sie den Kundenservicemitarbeiter beispielsweise bitten, „den dunklen Modus in den Nutzereinstellungen als Standard festzulegen“, sucht er nach den entsprechenden Dateien und schlägt Änderungen vor, um die Aufgabe auszuführen. Sie können sich die Änderungen an der Benutzeroberfläche sofort im Toolfenster Laufende Geräte in der Vorschau ansehen.

  • Beim Erstellen von Prototypen und Testen Ihrer App sind Mock-Daten hilfreich. Anstatt selbst manuell gefälschte Daten zu erstellen, können Sie diese Aufgabe dem Kundenservicemitarbeiter übertragen. Hier haben wir den Kundenservicemitarbeiter gebeten, „den gefälschten Daten zwei weitere Sitzungen hinzuzufügen“. Er sucht die entsprechende Datei und fügt der Liste mockSessions zwei weitere Ereignisse hinzu.

Weitere Vorschläge:

  • „Schreiben Sie Unittests für <class> in <module>.“
  • „Dokumentation für die aktuell geöffnete Datei generieren“
  • „Ändern Sie den App-Titel von <aktueller Name> in <neuer Name>.“
  • „Beheben Sie die NullPointerException.“
  • „Refaktorisiere meinen Code, indem du das <composable name>-Element in eine neue Datei verschiebst. Prüfen Sie, ob alle Importe aktualisiert sind.“
  • „Dem Startbildschirm der App wird eine neue Schaltfläche hinzugefügt, die den Namen ‚Folgen‘ trägt und zu einer Liste von Themen führt.“
  • „Verringern Sie im Composeable-Element <composable name> den Abstand des Modifiers <modifier name>.“
  • „Erstelle eine Schaltfläche zum Teilen in sozialen Medien.“

Gemini API-Schlüssel hinzufügen

Der standardmäßige Agent-Modus in Android Studio hat ein kostenloses Tageskontingent mit einem begrenzten Kontextfenster. Wenn Sie das Kontextfenster erweitern möchten, können Sie Ihren eigenen Gemini API-Schlüssel hinzufügen, um mit Gemini 2.5 Pro bis zu 1 Million Tokens zu nutzen.

Fügen Sie Ihren eigenen API-Schlüssel hinzu, um das Kontextfenster zu maximieren.

Mit einem größeren Kontextfenster können Sie mehr Anweisungen, Code und Anhänge an Gemini senden, was zu noch besseren Antworten führt. Das ist besonders nützlich, wenn Sie mit Kundenservicemitarbeitern arbeiten, da der größere Kontext Gemini 2.5 Pro die Möglichkeit bietet, komplexe oder langwierige Aufgaben zu bearbeiten.

So rufen Sie einen API-Schlüssel ab:

  1. Melden Sie sich in Google AI Studio an und klicken Sie auf die Schaltfläche „API-Schlüssel abrufen“, um einen Schlüssel zu erhalten.
  2. Geben Sie in Android Studio unter File (Android Studio auf macOS) > Settings (Einstellungen) > Tools > Gemini Ihren Gemini API-Schlüssel ein.
  3. Starten Sie Gemini in Android Studio neu, um noch bessere Antworten vom Agentenmodus zu erhalten.
Fügen Sie in den Gemini-Einstellungen einen eigenen API-Schlüssel hinzu.

Bewahren Sie Ihren Gemini API-Schlüssel gut auf, da für die Nutzung der Gemini API mit einem persönlichen API-Schlüssel zusätzliche Gebühren anfallen. Sie können die Nutzung Ihres Gemini API-Schlüssels in AI Studio unter API-Schlüssel abrufen > Nutzung und Abrechnung im Blick behalten.

MCP-Server hinzufügen

Gemini im Android Studio-Agent kann über das Model Context Protocol (MCP) mit externen Tools interagieren. Diese Funktion bietet eine standardisierte Möglichkeit, im Agent-Modus Tools zu verwenden und Wissen und Funktionen mit der externen Umgebung zu erweitern.

Es gibt viele Tools, mit denen Sie in Android Studio eine Verbindung zum MCP-Host herstellen können. Sie können beispielsweise den Github MCP-Server einbinden, um Pull-Anfragen direkt über Android Studio zu erstellen. Weitere Ideen finden Sie in den MCP-Beispielservern.

Wenn Sie einen MCP-Server hinzufügen möchten, erstellen Sie eine mcp.json-Datei und legen Sie sie im Konfigurationsverzeichnis von Studio ab. Die Datei mcp.json muss dieses Format haben:

{
  "mcpServers": {
    "memory": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-memory"
      ]
    },
    "sequential-thinking": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-sequential-thinking"
      ]
    },
    "github": {
      "command": "docker",
      "args": [
        "run",
        "-i",
        "--rm",
        "-e",
        "GITHUB_PERSONAL_ACCESS_TOKEN",
        "ghcr.io/github/github-mcp-server"
      ],
      "env": {
        "GITHUB_PERSONAL_ACCESS_TOKEN": "<YOUR_TOKEN>"
      }
    }
  }
}

Die genauen command und args, die du in dieser Datei angeben solltest, findest du in der Dokumentation des MCP-Servers, den du einbindest. Je nach den Softwareanforderungen des MCP-Servers müssen Sie möglicherweise auch Tools wie Node.js oder Docker installieren.

Beschränkungen

Die MCP-Integration in Android Studio hat einige wichtige Einschränkungen:

  • MCP-Server müssen den stdio-Transport implementieren.
  • Der Streaming-HTTP-Transport sowie MCP-Ressourcen und Prompt-Vorlagen werden noch nicht unterstützt.

Funktionsweise des Agents

Im Agent-Modus wird der Prompt mit einer Liste der verfügbaren Tools an die Gemini API gesendet. Tools können als Fähigkeiten betrachtet werden: Sie bieten unter anderem die Möglichkeit, nach Dateien zu suchen, Dateien zu lesen, im Text von Dateien zu suchen und alle von Ihnen konfigurierten MCP-Server zu verwenden.

Wenn Sie dem Agenten eine Aufgabe geben, erstellt er einen Plan und ermittelt, welche Tools benötigt werden. Für einige dieser Tools müssen Sie möglicherweise eine Berechtigung erteilen, damit der Kundenservicemitarbeiter sie verwenden kann. Sobald Sie die Berechtigung erteilt haben, führt der Kundenservicemitarbeiter die erforderliche Aktion mit dem Tool aus und sendet das Ergebnis an die Gemini API zurück. Gemini verarbeitet das Ergebnis der Aktion und generiert eine weitere Antwort. Dieser Zyklus aus Aktion und Bewertung wird fortgesetzt, bis die Aufgabe abgeschlossen ist.