GitHub Agentic Workflows sind wie ein unsichtbares Reinigungsteam, das täglich kleine Fehler in Repositories behebt. Diese automatisierten Helfer steigern die Codequalität spürbar, doch ihr unkontrollierter Ressourcenverbrauch wird zunehmend zum Problem. Besonders problematisch: Die Kosten für API-Aufrufe häufen sich unbemerkt an, da die Workflows regelmäßig und ohne menschliches Zutun ausgeführt werden.
Um dem entgegenzuwirken, startete GitHub im April 2026 ein systematisches Projekt zur Token-Optimierung. Das Ziel: Den Verbrauch transparenter machen und gezielt senken, ohne die Effektivität der Workflows zu beeinträchtigen. Die Maßnahmen basieren auf drei zentralen Säulen: präzise Messung, automatisierte Analyse und strukturelle Anpassungen.
Token-Verbrauch sichtbar machen
Die Herausforderung begann mit der Heterogenität der Agenten-Frameworks. Claude CLI, Copilot CLI und Codex CLI protokollierten ihre Token-Nutzung in unterschiedlichen Formaten – historische Daten waren oft unvollständig oder schwer vergleichbar. Eine einheitliche Erfassung schien zunächst unmöglich.
Doch eine Sicherheitsarchitektur mit API-Proxy erwies sich als Schlüssel. Dieser Proxy fängt alle Authentifizierungsanfragen ab und standardisiert die Ausgabe in einem einheitlichen Format. Seit der Einführung generiert jeder Workflow ein Artefakt namens token-usage.jsonl, das pro API-Aufruf detaillierte Daten enthält:
- Eingabetokens und Ausgabetokens
- Cache-Zugriffe (Lese- und Schreiboperationen)
- Verwendetes Modell und Anbieter
- Zeitstempel der Aufrufe
Kombiniert mit den regulären Logs des Workflows entsteht so ein vollständiges Bild des Token-Verbrauchs – inklusive historischer Muster und Ausreißer. Erst diese Transparenz ermöglichte gezielte Optimierungen.
Automatisierte Prüfer und Optimierer
Mit den gesammelten Daten entwickelte GitHub zwei sich selbst überwachende Workflows:
1. Der tägliche Token-Nutzungsprüfer Dieser analysiert die Artefakte der letzten Workflow-Läufe, aggregiert den Verbrauch nach einzelnen Workflows und erstellt strukturierte Berichte. Seine Hauptaufgaben:
- Identifizierung von Workflows mit sprunghaft gestiegenem Verbrauch
- Hervorhebung der kostenintensivsten Workflows
- Erkennung anomaler Läufe (z. B. ein Workflow, der normalerweise vier LLM-Schritte benötigt, aber plötzlich 18 Schritte ausführt)
2. Der tägliche Token-Optimierer Bei Auffälligkeiten erstellt dieser automatisch GitHub-Issues mit konkreten Handlungsempfehlungen. Dazu gehören:
- Analyse der Workflow-Quelldateien
- Vorschläge zur Reduzierung redundanter Aufrufe
- Identifikation ineffizienter Tool-Nutzung
Interessanterweise sind beide Prüfer selbst agentische Workflows – ihr eigener Token-Verbrauch wird ebenfalls protokolliert und fließt in die täglichen Berichte ein. Dies schafft einen kontinuierlichen Verbesserungszyklus.
Unnötige MCP-Tools eliminieren
Die häufigste Ineffizienz in Agentic Workflows entpuppte sich als überflüssige MCP-Tool-Registrierungen. Viele Workflows laden standardmäßig sämtliche verfügbaren Tools, auch wenn nur ein Bruchteil tatsächlich genutzt wird.
Das Problem: LLM-APIs sind zustandslos. Jeder Request enthält die vollständigen Tool-Definitionen, inklusive Funktionsnamen und JSON-Schemata. Bei einem GitHub-MCP-Server mit 40 Tools summiert sich das auf 10–15 KB zusätzlichen Kontext pro Schritt. Werden davon nur zwei Tools genutzt, sind die restlichen 38 reine Overhead-Kosten.
Der Optimierer identifiziert diese Muster, indem er:
- Die Tool-Manifeste mit den tatsächlich aufgerufenen Tools abgleicht
- Unverwendete Tools markiert
- Konkrete Empfehlungen zur Konfiguration ausgibt
In Test-Workflows führte das Entfernen ungenutzter Tools zu einer Reduzierung des Kontexts um 8–12 KB pro Aufruf. Bei mehreren tausend Token pro Run summiert sich das zu spürbaren Einsparungen – ohne Beeinträchtigung der Funktionalität.
GitHub CLI als effiziente Alternative zu MCP
Ein größeres Optimierungspotenzial lag in der Ersetzung von GitHub-MCP-Aufrufen durch direkte CLI-Kommandos. Besonders bei datenintensiven Operationen wie der Abfrage von Pull-Request-Diffs oder Dateiinhalten zeigte sich ein erhebliches Einsparpotenzial.
Zwei Strategien kamen zum Einsatz:
1. Vorab-Datenbeschaffung Für Daten, die ein Agent in jedem Fall benötigt (z. B. Diffs oder geänderte Dateien), werden vor dem Agentenstart gh-Befehle ausgeführt. Die Ergebnisse werden in Dateien geschrieben, die der Agent später direkt einliest. Dies eliminiert:
- Den Overhead von Tool-Aufrufen
- Den JSON-Schema-Overhead
- Die Notwendigkeit für LLM-Decision-Making
2. In-Agent-CLI-Proxy-Substitution Bei dynamischen Datenanforderungen, die erst zur Laufzeit bestimmt werden, kommt ein transparenter HTTP-Proxy zum Einsatz. Dieser leitet CLI-Befehle wie gh pr view --json direkt an GitHubs REST-API weiter – ohne den Agenten mit Authentifizierungstokens zu belasten. Der Agent erhält die strukturierten Daten wie ein Terminal-Nutzer, während die Token-Kosten auf ein Minimum sinken.
Beide Ansätze kombiniert ermöglichen es, den Großteil der MCP-basierten Datenabfragen durch deterministische HTTP-Requests zu ersetzen. Die Einsparungen sind signifikant: In Smoke-Tests reduzierte sich der Token-Verbrauch um bis zu 40 % bei gleichbleibender Funktionalität.
Fazit: Nachhaltige Optimierung durch Automatisierung
Die Erfahrungen von GitHub zeigen: Agentic Workflows lassen sich mit strukturierten Messungen, automatisierten Analysen und gezielten Code-Anpassungen deutlich effizienter gestalten. Die entwickelten Tools – vom Token-Logger bis zum Optimierer – sind selbst agentische Workflows und schaffen damit einen kontinuierlichen Verbesserungsprozess.
Für Entwicklerteams bedeutet dies: Der Aufwand für manuelle Optimierungen entfällt. Stattdessen reichen gezielte Anpassungen an der Tool-Konfiguration, während die Automatisierung den Rest übernimmt. Die Zukunft agentischer Workflows liegt nicht nur in ihrer Funktionalität, sondern in ihrer Fähigkeit, sich selbst zu optimieren – bevor die Kosten aus dem Ruder laufen.
KI-Zusammenfassung
GitHub Agentik İş Akışları’nın token verimliliğini artırmak için kullanılan stratejiler, MCP araç optimizasyonu ve GitHub CLI geçişi hakkında detaylı bilgiler. %30’a varan tasarruf sonuçları ve uygulama adımları.