KI-Agenten im Unternehmen: So gelingt der Einstieg in die Produktion

Die ersten Schritte mit KI-Agenten in Unternehmen sind einfach – bis es darum geht, die Technologie zuverlässig in die Produktion zu bringen. Viele Teams scheitern nicht an der Technik, sondern an organisatorischen Hürden und unklaren Rollout-Strategien.

Jordan, Plattformingenieur bei MyCoCo, beobachtete tagtäglich dasselbe Problem: Entwickler:innen stellten unpräzise Anforderungen an die Infrastruktur – etwa nach Datenbanken oder Speicherlösungen – die erst nach umfangreicher Rücksprache umgesetzt werden konnten. Die manuelle Erstellung von Terraform-Code für jede Anfrage war zeitaufwendig und fehleranfällig. Die Idee eines Plattform-Infrastruktur-Agenten war geboren: ein System, das natürliche Sprachanfragen interpretiert, Klarstellungen einholt und automatisch Pull Requests für die Infrastrukturcode-Generierung erstellt.

Doch die technische Umsetzung war nur ein Teil der Herausforderung. Der wahre Test bestand darin, den Agenten so in den Unternehmensprozess zu integrieren, dass er von der Demo zur produktiven Nutzung übergehen konnte.

Warum die meisten KI-Agenten im Demo-Stadium stecken bleiben

Die Diskrepanz zwischen beeindruckenden Demos und der tatsächlichen Produktivsetzung ist ein bekanntes Phänomen in der Tech-Branche. Jordan erkannte schnell, dass die größten Hürden nicht technischer, sondern organisatorischer Natur waren:

Eingeschränkte Tool-Auswahl: MyCoCo setzte ausschließlich auf Google Gemini-Modelle, was die Auswahl an Frameworks und Cloud-Diensten einschränkte. AWS Bedrock war keine Option, da es keine native Unterstützung für Gemini bot.

Fehlende interne Vorlagen: Jede Entscheidung – von Authentifizierungsmustern bis zur Fehlerbehandlung – würde zum Standard für zukünftige Agenten. Es gab keine bewährten Prozesse für den Umgang mit agentischen Workflows im Unternehmen.

Unklare Kostenstrukturen: Die Token-Nutzung und damit verbundene Kosten waren anfangs undurchsichtig. Ohne Transparenz über die Wirtschaftlichkeit ließ sich schwer einschätzen, ob der Ansatz skalierbar war.

Alex, VP of Engineering, formulierte die zentrale Frage: Wie bringen wir den Agenten in die Produktion, ohne Monate mit übertriebenen Sicherheitsvorkehrungen zu verlieren?

Der richtige Rollout: Progressive Vertrauensbildung

Ein erfolgreicher Agent-Einsatz erfordert mehr als nur technische Machbarkeit. MyCoCo setzte auf einen stufenweisen Rollout, der Vertrauen aufbaute und gleichzeitig die Komplexität kontrollierbar hielt.

1. Die Entwicklungs- und Testumgebung als kritischer Erfolgsfaktor

Die wichtigste Voraussetzung für den Agenten war eine SandBox-Umgebung, die der Produktionsumgebung in Verhalten und Struktur ähnelte. Jordan erstellte automatisierte Testanfragen, die reale Infrastrukturwünsche nachahmten – von Datenbanken bis zu Speicherlösungen. Ein Skript verwaltete die Erstellung und Löschung von Testfällen, sodass jeder Durchlauf in einer frischen Umgebung stattfand. Dies ermöglichte eine wiederholbare Validierung ohne manuellen Aufwand.

2. KI-gestützte Entwicklung für schnellere Iterationen

Der Aufbau von Agenten aus dem Nichts ist für die meisten Teams eine Herausforderung. Jordan nutzte Claude Code, um die Architektur zu planen, unerwartete Verhaltensweisen zu debuggen und Prompts basierend auf tatsächlichen Ausgaben zu verfeinern. Der Schlüssel lag darin, ein klares mentales Modell der Abläufe zu behalten und nicht blind auf KI-Vorschläge zu vertrauen.

3. Der Stufenplan für den Rollout

Statt eines abrupten Wechsels von der Entwicklung in die Produktion definierte Jordan vier klar abgestufte Phasen, die schrittweise mehr Verantwortung an den Agenten übertrugen:

Stufe 1 – Entwicklungsumgebung: Der Agent generiert Pull Requests gegen ein SandBox-Repository, ohne Auswirkungen auf die tatsächliche Infrastruktur.

Stufe 2 – Manuelle Produktion: Der Agent verarbeitet echte Anfragen, aber nur eine pro Durchlauf. Jeder Output wird vor der Weitergabe an Entwickler:innen überprüft.

Stufe 3 – Halbautomatisierter Fluss: Der Agent reagiert auf Anfragen in der Plattform-Kommunikation, generiert Pull Requests und benachrichtigt Entwickler:innen.

Stufe 4 – Erweiterte Nutzung: Der Agent verarbeitet komplexere Anfragen und ist in bestehende Genehmigungsworkflows integriert.

Vor jedem Wechsel in eine höhere Stufe demonstrierte Jordan den aktuellen Stand dem Team. Die Plattform-Teams übernahm die Verantwortung für potenzielle Probleme, während die breitere Organisation schrittweise eingebunden wurde.

4. Angemessene Sicherheitsvorkehrungen statt Über-Engineering

Maya, Sicherheitsexpertin bei MyCoCo, forderte umfassende Audit-Logs für den Agenten. Jordan argumentierte jedoch:

„Dieser Agent generiert Pull Requests zur menschlichen Überprüfung. Er kann keine Infrastruktur direkt provisionieren, auf sensible Daten zugreifen oder Ausfälle verursachen. Die maximale Auswirkung ist ein abgelehnter Pull Request.“

Nicht jeder Agent benötigt unternehmensweite Sicherheitsmaßnahmen. Stattdessen setzte das Team auf risikobasierte Entscheidungen – schwere Sicherheitsvorkehrungen wurden für Agenten mit höherer Auswirkung reserviert.

5. Kostenkontrolle von Beginn an

Von Anfang an verfolgte Jordan die Token-Nutzung und die geschätzten Kosten pro Agentenlauf. Innerhalb von zwei Wochen konnten grobe Kosten pro verarbeiteter Anfrage abgeschätzt werden. Als Alex nach einem Rahmen für zukünftige Agenten fragte, stieß das Team auf einen Artikel von CloudYali, der ein drei-stufiges Kostenmodell vorschlug:

Phase 1 – Lernen (unter 20.000 USD/Monat): Projektisolierung und grundlegende Kostenverfolgung
Phase 2 – Skalieren (20.000–200.000 USD/Monat): Investition in Taxonomie für Kosten-Tagging
Phase 3 – Optimieren (über 200.000 USD/Monat): Einsatz von Gateway-Infrastruktur

MyCoCo befand sich klar in Phase 1. Dies bestätigte die Entscheidung, nicht in übermäßige Komplexität zu investieren. Stattdessen wurde eine einfache Kostenattributierung eingeführt: Team, Produkt und Umgebung – ein Schema, das zukünftige Agenten problemlos übernehmen können.

Fazit: Ein Agent als Blaupause für zukünftige Workflows

Der erste KI-Agent bei MyCoCo war nicht nur ein technisches Experiment, sondern ein Modell für zukünftige agentische Workflows. Durch einen strukturierten Rollout mit progressivem Vertrauensaufbau und angepasster Komplexität gelang es dem Team, den Agenten in nur sechs Wochen in die Produktion zu bringen.

Die wichtigsten Erkenntnisse für Unternehmen, die ähnliche Projekte planen:

Baue auf einer SandBox-Umgebung auf, die der Produktion entspricht – sie ist der Schlüssel zur validen Testbarkeit.
Nutze KI-gestützte Entwicklungswerkzeuge, um schneller und effizienter zu iterieren.
Setze auf einen stufenweisen Rollout, der Vertrauen schafft und gleichzeitig Risiken minimiert.
Vermeide Über-Engineering – nicht jeder Agent benötigt enterprise-weite Sicherheitsvorkehrungen.
Beginne mit Kostenkontrolle von Tag eins, um wirtschaftliche Entscheidungen fundiert zu treffen.

Der Erfolg dieses ersten Agenten zeigt: Der Weg zum produktiven KI-Agenten beginnt nicht mit der Technik, sondern mit einem durchdachten Rollout-Plan. Unternehmen, die diese Prinzipien übernehmen, vermeiden die typischen Fallstricke und setzen KI-Agenten effizient ein – ohne im Demo-Stadium stecken zu bleiben.

KI-Zusammenfassung

AI ajanlarını demo aşamasından üretime geçirmek neden bu kadar zor? MyCoCo'nun platform ekibi, ilk ajanlarını 6 haftada hayata geçirirken neler öğrendi? Detaylı rollout stratejisi ve organizasyonel dersler.