Unternehmen erkennen: KI-Agenten brauchen eine zuverlässige Infrastruktur

Unternehmen setzen zunehmend KI-Agenten in der Produktion ein – doch viele stoßen an Grenzen: Leistung allein garantiert keinen Erfolg. Langlaufende KI-Workflows müssen Ausfälle überstehen, ihren Zustand bewahren, Kosten kontrollieren und sich mit APIs, Tools und Unternehmenssystemen koordinieren.

Die erste Welle der Agenten-Implementierungen war oft von Geschwindigkeit geprägt. Doch nun, da Fehler und Performance-Probleme sichtbar werden, beginnen Unternehmen mit der Überarbeitung. Preeti Somal, Senior Vice President Engineering bei Temporal Technologies, betonte auf der AI Impact Series in New York: „Viele Kunden kommen zu uns und bauen Version 2.0 desselben Agenten.“ Ursprünglich wurde schnell entwickelt, doch die Grundlagen wie Workflow-Orchestrierung und Fehlerbehandlung wurden vernachlässigt. „Jetzt stürzen Systeme ab, und plötzlich muss alles neu aufgebaut werden – mit einer zuverlässigen Infrastruktur.“

KI-Agenten verschärfen klassische Engineering-Herausforderungen

Die Probleme, mit denen Unternehmen heute kämpfen, sind nicht neu – doch KI verstärkt sie. Agenten führen oft langlaufende, mehrstufige Prozesse aus, die mehrere Dienste, Modelle, APIs und externe Tools einbinden. Ein Workflow kann etwa mehrere große Sprachmodelle abfragen, Retrieval-Systeme nutzen, Anwendungen auslösen und den Zustand über Stunden oder Tage hinweg verwalten. Die kritischen Fragen tauchen meist erst nach der Bereitstellung auf.

„Team entwickeln Agenten, ohne zu bedenken, was passiert, wenn das System abstürzt“, erklärt Somal. „Müssen wir den gesamten Ablauf neu starten? Oder können wir an der letzten bekannten Position weitermachen?“ Für Unternehmen mit Kostendruck ist die Antwort entscheidend: Ein Neustart erhöht nicht nur die Latenz, sondern auch die Inferenzkosten – und verschlechtert die Nutzererfahrung.

Somal zieht einen Vergleich zur frühen Phase der Cloud-Migration: Damals verlagerten Unternehmen Workloads ohne Anpassung der zugrundeliegenden Architektur. „Das erinnert mich an das ‚Lift-and-Shift‘ in der Cloud“, sagt sie. „Alle merkten: Wir zahlen mehr für die Cloud, ohne den gewünschten Nutzen zu erzielen.“

Warum langlaufende Agenten eine neue Architektur erfordern

Immer häufiger führen Agenten Workflows aus, die über Stunden laufen und dabei mit Tools und Systemen interagieren. Die Herausforderungen wachsen mit der Laufzeit – besonders bei Zustand und Speicher, zwei oft verwechselten Konzepten.

Der Zustand beschreibt den Fortschritt eines Agenten: Welche Schritte wurden bereits abgeschlossen? Wo muss die Ausführung nach einem Absturz fortgesetzt werden? Speicher hingegen bezieht sich auf die Informationen, die der Agent für zukünftige Interaktionen behält.

„Zustand ist entscheidend, wenn ein Agent nach einem Absturz weiß, wo er weitermachen soll“, erklärt Somal. „Speicher hingegen umfasst Kontext wie historische Daten oder Nutzerpräferenzen.“

Der Unterschied wird besonders deutlich, wenn Unternehmen einfache Chatbot-Interaktionen hinter sich lassen und komplexe Geschäftsprozesse automatisieren. Ein Beispiel aus der Gesundheitsbranche: Der Kunde Abridge nutzt Agenten, um Arztbesuche zu verarbeiten – von der Audioaufnahme über die Zusammenfassung bis hin zum Abschlussbericht. „Das ist kein einzelner Schritt“, so Somal. „Es geht um die Orchestrierung mehrerer Prozesse: Audioaufteilung, Zusammenfassung, LLM-Abfragen, Berichterstellung.“

Für Unternehmen bedeutet das: Erfolgreiche Agenten brauchen Systeme, die Unterbrechungen überstehen, Dienste koordinieren und Kontinuität über die Zeit hinweg sicherstellen.

Der deterministische Rückgrat: Stabilität trotz KI-Unsicherheit

Ein zentrales Konzept für zuverlässige KI-Agenten ist laut Somal das deterministische Rückgrat. Es definiert den geplanten Ablauf, ruft die KI-Komponente auf und sorgt dafür, dass der Prozess auch bei Fehlern oder Verzögerungen fortgesetzt wird.

„Das Rückgrat legt den Pfad fest“, sagt Somal. „Es ruft das Gehirn auf – und wenn es nicht antwortet, versucht es es erneut. Fällt der nächste Schritt aus, startet es an der letzten bekannten Position.“

In diesem Modell agiert das Sprachmodell als probabilistisches System mit variablen Ausgaben, während die Orchestrierungssoftware die Ausführung stabilisiert. Das ist entscheidend, denn Unternehmen benötigen Konsistenz – selbst wenn Modelle unvorhersehbar sind. Ein Beschaffungsworkflow, eine Gesundheitszusammenfassung oder ein Compliance-Prozess darf nicht einfach scheitern, nur weil ein Modell-Tokenlimit erreicht wurde oder eine externe Abhängigkeit ausfiel.

„Das Wichtigste ist, dass wir uns erholen und keine unnötigen Token verbrauchen, wenn etwas schiefgeht“, betont Somal.

Kostenkontrolle durch Transparenz: Token-Spendings sichtbar machen

Für Führungskräfte wird die Wirtschaftlichkeit von KI-Agenten zunehmend zur Priorität. Langlaufende Workflows mit mehreren Modellaufrufen führen oft zu undurchsichtigen Kostenstrukturen. Ein Vorteil der Orchestrierung liegt in der Sichtbarkeit: Jeder Schritt des Workflows ist in einer zentralen Oberfläche nachvollziehbar – und zeigt auf, wo Token verbraucht werden.

„Plötzlich haben Sie eine einzige Oberfläche, in der Sie den gesamten Ablauf überblicken“, erklärt Somal. „Sie sehen nicht nur, wo Kosten entstehen, sondern auch, warum.“ Diese Transparenz ermöglicht es Teams, ineffiziente Schritte zu identifizieren und die Ausgaben gezielt zu optimieren.

Der Weg in die Zukunft: Zuverlässigkeit als Wettbewerbsfaktor

Die Erfahrungen der letzten Monate zeigen: KI-Agenten sind mehr als nur Sprachmodelle. Sie sind komplexe Systeme, die Zuverlässigkeit, Kostenkontrolle und Skalierbarkeit erfordern. Unternehmen, die jetzt in stabile Architekturen investieren, werden langfristig profitieren – während andere mit nachgebesserten Versionen kämpfen.

Die nächste Generation von Agenten wird nicht nur schneller, sondern vor allem resilienter sein. Mit deterministischen Rückgraten, klarer Zustandsverwaltung und kostentransparenter Orchestrierung können Unternehmen die Vorteile der KI voll ausschöpfen – ohne die Fallstricke der ersten Welle zu wiederholen.

Es geht nicht mehr darum, Agenten zu bauen. Es geht darum, sie dauerhaft zum Laufen zu bringen.

KI-Zusammenfassung

AI ajanlarının üretim ortamındaki güvenilirlik sorunları, şirketleri mimariyi yeniden düşünmeye zorluyor. Uzun süreli iş akışlarının yönetimi ve maliyet şeffaflığı, yeni nesil AI sistemlerinin temelini oluşturuyor.

Unternehmen erkennen: KI-Agenten brauchen eine zuverlässige Infrastruktur

KI-Agenten verschärfen klassische Engineering-Herausforderungen

Warum langlaufende Agenten eine neue Architektur erfordern

Der deterministische Rückgrat: Stabilität trotz KI-Unsicherheit

Kostenkontrolle durch Transparenz: Token-Spendings sichtbar machen

Der Weg in die Zukunft: Zuverlässigkeit als Wettbewerbsfaktor

Kommentare

App-Entwicklung 2026: Trends, KI-Integration und Karrierechancen

Helios zeigt Solarpotenzial für jedes Haus in Großbritannien an

Secluso: Open-Source Sicherheitskamera mit Ende-zu-Ende-Verschlüsselung