Künstliche Intelligenz verändert die Art und Weise, wie Unternehmen komplexe Aufgaben lösen. Eine besonders vielseitige Technologie sind agentische Workflows – Systeme, die mehrere KI-Modelle und externe Tools wie Datenbanken oder Programmiersprachen kombinieren, um mehrstufige Aufgaben zu bewältigen. Ein Beispiel ist die Analyse eines Videos, gefolgt von der Beantwortung spezifischer Fragen dazu. Doch diese hochgradig fragmentierten Strukturen sind oft ineffizient: Sie verbrauchen unnötig Rechenleistung, Energie und Budgets.
Um diese Probleme zu lösen, haben ein Team von Forscher:innen des MIT und Microsoft ein intelligentes System entwickelt, das die Gestaltung und Optimierung agentischer Workflows automatisiert. Statt jede technische Einzelheit manuell vorgeben zu müssen, beschreibt die Entwicklerin oder der Entwickler einfach das gewünschte Ergebnis in natürlicher Sprache. Das System wählt dann selbstständig die besten KI-Modelle, Tools und Hardware-Konfigurationen aus und passt diese dynamisch an die Prioritäten der Nutzer:innen an – etwa Geschwindigkeit oder Kosteneffizienz.
In Tests mit mehreren agentischen Workloads konnte das System die benötigten Recheneinheiten um bis zu 65 Prozent reduzieren. Gleichzeitig sank der Energieverbrauch um 73 Prozent und die Kosten um 75 Prozent, ohne dass die Leistung darunter litt. „Agentische Workflows werden immer komplexer und bilden zunehmend das Rückgrat moderner Cloud-Dienste“, erklärt Gohar Chaudhry, Doktorand am MIT und Hauptautor der Studie. „Angesichts des hohen Energiebedarfs ist Effizienz entscheidend. Ohne intelligente Optimierung werden Ressourcen leicht verschwendet – ein Problem, das sowohl Anbieter als auch Nutzer:innen betrifft.“
Warum traditionelle Workflows ineffizient sind
Ein agentischer Workflow besteht aus mehreren autonomen KI-Agenten, die gemeinsam Modelle und Tools nutzen, um Aufgaben wie Datenverarbeitung oder Codegenerierung zu lösen. Diese Workflows laufen oft im Hintergrund und unterstützen nutzerorientierte Anwendungen. Bisher müssen Entwickler:innen jedoch alle technischen Entscheidungen von Hand treffen: Welche KI-Modelle und Tools kommen zum Einsatz? In welcher Reihenfolge? Welche Hardware ist nötig? Und wie lassen sich Trade-offs zwischen Geschwindigkeit, Genauigkeit und Kosten ausbalancieren?
Das Problem: Agentische Workflows kombinieren häufig schwarze Kästchenmodelle verschiedener Anbieter, die jeweils eigene Konfigurationsmöglichkeiten bieten. Kommt ein neues, effizienteres Modell auf den Markt, muss der gesamte Workflow neu entworfen werden – ein aufwendiger Prozess. „Selbst mit viel Aufwand ist es fast unmöglich, die optimale Konfiguration zu finden“, sagt Chaudhry. „Die Kombinationsmöglichkeiten sind einfach zu vielfältig.“
Zusätzlich fehlt Cloud-Anbietern oft die Transparenz, um Ressourcen effizient zu verteilen. Sie können nicht erkennen, wie ein Workflow intern strukturiert ist, und müssen daher mit Standard-Konfigurationen arbeiten – was zu Überallokationen führt.
Murakkab: Dynamische Optimierung in Echtzeit
Die Lösung der Forschenden trägt den Namen Murakkab – ein Wort aus dem Urdu, das „Zusammensetzung“ bedeutet. Das System verfolgt einen radikalen Ansatz: Statt detaillierte technische Vorgaben zu verlangen, reicht eine hochgradige Beschreibung der gewünschten Anwendung. Ein Beispiel: Eine Nutzerin möchte eine Anwendung entwickeln, die ein Video in Schlüsselbilder zerlegt, eine Transkription erstellt und anschließend Fragen dazu beantwortet. Murakkab identifiziert automatisch die besten verfügbaren Modelle und Tools, bestimmt, welche Schritte parallel ablaufen können, und optimiert die Hardware-Auslastung.
„Es gibt viele Wege, eine solche Anwendung zu realisieren“, erklärt Chaudhry. „Jedes Modell und jedes Tool hat Auswirkungen auf die Geschwindigkeit und die Effizienz der Gesamtlösung.“ Murakkab passt die Konfigurationen nicht nur einmalig an, sondern dynamisch über die Zeit. Kommt ein neues Modell oder ein schnellerer GPU-Beschleuniger auf den Markt, übernimmt das System die Anpassung – ohne dass Entwickler:innen eingreifen müssen.
Bei der Ausführung durch einen Cloud-Anbieter optimiert Murakkab den Workflow weiter: Es wählt die ideale Hardware, verteilt die Rechenlast und plant die Ausführung so, dass Nutzeranforderungen wie maximale Genauigkeit bei minimaler Latenz erfüllt werden. „Unser System gibt Cloud-Anbietern zudem Einblicke in mehrere Workloads“, so Chaudhry. „So können Ressourcen noch effizienter geteilt werden – zum Nutzen aller Beteiligten.“
Praxistest: Bis zu 75 % weniger Kosten bei gleicher Leistung
In Experimenten mit agentischen Workflows für Videoanalyse und Codegenerierung zeigte Murakkab beeindruckende Ergebnisse: Bei gleicher Leistung benötigte das System nur 35 Prozent der Rechenleistung, verbrauchte 27 Prozent der Energie und verursachte weniger als 25 Prozent der Kosten im Vergleich zu herkömmlichen Methoden. Zudem konnte es Energieverbrauch und Performance je nach Nutzerprioritäten flexibel anpassen – etwa durch die Reduzierung der Rechenleistung in weniger kritischen Phasen.
Die Forschenden sehen in Murakkab einen Meilenstein für die Zukunft agentischer KI-Systeme. „Diese Technologie ermöglicht es Unternehmen, KI-Anwendungen schneller, kostengünstiger und nachhaltiger einzusetzen“, sagt Ricardo Bianchini, technischer Fellow bei Microsoft Azure und Mitautor der Studie. „Sie reduziert nicht nur die Umweltbelastung, sondern macht KI auch für kleinere Teams und Budgets zugänglich.“
Mit der Präsentation auf dem USENIX Symposium on Operating Systems Design and Implementation steht Murakkab kurz vor der Veröffentlichung. Die Forschenden arbeiten bereits an Erweiterungen, um die Technologie noch breiter einsetzbar zu machen – etwa für Echtzeit-Anwendungen oder die Integration weiterer externer Tools.
Für Entwickler:innen und Unternehmen könnte dies der Start einer neuen Ära sein: einer, in der KI-Agenten nicht nur intelligent, sondern auch energiebewusst und kosteneffizient arbeiten.
KI-Zusammenfassung
MIT ve Microsoft araştırmacıları, ajan tabanlı yapay zekâ iş akışlarını otomatik olarak optimize eden Murakkab sistemini tanıttı. Enerji tüketimini yüzde 73 azaltan bu yenilik, bulut bilişimin geleceğini şekillendirecek.