Stanfords DeLM spart 50% bei KI-Agenten-Aufgaben ohne zentrale Steuerung

Forscher der Stanford University revolutionieren die Zusammenarbeit von KI-Agenten mit einem neuen Framework namens Dezentralisiertes Sprachmodell (DeLM). Statt auf eine zentrale Steuerung angewiesen zu sein, ermöglichen die Wissenschaftler eine direkte Koordination zwischen den Agenten – und sparen dabei bis zu 50% der Kosten ein.

Die Innovation von DeLM liegt in der dezentralen Wissensbasis, die als gemeinsame Kommunikationsplattform dient. Agenten können hier auf verifizierte Fortschritte anderer zugreifen, Fehler vermeiden und ihre Arbeit ohne Umweg über einen „Boss-Agenten“ abstimmen. Yuzhen Mao und Azalia Mirhoseini, die Entwickler des Frameworks, beschreiben dies als „gemeinsamen Kommunikationsuntergrund“, der die Effizienz steigert.

Warum klassische Multi-Agenten-Systeme an Grenzen stoßen

In herkömmlichen zentralisierten Multi-Agenten-Systemen übernimmt ein Hauptagent die Rolle des Orchestrators. Er zerlegt Aufgaben in Teilaufgaben, verteilt sie an Unteragenten und sammelt deren Ergebnisse ein. Anschließend fasst er die Informationen zusammen, filtert sie und gibt neue Anweisungen aus.

Doch dieser Ansatz hat entscheidende Nachteile:

Kommunikationsengpässe: Jede Information – egal ob Teilergebnis oder Fehlschlag – muss an den Hauptagenten zurückgespielt werden. Bei vielen Agenten führt dies zu Verzögerungen.
Informationsverlust: Der Hauptagent entscheidet, welche Daten weitergegeben werden. Dabei können wichtige Erkenntnisse verloren gehen oder verfälscht werden.
Ineffiziente Iterationen: Bei unzureichendem Kontext starten Agenten häufig neue Abfragen oder Delegationen, was den Prozess verlangsamt.

Besonders problematisch wird dies bei langfristigen Kontextanalysen. Der Hauptagent gruppiert Daten oft unüberwacht und verteilt diese an die Unteragenten – ohne zu wissen, ob die Informationen relevant oder korrekt sind. Dies führt zu wiederholten Rückfragen und ineffizienten Arbeitsabläufen.

Wie DeLM die Koordination revolutioniert

DeLM setzt stattdessen auf parallele Agenten, einen geteilten Kontext und eine Aufgabenwarteschlange. Die Architektur ermöglicht eine direkte Zusammenarbeit ohne zentrale Steuerung.

Kernkomponenten von DeLM:

Geteilter Kontext: Eine zentrale Wissensdatenbank speichert „Gists“ – komprimierte Zusammenfassungen von Erkenntnissen, Fehlern und Constraints. Agenten können diese Informationen direkt abrufen und darauf aufbauen.
Aufgabenwarteschlange: Eine dynamische Liste von ungelösten Teilaufgaben, die Agenten eigenständig übernehmen können.

Der Arbeitsablauf gestaltet sich wie folgt:

Initialisierung: Die Eingabe wird in Teilaufgaben zerlegt und in die Warteschlange gestellt.
Parallele Ausführung: Agenten arbeiten unabhängig voneinander und nutzen den geteilten Kontext, um auf bereits geleistete Arbeit zurückzugreifen.
Kompression und Verifizierung: Ergebnisse werden zu wiederverwendbaren „Gists“ verdichtet. Nur verifizierte Informationen werden in den gemeinsamen Speicher übertragen.
Nachbearbeitung: Falls nötig, überprüft der letzte Agent die gesammelten Daten und entscheidet, ob weitere Arbeit erforderlich ist.
Abschluss: Der finale Agent liefert das Ergebnis zurück.

„Agenten tauschen Fortschritte über den geteilten Zustand aus, übernehmen Aufgaben asynchron und skalieren effizienter mit zunehmender Anzahl von Teilaufgaben“, erklären Mao und Mirhoseini.

Praxistests: Wo DeLM glänzt

DeLM eignet sich besonders für Szenarien, in denen Agenten parallel Hypothesen testen und voneinander lernen müssen. Drei Anwendungsbereiche stechen hervor:

Softwareentwicklung: Agenten können gleichzeitig Fehler in Code suchen und voneinander lernen. Ein Beispiel ist das parallele Debugging, bei dem verschiedene Agenten unterschiedliche Problemstellungen gleichzeitig analysieren.
Langzeit-Kontextanalyse: Bei Aufgaben, die eine umfangreiche Dokumentenprüfung erfordern, können Agenten gleichzeitig verschiedene Quellen durchsuchen, während sie einen globalen Überblick über die gesammelten Informationen behalten.
Mehrdokument-Fragenbeantwortung: Agenten untersuchen gleichzeitig unterschiedliche Beweiscluster (z. B. Papers, Code-Snippets) und nutzen nur die relevanten Informationen für die finale Antwort.

Die Effizienzgewinne sind messbar. Auf dem Benchmark SWE-bench Verified – der die Fähigkeit von KI-Agenten testet, reale Softwareprobleme zu lösen – erzielte DeLM eine um 10,5% bessere Performance als der beste Vergleichswert. Gleichzeitig wurden die Kosten pro Aufgabe um rund 50% reduziert.

Auch bei LongBench-v2 Multi-Doc QA, einem Test für langfristige Kontextverständnisse, schnitt DeLM mit der höchsten Genauigkeit unter vier führenden Modellfamilien ab – darunter GPT-5.4, Claude Sonnet, Gemini Flash und DeepSeek-V4-Pro.

Fazit: Dezentrale KI-Agenten als Zukunftsmodell?

DeLM zeigt, dass zentrale Steuerungssysteme nicht zwingend notwendig sind, um koordinierte KI-Agenten zu betreiben. Durch die direkte Zusammenarbeit über einen gemeinsamen Kontext spart das Framework nicht nur Kosten, sondern steigert auch die Genauigkeit und Skalierbarkeit.

Die Forscher betonen, dass dieser Ansatz besonders in dynamischen Umgebungen Vorteile bietet, in denen Agenten schnell auf neue Informationen reagieren müssen. Ob in der Softwareentwicklung, im Wissensmanagement oder bei komplexen Entscheidungsprozessen – DeLM könnte den Weg für effizientere und kostengünstigere Multi-Agenten-Systeme ebnen. Die nächsten Schritte werden zeigen, ob sich die Technologie in der Praxis weiter durchsetzt.

KI-Zusammenfassung

Stanford'un geliştirdiği DeLM, çoklu AI ajan sistemlerinde merkezi bir orkestra gereksinimini ortadan kaldırarak hem maliyetleri yarıya indiriyor hem de koordinasyon gecikmelerini azaltıyor. Nasıl çalıştığını ve performansını keşfedin.

Stanfords DeLM spart 50% bei KI-Agenten-Aufgaben ohne zentrale Steuerung

Warum klassische Multi-Agenten-Systeme an Grenzen stoßen

Wie DeLM die Koordination revolutioniert

Kernkomponenten von DeLM:

Praxistests: Wo DeLM glänzt

Fazit: Dezentrale KI-Agenten als Zukunftsmodell?

Kommentare

Krea 2 Turbo und Raw: KI-Bildgenerierung für Unternehmen in 2 Sekunden

Claude Tag von Anthropic: KI-Assistent für Slack als permanenter Teamkollege

Warum stabile Datenpfade entscheidend für KI im Produktivbetrieb sind