Kunden erwarten von intelligenten Agenten, dass sie sich an frühere Interaktionen erinnern – doch was passiert, wenn ein solcher Agent eine Rechnungskorrektur von vor zwei Tagen nicht mehr kennt? Kein technischer Defekt, sondern fehlendes Gedächtnis. Doch Gedächtnis ist nicht gleichbedeutend mit Persistenz oder idempotenten Workflows. Laut Ed Huang, CEO von PingCAP, handelt es sich um ein fundamentales Missverständnis, das viele KI-Systeme in der Praxis scheitern lässt.
Huang betont in einem aktuellen Beitrag für The New Stack: "Persistenz ohne Auswahl führt zu langsamen Agenten. Ohne Kompression zu teuren. Ohne Verfall zu falschen Antworten. Und ohne Kontaminationsschutz wird der Agent mit der Zeit dümmer."
Was Agenten wirklich brauchen: Fünf Schichten des Gedächtnisses
Viele Entwickler verwechseln drei Konzepte mit echtem Agentengedächtnis – doch diese sind nur Teilaspekte:
- Idempotenz: Verhindert doppelte Aktionen wie wiederholte Bestellungen. Nützlich, aber kein Gedächtnis.
- Workflow-Zustand: Verfolgt den Fortschritt mehrstufiger Prozesse. Wichtig für Automatisierung, aber kein historisches Bewusstsein.
- Transaktionale Konsistenz: Verhindert Race Conditions. Sicherstellt Datenintegrität, aber kein Erinnerungsvermögen.
Echtes Agentengedächtnis besteht Huang zufolge aus fünf Schichten, die weit über einfache Datenspeicherung hinausgehen:
- Persistenz: Daten bleiben nach Neustarts erhalten. Die meisten Systeme bieten das.
- Selektion: Die Fähigkeit, relevante von irrelevanten Informationen zu trennen. Wird oft vernachlässigt.
- Kompression: Rohdaten werden in komprimierte, abfragbare Zusammenfassungen umgewandelt.
- Verfall: Ältere Erinnerungen verlieren mit der Zeit an Gewicht – frische Daten sind relevanter.
- Kontaminationsprävention: Falsche Erinnerungen dürfen nicht einfach gelöscht, sondern müssen markiert und isoliert werden.
Warum spezialisierte Datenbanken an Grenzen stoßen
Einzelne Speicherlösungen wie Redis oder Vektordatenbanken scheitern oft an den komplexen Anforderungen agentenbasierter Erinnerungen:
- Redis bietet zwar blitzschnellen Zugriff, unterstützt aber keine relationalen Abfragen wie: "Zeige alle erfolgreichen Rückerstattungen für Nutzer aus Europa im letzten Monat." Solche Anfragen erfordern strukturierte Suchmuster.
- Vektordatenbanken eignen sich hervorragend für semantische Ähnlichkeiten, versagen aber bei exakten Bedingungen wie bestimmten Nutzer-IDs oder Zeitfenstern. Cosine-Similarity hilft nicht, wenn SQL-ähnliche
WHERE-Klauseln benötigt werden.
Ein Schema, das episodische und semantische Erinnerungen vereint
Huang schlägt ein Datenbankschema vor, das beide Gedächtnisarten in einer einzigen, verteilten SQL-Datenbank mit nativer Vektorfunktionalität vereint. Die Lösung baut auf vier zentralen Prinzipien auf:
1. Episodische Erinnerungen: Strukturierte Ereignisdaten
Episodische Erinnerungen erfassen konkrete Interaktionen mit allen relevanten Details:
CREATE TABLE episodic_memory (
id BIGINT PRIMARY KEY AUTO_INCREMENT,
agent_id VARCHAR(64) NOT NULL,
user_id BIGINT NOT NULL,
summary TEXT, -- Komprimierte Zusammenfassung
raw_payload JSON, -- Vollständige Rohdaten für Audits
outcome ENUM('success','failure','pending'), -- Ergebnis der Interaktion
confidence FLOAT DEFAULT 1.0, -- Vertrauenswert der Erinnerung
superseded_by BIGINT NULL, -- Zeiger auf korrigierte Version bei Kontamination
invalidated ENUM('true','false') DEFAULT 'false',
created_at DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP,
embedding VECTOR(1536), -- Vektordarstellung für semantische Suche
INDEX idx_agent_user_time (agent_id, user_id, created_at),
INDEX idx_embedding USING HNSW (embedding)
);Wichtige Merkmale:
- Der
superseded_by-Pointer markiert veraltete Erinnerungen, ohne sie zu löschen – sie bleiben für Prüfzwecke erhalten. - Die
outcome-Spalte dokumentiert den Erfolg oder Misserfolg einer Aktion, was für zukünftige Entscheidungen entscheidend ist.
2. Semantische Erinnerungen: Abstrahiertes Wissen mit Verfallsmechanismus
Semantische Erinnerungen speichern verallgemeinertes Wissen, das über konkrete Ereignisse hinausgeht:
CREATE TABLE semantic_memory (
id BIGINT PRIMARY KEY AUTO_INCREMENT,
agent_id VARCHAR(64) NOT NULL,
fact TEXT NOT NULL, -- Abstrahierte Aussage
confidence FLOAT DEFAULT 1.0, -- Zuverlässigkeit des Faktums
source_count INT DEFAULT 1, -- Wie oft der Fakt bestätigt wurde
last_confirmed_at DATETIME NOT NULL, -- Letzte Bestätigungszeit
contradicted_at DATETIME NULL, -- Zeitstempel der Widerlegung
embedding VECTOR(1536), -- Vektordarstellung für semantische Suche
INDEX idx_embedding USING HNSW (embedding)
);Der Verfallsmechanismus wird erst bei der Abfrage angewendet:
SELECT fact,
confidence * EXP(-DATEDIFF(NOW(), last_confirmed_at) / 90.0) AS effective_weight,
VEC_COSINE_DISTANCE(embedding, @task_vec) AS distance
FROM semantic_memory
WHERE (user_id = @user_id OR user_id IS NULL)
AND contradicted_at IS NULL
AND VEC_COSINE_DISTANCE(embedding, @task_vec) < 0.30
ORDER BY distance, effective_weight DESC
LIMIT 10;Der Term EXP(-days/90) sorgt für einen natürlichen Verfall: Nach etwa 60 Tagen halbiert sich das Gewicht einer Erinnerung. Je nach Kontext (z. B. Kundenpräferenzen vs. Lagerbestände) können unterschiedliche Halbwertszeiten konfiguriert werden.
Warum dieses Schema Agenten intelligenter macht
Huang argumentiert, dass die Datenbankinfrastruktur nicht die Intelligenz des Agenten ausmacht – aber ohne ein System, das strukturierte episodische Abfragen, Vektorsuche, dynamischen Verfall und Kontaminationsbehandlung nativ unterstützt, kann kein Agent echtes Gedächtnis entwickeln.
Sein Fazit: "Die Infrastruktur bietet diese Funktionen nicht von selbst. Der Agent muss sie implementieren. Aber ohne eine Infrastruktur, die sie grundlegend unterstützt, scheitert das Vorhaben."
TiDB, die verteilte SQL-Datenbank von PingCAP, positioniert sich als eine solche Infrastruktur mit nativer Vektorfunktionalität. Ob man diese Lösung nutzt oder nicht – Huangs Analyse, warum Agentengedächtnis in der Praxis so oft versagt, ist ein wertvoller Denkanstoß für alle, die an langlebigen KI-Systemen arbeiten.
Ausblick: Gedächtnis als Wettbewerbsvorteil
Die Fähigkeit, Erinnerungen nicht nur zu speichern, sondern intelligent zu verwalten, wird zum entscheidenden Faktor für KI-Agenten. Während einfache Chatbots mit statischen Antworten arbeiten, ermöglichen Systeme wie das von Huang vorgeschlagene Agenten, die sich kontinuierlich verbessern – nicht durch mehr Daten, sondern durch bessere Erinnerungsmechanismen. Die nächste Generation intelligenter Assistenten wird nicht nur Fragen beantworten, sondern Kontexte verstehen und Lernprozesse nachvollziehen können.
KI-Zusammenfassung
Learn why AI agents need more than storage—they need structured memory with decay, selection, and contamination control to avoid becoming unreliable over time.