Lokale KI-Assistenten durch persistente Datenbank-Erinnerungen verbessern

Es ist frustrierend: Man startet eine KI-Sitzung, stellt Fragen zu einer Datenbank und muss immer wieder dieselben Dinge erklären. Warum ist status = 3 gleichbedeutend mit „storniert“? Wie verknüpfen sich die Tabellen orders und users? Solche Grundlagen werden jedes Mal von Neuem gelernt – und das kostet wertvolle Tokens und Zeit.

Doch was, wenn diese Informationen nicht bei jedem Gespräch neu erklärt werden müssten? Genau hier setzt ein neues Open-Source-Projekt an: ein MCP-Server, der KI-Assistenten eine persistente, durchsuchbare Datenbank-Erinnerung bietet. Das Tool namens amnesic (ironisch, denn es speichert Informationen, statt sie zu vergessen) soll den Flaschenhals vermeiden, der entsteht, wenn KI-Modelle täglich dieselben Grundlagen neu erlernen.

Warum die Token-Verwaltung in der KI zu kurz greift

Viele Diskussionen drehen sich um die Optimierung von KI-Antworten – etwa durch kürzere Formulierungen oder vereinfachte Sprache. Doch in der Praxis wird oft übersehen, wie viel Token-Verschwendung bereits im Eingang der Anfragen entsteht. Jede neue Sitzung mit einem KI-Tool führt zu einem erneuten Durchgehen von Tabellenstrukturen, Beziehungen und Bedeutungskonventionen. Das Modell erarbeitet sich die Antwort erneut, statt auf bereits vorhandenes Wissen zurückzugreifen.

Der Ansatz von amnesic ist einfach: Statt die KI jedes Mal von vorne lernen zu lassen, wird das Wissen über die Datenbank einmalig annotiert und dann für alle zukünftigen Anfragen verfügbar gemacht. Das spart nicht nur Tokens, sondern beschleunigt auch die Interaktionen spürbar.

Semantische Erinnerungen statt proprietärer Lösungen

Viele KI-Tools bieten mittlerweile eigene „Gedächtnis“-Funktionen an. Doch diese sind oft proprietär, intransparent und an ein bestimmtes Tool gebunden. Die Erinnerungen von Claude helfen nicht bei Cursor, und die von Cursor nicht bei Copilot. Zudem lassen sich diese Daten meist nicht inspizieren, teilen oder versionieren.

amnesic verfolgt einen anderen Ansatz: Es erstellt eine explizite, durchsuchbare und teilbare Wissensschicht, die von jedem KI-Client gelesen werden kann. Die Annotationen – etwa zu Tabellen, Spalten oder Enumerationen – werden in einer lokalen SQLite-Datei gespeichert. Sobald ein KI-Tool diese Daten abruft, erhält es sofort die korrekten Kontextinformationen, ohne dass die Datenbank erneut abgefragt werden muss.

Ein Beispiel: Ein Entwickler annotiert die Spalte status in der Tabelle orders mit den Bedeutungen der einzelnen Werte. Beim nächsten Gespräch kann die KI direkt die richtige SQL-Anfrage stellen:

db_annotate(
    table="orders",
    column="status",
    column_description="Status des Auftrags im Lebenszyklus",
    enum_values={"1": "offen", "2": "versendet", "3": "storniert", "4": "geliefert"},
)

Die KI erhält dann bei der nächsten Anfrage automatisch die korrekte Bedeutung der Werte – ohne erneutes Nachfragen.

Technische Entscheidungen, die den Unterschied machen

Bei der Entwicklung von amnesic standen mehrere Design-Entscheidungen im Mittelpunkt, die die Effizienz und Sicherheit des Tools gewährleisten sollen:

SQLite FTS5 statt Vektordatenbank

Zunächst wurde mit einer Vektordatenbank wie ChromaDB experimentiert, um Tabellen und Spalten zu finden. Doch der Overhead war enorm: Einbindung externer Modelle, Download großer Abhängigkeiten und die Notwendigkeit eines externen Dienstes. Stattdessen setzt amnesic auf SQLite mit der FTS5-Erweiterung für Volltextsuche. Diese Lösung ist leichtgewichtig, benötigt keine weiteren Abhängigkeiten und funktioniert lokal ohne Netzwerkverbindung.

db_search("Zahlung")
# → Gibt zurück: orders.payment_method, consumerpayments, ...
# Alle Ergebnisse stammen aus einem lokalen FTS5-Index, ohne Embeddings oder externe Dienste.

Zweistufiger Schutz vor schreibenden Zugriffen

Da amnesic direkt auf Produktionsdatenbanken zugreift, ist Sicherheit oberste Priorität. Zwei unabhängige Mechanismen verhindern versehentliche Änderungen:

Statische SQL-Analyse: Alle Abfragen werden auf schreibende Schlüsselwörter wie INSERT, UPDATE oder DELETE überprüft. Selbst versteckte Schreiboperationen in Common Table Expressions (CTEs) werden erkannt und blockiert.
Transaktions-Rollback: Jede Abfrage wird in einer Transaktion ausgeführt, die sofort zurückgerollt wird. Selbst wenn eine schreibende Abfrage die erste Prüfung passiert, wird sie nicht ausgeführt.

Ein SQLite-File pro Verbindung

Alle relevanten Daten – Schema-Cache, Annotationen, Fremdschlüssel-Beziehungen und der FTS5-Index – werden in einer einzigen SQLite-Datei pro Datenbankverbindung gespeichert. Diese Datei ist portabel, kann mit chmod 600 gesichert werden und lässt sich einfach mit Kollegen teilen. Möchte man das gesammelte Wissen weitergeben, reicht ein einfaches Kopieren der Datei.

Minimaler Datentransfer als Nebeneffekt

Ein weiterer Vorteil der Annotationsspeicherung: Viele Fragen lassen sich direkt aus der lokalen Wissensdatei beantworten, ohne dass die eigentliche Datenbank abgefragt werden muss. Ein Beispiel:

„Was bedeutet status = 3?“ → Wird aus der Annotationsdatei beantwortet.
„Wie verknüpfen sich orders und users?“ → Wird aus dem Fremdschlüssel-Graphen abgeleitet.

Das reduziert nicht nur die Token-Nutzung, sondern auch die Menge der Daten, die die Datenbank verlassen.

Was amnesic nicht leistet

Keine intelligentere KI: Das Tool verbessert nicht die Fähigkeiten des KI-Modells selbst.
Keine automatische SQL-Generierung: Es ersetzt keine spezialisierten MCP-Server, die Abfragen ausführen und ausführen.
Keine Ausführung von Abfragen: amnesic stellt lediglich den Kontext für andere Tools bereit. Die eigentliche Abfrageausführung bleibt spezialisierten Servern vorbehalten.

Einfache Einrichtung für den Einstieg

Der Einstieg in amnesic ist unkompliziert. Mit einem einzigen Befehl wird das Tool installiert und ein interaktiver Assistent gestartet:

pip install amnesic
amnesic init

Anschließend wird amnesic in der mcp.json des KI-Tools konfiguriert. Unterstützt werden PostgreSQL, MySQL, MSSQL und SQLite. Das Projekt ist unter der MIT-Lizenz veröffentlicht, wird über PyPI verteilt und ist im offiziellen Linux-Foundation-MCP-Registry registriert.

Fazit: Effizienz durch persistente Kontextspeicherung

Nicht immer führt ein leistungsfähigeres KI-Modell zum Ziel. Oft reicht es aus, die Wiederverwendbarkeit von Kontextwissen zu verbessern. Ein externer, deterministischer und teilbarer Wissensspeicher wie amnesic kann dazu beitragen, dass KI-Assistenten nicht bei jedem Gespräch von vorne beginnen müssen. Das spart Tokens, beschleunigt die Interaktionen und reduziert die Fehleranfälligkeit.

Besonders die robuste read-only-Implementierung ist ein zentraler Baustein – denn hier darf kein Kompromiss bei der Sicherheit eingegangen werden. Feedback zu dieser Lösung, insbesondere zu den Sicherheitsmechanismen, ist ausdrücklich willkommen. Issues und Pull Requests auf GitHub sind jederzeit möglich.

KI-Zusammenfassung

AI yardımcılarına sürekli aynı veritabanı sorgularını açıklamaktan bıktınız mı? Amnesic adlı açık kaynaklı MCP sunucusu, veritabanı şemasını kalıcı belleğe alarak AI’nın yeniden öğrenmesini engelliyor. Kurulumu kolay ve güvenli.