Garry Tan von Y Combinator veröffentlicht sein eigenes KI-Gedächtnis-System als Open Source

Ein leitender Investor und CEO nutzt seit Jahren ein selbst entwickeltes KI-System für sein Wissensmanagement. Jetzt hat Garry Tan, Präsident von Y Combinator, dieses System unter dem Namen GBrain als Open Source veröffentlicht. Das Besondere: Es handelt sich nicht um ein Experiment, sondern um die produktive Lösung, die Tan täglich für seine Arbeit mit über 17.000 Dokumenten, 4.000 Kontakten und 700 Unternehmen einsetzt.

Ein VC mit technischem Hintergrund hinter GBrain

Garry Tan ist kein klassischer Investor. Nach seinem Studium in Computer Systems Engineering an der Stanford University arbeitete er zunächst bei Microsoft, bevor er als zehntes Teammitglied zu Palantir stieß. Später gründete er das Blogging-Tool Posterous, das 2012 für 20 Millionen Dollar an Twitter verkauft wurde. Als Design Partner bei Y Combinator schrieb er 2012 den ersten Seed-Check für Coinbase und gründete anschließend Initialized Capital, das bis zu 700 Millionen Dollar verwaltete. Seit 2018 zählt ihn das Forbes Midas List zu den Top-Investoren weltweit. Seit Januar 2023 leitet er Y Combinator und initiierte gleichzeitig ein 2-Milliarden-Dollar-Fondsprojekt. Trotz seiner Führungsrolle bleibt Tan aktiv in der Programmierung tätig und betreibt einen eigenen YouTube-Kanal, auf dem er technische Inhalte teilt.

GBrain ist das Ergebnis dieser dualen Rolle als Investor und Entwickler. Das System kombiniert seine Expertise in Datenmanagement mit modernen KI-Technologien und bietet eine effiziente Lösung für die Wissensverarbeitung.

Wie GBrain funktioniert: Das "Brain-First"-Prinzip

Traditionelle KI-Agenten rufen bei jeder Anfrage externe APIs auf, um Daten abzurufen. GBrain verfolgt einen anderen Ansatz: das sogenannte "Brain-First"-Prinzip. Dabei wird zunächst das lokale Gedächtnis (den sogenannten "Brain") durchsucht, bevor externe Quellen konsultiert werden.

Bei einer Anfrage prüft das System zunächst, ob die Antwort im lokalen Gedächtnis gespeichert ist.
Ist die Information vorhanden, wird sie direkt und ohne zusätzliche Kosten genutzt.
Fehlt die Antwort, greift das System auf externe APIs zurück, speichert die neue Information jedoch sofort im lokalen Gedächtnis für zukünftige Anfragen.

Dieser Ansatz führt zu einer kontinuierlichen Verbesserung des Systems, da es mit jeder Nutzung intelligenter und kostengünstiger wird. Die lokale Wissensbasis wächst stetig und reduziert langfristig die Abhängigkeit von teuren API-Aufrufen.

Technische Highlights: Von Hybrid-Suche bis zu automatischen Wissensgraphen

GBrain kombiniert mehrere fortschrittliche Technologien, um eine effiziente und skalierbare Wissensverarbeitung zu ermöglichen:

Hybrid-Suche mit RRF-Fusion für präzisere Ergebnisse

Das System nutzt eine Kombination aus Vektor- und Schlüsselwortsuche, die durch Reciprocal Rank Fusion (RRF) optimiert wird. Dabei werden die Ergebnisse beider Suchmethoden gewichtet und zu einer gemeinsamen Rangliste kombiniert. Dies führt zu einer deutlich höheren Genauigkeit:

Bei einer reinen Vektorsuche liegt die Recall@5-Rate bei 83 %.
Mit der RRF-Fusion erreicht GBrain eine Recall@5-Rate von 95 %.

Ein konkretes Beispiel:

Vektorsuche liefert: [Dokument A #1, Dokument B #2, Dokument C #5]
Schlüsselwortsuche liefert: [Dokument B #1, Dokument D #2, Dokument A #4]

Durch die RRF-Methode wird Dokument B mit der höchsten kombinierten Punktzahl als relevantes Ergebnis priorisiert.

Automatische Wissensgraphen ohne LLM-Aufrufe

Ein weiteres innovatives Feature ist die automatische Extraktion von Beziehungen zwischen Entitäten ohne den Einsatz von großen Sprachmodellen (LLMs). Durch den Einsatz von regulären Ausdrücken werden fünf Beziehungstypen erkannt:

teilgenommen an: Erkennung von Formulierungen wie "hat sich mit X bei... getroffen"
arbeitet bei: Identifikation von Aussagen wie "X ist [Position] bei Y"
investiert in: Extraktion von Angaben wie "hat das Series A von Y geleitet"
gegründet: Erkennung von Formulierungen wie "X hat Y gegründet"
berät: Identifikation von Aussagen wie "X ist Berater von Y"

Ein Beispiel: Wenn Tan in seinen Notizen schreibt: "Morgenanruf mit Brian Armstrong zu Coinbases neuem Produkt", erstellt das System automatisch die Beziehung [Garry Tan] --teilgenommen an--> [Brian Armstrong] im Wissensgraphen – ohne dabei Tokens zu verbrauchen.

Minions: Deterministische Aufgaben bis zu 13-mal schneller

GBrain unterteilt Aufgaben in zwei Kategorien: deterministische und nicht-deterministische Operationen. Während LLM-basierte Agenten für komplexe Abfragen und Zusammenfassungen genutzt werden, übernimmt das System für routinebasierte Aufgaben sogenannte "Minions" – eine Art Task-Queue, die auf Postgres basiert.

Deterministische Aufgaben (Minions): Dazu gehören das Parsen von Markdown, das Erstellen von Links, das Synchronisieren von Dateien oder das Extrahieren von Beziehungen. Die Ausführungszeit liegt bei etwa 753 Millisekunden, und es entstehen keine Token-Kosten.
Nicht-deterministische Aufgaben (LLM-Agenten): Für anspruchsvolle Analysen oder das Generieren von Insights werden LLMs eingesetzt. Hier liegt die Ausführungszeit bei über 10 Sekunden, und es entstehen echte Kosten.

Durch diesen Ansatz werden die Kosten für Routineaufgaben auf null reduziert und die Effizienz deutlich gesteigert.

Praktische Anwendungsfälle und Integration

GBrain bietet über 26 integrierte Funktionen, die verschiedene Aspekte des Wissensmanagements abdecken:

Signalverarbeitung: Automatische Erkennung von Entitäten und Anreicherung des Wissensgraphen.
Datenimport: Verarbeitung von Ideen, Medieninhalten, Meeting-Transkriptionen und strukturierten Daten.
Wissensoperationen: Anreicherung, intelligente Abfragen, Wartung und Reparatur von Zitaten.
Aufgabenmanagement: Planung, Berichterstattung und Webhook-Integration.
Identitätsmanagement: Durchführung von Soul-Audits, Initialisierung, Datenmigration und täglichen Briefings.

Das System ist zudem mit über 30 MCP-Tools kompatibel und kann direkt aus Entwicklungsumgebungen wie Claude Code, Cursor und Windsurf aufgerufen werden. Dies ermöglicht eine nahtlose Integration in bestehende Arbeitsabläufe.

Fazit: Ein Blick in die Zukunft des Wissensmanagements

GBrain zeigt eindrucksvoll, wie technisch versierte Investoren moderne KI-Technologien für ihre tägliche Arbeit nutzen – und diese Lösungen anschließend der Öffentlichkeit zugänglich machen. Mit Funktionen wie der Hybrid-Suche, automatischen Wissensgraphen und einer effizienten Task-Queue setzt das System neue Maßstäbe für das Wissensmanagement mit KI.

Da GBrain bereits produktiv von einem der einflussreichsten Investoren der Welt genutzt wird, könnte es sich als Standard für ähnliche Projekte etablieren. Die Kombination aus Open-Source-Zugang und praktischer Anwendbarkeit macht es zu einer spannenden Option für Entwickler, Forscher und Unternehmen, die ihre Wissensverarbeitung optimieren möchten.

KI-Zusammenfassung

Discover GBrain, YC CEO Garry Tan’s open-source AI memory system used daily. Learn hybrid search, zero-LLM graph automation, and cost-saving Minions for knowledge management.