69.000 Claude-Code-Skills indiziert: Wie eine Machine-Readable-Liste entstand

Vor einem Monat startete ein Entwickler ein ehrgeiziges Projekt: einen offenen Katalog aller verfügbaren Claude-Code-Skills. Innerhalb weniger Wochen wuchs die Sammlung auf 69.369 nachweisbare `SKILL.md`-Dateien an. Doch der wahre Erfolg liegt nicht in der schieren Menge, sondern darin, wie die Fähigkeiten erstmals systematisch erfasst und zugänglich gemacht wurden. Hier ist die technische Geschichte dahinter – und warum sie für Entwickler weltweit relevant ist.

Ein Claude-Code-Skill ist im Grunde eine Markdown-Datei mit YAML-Header, die Anthropics KI-Assistenten Claude Code spezialisierte Aktionen ermöglicht. Sobald eine solche Datei im Verzeichnis ~/.claude/skills/ abgelegt wird, kann der Assistent sie über einen Slash-Befehl aufrufen. Ähnlich wie ein Vim-Plugin oder eine VSCode-Erweiterung funktioniert das System – allerdings basiert die Schnittstelle nicht auf Code, sondern auf natürlicher Sprache in Englisch. Doch während Plugins und Erweiterungen längst etablierte Verzeichnisse und Bewertungssysteme haben, fehlte für Claude-Skills lange Zeit eine zentrale Anlaufstelle.

Warum die Suche nach Skills so mühsam war

Die Herausforderung begann mit einem offensichtlichen Problem: Eine Skill-Datei auf GitHub zu veröffentlichen, reichte nicht aus, um sie auffindbar zu machen. Die meisten Entwickler teilten ihre Kreationen in Nischen-Communities wie Twitter oder Discord – doch für Außenstehende blieben sie unsichtbar. Selbst Suchmaschinen konnten die Dateien kaum identifizieren, da sie oft in unstrukturierten Repositories versteckt lagen.

Zudem variierte die Qualität extrem: Einige Skills waren ausgereifte Werkzeuge mit detaillierten Anleitungen, Preisangaben und Anti-Trigger-Hinweisen. Andere bestanden nur aus ein paar Zeilen Platzhaltertext wie „TODO: implement feature X“. Beide Varianten wurden zwar indexiert, doch ohne Kontext war keine Unterscheidung möglich.

Ein weiteres Hindernis war die schnelle Weiterentwicklung des Formats. Monatlich kamen neue Felder im YAML-Header hinzu – etwa allowed-tools, user-invokable oder metadata.api_base. Eine gestern noch gültige Skill-Datei konnte morgen bereits veraltete oder fehlende Felder enthalten. Für Entwickler, die auf diesen Fähigkeiten aufbauen wollten – etwa um Installations-Tools oder Bewertungssysteme zu entwickeln – gab es zudem keine brauchbare API, die strukturierte Daten lieferte. Die einzige Option war das manuelle Scrapen von GitHub, was zeitaufwendig und fehleranfällig war.

Der Crawler: 24 Quellen, eine Nacht – und 69.000 Skills

Die Lösung entstand als Python-Skript, das auf einem Mac mini in einem Home-Office läuft. Jede Nacht um 1:00 Uhr lokal startet der Crawler und durchsucht 24 öffentliche Quellen nach SKILL.md-Dateien. Die Strategie kombiniert klassische Code-Suche mit kreativen Ansätzen, um auch versteckte Fähigkeiten zu finden:

GitHub Code Search: Mit 101 verschiedenen Suchanfragen werden Skills nach Programmiersprachen, YAML-Feldern oder Zeitstempeln gefiltert – eine Maßnahme gegen die 1.000-Ergebnis-Hardcap von GitHub.
GitHub Topics: Über 31 Varianten von topic:claude-code-skills werden genutzt, um thematisch getaggte Repositories zu finden.
GitHub Gists: Einfache Skills, die als Gist veröffentlicht wurden, fehlen in den meisten Katalogen – hier werden sie erfasst.
Awesome-Listen: 32 verschiedene Listen werden durchforstet, um bereits kuratierte Skills zu übernehmen.
GitLab, Codeberg & Co.: Skills, die außerhalb von GitHub gehostet werden, werden über alternative Plattformen identifiziert.
Soziate Medien: Reddit, HackerNews, Mastodon und Dev.to werden nach expliziten Repository-Verweisen durchsucht.
Wayback Machine: Selbst gelöschte oder umbenannte Repositories bleiben über das Internetarchiv auffindbar.
Star-Mining: Wird eine Skill in einem Repository gefunden, werden alle Sterne dieses Repositories analysiert – oft folgen dort weitere Skills desselben Autors.
VSCode & Open VSX: Einige Erweiterungen enthalten begleitende SKILL.md-Dateien.
Brave Search API: Websuchen mit KI-generierten Suchanfragen erweitern die Discoverability.

Jede gefundene URL wird validiert, die YAML-Felder werden überprüft, und die Skills werden nach zehn Kategorien (z. B. Engineering, Security, Growth) sowie rund 100 orthogonalen Tags (Programmiersprache, Framework, KI-Anbieter) klassifiziert. Am Ende steht ein statischer HTML-Katalog unter /skills/<skill-name>, der noch am selben Tag aktualisiert wird.

Das Skript ist robust gebaut: Jede Quelle hat eigene Limits, um die GitHub-API nicht zu überlasten. Zudem sind alle Abschnitte in try-Blöcke eingebettet, sodass ein einzelner Fehler nicht den gesamten Crawl zum Absturz bringt. Eine vollständige Ausführung dauert etwa vier Stunden.

Qualität vor Quantität: Wie die besten Skills gefunden werden

Die größte designphilosophische Entscheidung des Projekts war, Popularität als Bewertungskriterium komplett auszuschließen. Rankings, die auf Sternen, Forks oder Followerzahlen basieren, würden den Katalog schnell korrumpieren – denn sobald Geld oder Sichtbarkeit im Spiel sind, verliert Objektivität ihren Wert.

Stattdessen kommt ein inhaltlicher Scoring-Algorithmus zum Einsatz, der ausschließlich die SKILL.md-Datei selbst analysiert. Die wichtigsten Faktoren:

Anti-Trigger-Disziplin: Enthält die Datei Abschnitte wie „Wann diese Skill NICHT verwenden“ oder „Grenzen des Tools“? Jeder identifizierte Abschnitt gibt bis zu +4 Punkte (maximal +16). Eine klare Kommunikation von Einschränkungen signalisiert, dass der Autor sich Gedanken über die Grenzen seines Tools gemacht hat.

Transparenz bei Kosten und Limits: Dokumentiert die Skill API-Kosten, Rate-Limits oder erwartete Ausgaben? +10 Punkte.

Tiefe des YAML-Headers: Neben den Pflichtfeldern wie name: und description: werden zusätzliche Felder wie model:, tags:, version:, license: oder allowed-tools: belohnt. Die maximale Punktzahl liegt bei 10 verschiedenen Feldern – ein Anreiz für strukturierte und vollständige Angaben.

Struktur und Umfang: Ist der Hauptteil der Datei aussagekräftig (>800 Zeichen description:), enthält er Code-Beispiele oder Unterüberschriften?

Penalty für Fülltexte: Platzhalter wie // TODO, Lorem ipsum oder generische Vorlagen führen zu Punktabzug (–5).

Der Score gewichtet keine externen Metriken wie Sterne oder Installationszahlen. Ein Skill, der von einem unbekannten Entwickler mit 0 Followern stammt, aber eine klare Anti-Trigger-Sektion bietet, rangiert höher als ein oberflächlicher Skill eines Influencers mit 50.000 GitHub-Followern.

Für eine Premium-Bewertung im späteren Desktop-Client des Projekts wird derselbe Algorithmus genutzt – allerdings mit zusätzlichen Faktoren wie Benutzerfeedback oder automatisierten Tests. Dennoch bleibt das Grundprinzip gleich: Qualität wird an der Dokumentation gemessen, nicht an der Reichweite.

Ein Ökosystem für Entwickler – und die nächsten Schritte

Das Projekt zeigt, wie unsichtbare Wissensschätze durch systematische Erschließung nutzbar werden. Für Entwickler bedeutet dies, dass sie nun auf eine maschinenlesbare, täglich aktualisierte Datenbank zugreifen können – ohne manuelle Suche, ohne veraltete Links, ohne versteckte Paywalls.

Langfristig könnte diese Struktur die Grundlage für automatisierte Skill-Empfehlungen, integrierte Installationsassistenten oder sogar KI-basierte Skill-Bewertungen bilden. Doch der wichtigste Effekt ist bereits jetzt sichtbar: Entwickler müssen ihre Skills nicht mehr in obskuren Foren oder auf Twitter bewerben – sie werden Teil eines wachsenden, offenen Ökosystems.

Die nächsten Schritte umfassen die Integration von Community-Features wie Bewertungen oder Kommentaren, um die Qualität weiter zu verfeinern. Gleichzeitig wird der Crawler weiter optimiert, um noch mehr Quellen und Nischen zu erschließen. Eines ist sicher: Die 69.000 Skills sind erst der Anfang.

KI-Zusammenfassung

Claude Code için 69.000’in üzerinde `SKILL.md` dosyasını nasıl toplu olarak indekslediğimizi, kabul kriterlerini ve gelecekteki fırsatları keşfedin. Açık veri ve içerik odaklı puanlama sistemi hakkında tüm detaylar.

69.000 Claude-Code-Skills indiziert: Wie eine Machine-Readable-Liste entstand

Warum die Suche nach Skills so mühsam war

Der Crawler: 24 Quellen, eine Nacht – und 69.000 Skills

Qualität vor Quantität: Wie die besten Skills gefunden werden

Ein Ökosystem für Entwickler – und die nächsten Schritte

Kommentare

Von Prompts zu Spezifikationen: So entwickelt man Software mit KI effizienter

Headless CMS auswählen: Der richtige Weg für Content und Entwicklung

JVM in Kubernetes: Warum Classloading und GC für Microservices entscheidend sind