iToverDose/Software· 3 JUNI 2026 · 00:02

Mit pluckmd Blogs per KI-Agent in ein persönliches Wiki verwandeln

Wie ein Entwickler mit pluckmd Artikel aus dem Web extrahiert und sie automatisch in ein interaktives Lernsystem überführt – ohne manuelle Konfiguration oder Browser-Arbeit.

DEV Community3 min0 Kommentare

Ein neuer Workflow kombiniert Web-Scraping mit KI-gesteuerter Wissensaufbereitung: Mit dem Tool pluckmd lassen sich Blogbeiträge automatisch in strukturierte Markdown-Dateien umwandeln und anschließend von einem KI-Agenten zu einem persönlichen Wiki verarbeiten. Das spart Zeit bei der Recherche und schafft eine interaktive Lernumgebung – ganz ohne manuelle Nachbearbeitung.

Warum pluckmd entstanden ist: Inspiration aus zwei KI-Konzepten

Die Idee zu pluckmd entstand aus zwei unabhängigen Inspirationsquellen. Zum einen das Konzept des LLM Wiki von Andrej Karpathy, der vorschlägt, ein KI-Modell während des Lernens eine Sammlung von Markdown-Notizen über ein Thema führen zu lassen. Zum anderen der Beitrag von Thariq Shabbir, der zeigt, wie gut ein Modell wie Claude interaktive HTML-Seiten generieren kann – eine Technik, die mittlerweile auf dem offiziellen Anthropic-Blog vorgestellt wurde.

Der Autor suchte nach einer Möglichkeit, diese beiden Ansätze zu verbinden: Blogartikel sollten automatisch in saubere Markdown-Dateien extrahiert, von einem KI-Agenten in ein Wiki-Format überführt und schließlich als interaktive Lernseiten aufbereitet werden. Der erste Schritt – das zuverlässige Extrahieren von Artikeln aus Webseiten – erwies sich jedoch als technisches Hindernis. Viele bestehende Tools erforderten aufwändige Konfigurationen für jede einzelne Website. Also entwickelte er pluckmd als spezialisierte Lösung für genau diesen Schritt.

Einfache Nutzung: Artikel downloaden in wenigen Sekunden

Die Grundfunktionalität von pluckmd ist denkbar einfach. Ein einziger Befehl reicht aus, um alle Artikel einer Website in lokale Markdown-Dateien zu speichern:

npx pluckmd download  -o ./articles

Das Tool durchsucht zunächst die Startseite, folgt allen Verlinkungen und extrahiert die Artikeltexte inklusive Metadaten wie Titel, Veröffentlichungsdatum und Autor. Bei kleinen Blogs mit etwa fünf Artikeln ist dieser Vorgang in Sekundenschnelle abgeschlossen. Eine manuelle Konfiguration ist nicht nötig – die Software entscheidet selbstständig, ob sie statische HTML-Seiten oder JavaScript-gerenderte Inhalte verarbeiten muss. Falls JavaScript erforderlich ist, wechselt pluckmd automatisch zu einem vollwertigen Browser, ohne dass der Nutzer eingreifen muss.

Geschützte Inhalte und Login-Authentifizierung

Viele hochwertige Blogartikel sind hinter Paywalls oder Login-Schranken versteckt. pluckmd bietet zwei Methoden, um auch diese Inhalte zu erfassen:

Die erste Methode nutzt eine interaktive Anmeldung:

pluckmd login 

Hier öffnet sich ein Browserfenster, in dem der Nutzer sich einmalig manuell anmeldet. Die Session bleibt anschließend bestehen, sodass nachfolgende Downloads ohne weitere Authentifizierung möglich sind.

Wer keine Anmeldedaten an das Tool weitergeben möchte, kann stattdessen eine bestehende Browser-Session nutzen:

pluckmd download --active-tab -o ./articles

Dabei liest pluckmd die Inhalte direkt aus dem aktuellen Tab, ohne auf Cookies oder Session-Daten zuzugreifen. Die Sicherheit der Anmeldedaten bleibt damit vollständig in der Hand des Nutzers.

Vollautomatisierung: KI-Agenten steuern den Prozess

Der eigentliche Mehrwert von pluckmd entsteht durch seine Integration mit KI-Agenten wie Claude Code oder Codex. Anstatt Befehle manuell einzugeben, übernimmt ein Agent die Steuerung des gesamten Workflows:

  1. Der Nutzer fordert den Agenten auf: „Lade alle Beiträge von herunter.“
  2. Der Agent führt den pluckmd-Befehl aus und speichert die Artikel als Markdown-Dateien im Ordner raw/.
  3. Anschließend wird der Nutzer aufgefordert: „Erstelle ein Wiki aus den heruntergeladenen Artikeln.“ Der Agent analysiert die Texte, extrahiert Schlüsselkonzepte und verknüpft sie zu einem durchsuchbaren Wissensnetz, ähnlich einem Obsidian-Vault.
  4. Schließlich generiert der Agent interaktive HTML-Seiten für einzelne Themen, die direkt als Lernmaterial genutzt werden können – basierend auf dem Ansatz von Thariq Shabbir.

Der Vorteil: Der Nutzer muss sich nicht mit Pfaden, Flags oder technischen Details beschäftigen. Die KI fungiert als Schnittstelle zwischen Wunsch und Ausführung. Selbst wenn kein eigenes KI-Modell für die Extraktion verfügbar ist, kann der Agent aus den Markdown-Dateien Regeln ableiten und die Strukturierung übernehmen.

Grenzen und Herausforderungen

Nicht jede Website lässt sich problemlos verarbeiten. Besonders Layouts mit unkonventionellen Strukturen oder Seiten mit unendlichem Scrollen können den Automatismus erschweren. In solchen Fällen greift pluckmd auf einen Fallback-Mechanismus zurück, bei dem der KI-Agent die fehlenden Informationen ergänzt. Dennoch bleibt die Zuverlässigkeit abhängig von der Qualität der Website-Struktur. Bei exotischen oder stark individualisierten Designs kann es zu Einschränkungen kommen – ein Umstand, den der Entwickler als wertvolles Feedback für zukünftige Verbesserungen sieht.

Installation und Ausblick

pluckmd lässt sich einfach installieren und steht unter MIT-Lizenz auf GitHub zur Verfügung:

npm install -g pluckmd

Der Entwickler zeigt sich gespannt auf die Anwendungsfälle, die Nutzer mit dem Tool erschließen. Welche Blogs oder Wissensquellen würden Sie als Erstes in ein persönliches Wiki überführen? Die flexible Architektur von pluckmd lässt Raum für vielfältige Erweiterungen – von der Integration weiterer KI-Modelle bis hin zu automatisierten Wissensdatenbanken.

KI-Zusammenfassung

PluckMD kullanarak blog yazılarını otomatik olarak indirin, Markdown’a dönüştürün ve yapay zeka ajanlarıyla etkileşimli öğrenme materyallerine çevirin. Kullanımı basit ve esnek bir araç.

Kommentare

00
KOMMENTAR SCHREIBEN
ID #XNFC3T

0 / 1200 ZEICHEN

Menschen-Check

7 + 6 = ?

Erscheint nach redaktioneller Prüfung

Moderation · Spam-Schutz aktiv

Noch keine Kommentare. Sei der erste.