iToverDose/Software· 22 MAI 2026 · 04:00

KI-Summaries für YouTube-Videos: So spare ich Zeit ohne Cloud-Kosten

Stundenlange Videos in Minuten lesen – mit einer lokalen KI, die nachts arbeitet. Hier erfahren Sie, wie ein Student mit einem MacBook Air eine Lösung entwickelte, die YouTube-Inhalte automatisch zusammenfasst und als PDF bereithält.

DEV Community4 min0 Kommentare

Es gibt zu viel großartigen Content – und zu wenig Zeit. Während Vorlesungen, beim Lernen oder Schlafen verpassen wir wertvolle Inhalte auf YouTube. Und wenn wir später die Videos anschauen, haben wir oft schon vergessen, warum wir sie eigentlich gespeichert haben. Besonders ärgerlich wird es, wenn wir nur eine bestimmte Aussage oder ein Zitat suchen – doch dann stundenlang suchen müssen.

Genau dieses Problem löste gemma-brief, eine selbst entwickelte KI-Lösung, die lokal auf einem MacBook Air läuft. Statt stundenlang Videos zu schauen, werden neue Uploads automatisch transkribiert, zusammengefasst und morgens als strukturierte PDF in Telegram bereitgestellt. So bleibt Zeit für das Wesentliche – ohne teure Cloud-Dienste oder externe APIs.

Ein System, das nachts arbeitet

Die Idee hinter gemma-brief ist einfach: Automatisierung. Die Anwendung überwacht ausgewählte YouTube-Kanäle, lädt neue Videos über Nacht herunter und verarbeitet sie lokal. Dabei kommt eine Kombination aus bewährten Open-Source-Tools zum Einsatz, die allesamt auf dem eigenen Rechner laufen.

Die Verarbeitung läuft in mehreren Schritten ab:

  • Erkennung neuer Uploads: Ein Scheduler prüft jede Nacht um 2 Uhr, ob neue Videos auf den abonnierten Kanälen erschienen sind.
  • Audio-Download: Mit yt-dlp wird das Audio der Videos lokal gespeichert – ohne Umweg über die Cloud.
  • Transkription: Die lokale KI Whisper wandelt das Audio in Text um, ebenfalls ohne externe Dienste.
  • Zusammenfassung mit Gemma 4: Das Sprachmodell Gemma 4 E4B analysiert den vollständigen Transkript (bis zu 32.000 Tokens) und erstellt eine strukturierte Zusammenfassung.
  • Anreicherung mit Kontext: Wikipedia liefert zusätzliche Informationen zu Personen, Unternehmen und Fachbegriffen.
  • PDF-Erstellung und Versand: Die finale Zusammenfassung wird als PDF formatiert und per Telegram an den Nutzer gesendet.

Das Ergebnis? Jeden Morgen liegen drei bis fünf strukturierte Briefings in Telegram bereit – jeweils angepasst an die abonnierten Kanäle.

Strukturierte Inhalte für schnelle Entscheidungen

Jede Zusammenfassung folgt einem klaren Aufbau, der es ermöglicht, in unter zwei Minuten zu entscheiden, ob sich ein Video lohnt:

  • TL;DR: Eine prägnante Zusammenfassung des gesamten Videos.
  • Die Kernthese: Was ist die zentrale Aussage des Autors?
  • Zitate: Die wichtigsten Aussagen direkt aus dem Video.
  • Hintergrundinformationen: Wikipedia liefert Kontext zu genannten Personen, Unternehmen oder Technologien.

Zusätzlich bietet der Telegram-Bot spezielle Befehle:

  • `/explain [Thema]`: Durchsucht alle verarbeiteten Videos nach dem genannten Thema und liefert den genauen Ausschnitt mit Zeitstempel – nicht als Text, sondern als originalen Audioausschnitt.
  • `/list`: Zeigt alle verfügbaren Briefings an.
  • `/search [Suchbegriff]`: Führt eine Volltextsuche durch das gesamte Archiv durch.

So lässt sich gezielt nach bestimmten Inhalten suchen, ohne stundenlang Videos manuell durchsuchen zu müssen.

Lokale KI statt Cloud-Abos

Der entscheidende Vorteil von gemma-brief liegt in der lokalen Verarbeitung. Alles läuft auf dem eigenen Rechner – ohne Abhängigkeit von externen Diensten oder API-Kosten. Die genutzten Tools sind:

  • `gemma4:e4b` über Ollama (lokale Inferenz)
  • Whisper (lokale Transkription)
  • yt-dlp (Video-Download)
  • Python-Telegram-Bot (Kommunikation)
  • ReportLab (PDF-Generierung)
  • Wikipedia API (Kontextanreicherung)

Besonders die 32.000-Token-Kontextfenster von Gemma 4 E4B ermöglichen eine vollständige Verarbeitung langer Videos in einem einzigen Durchlauf. Ein 45-minütiges Video entspricht etwa 8.000 Wörtern – genug, um die gesamte Transkription auf einmal zu analysieren und eine strukturierte Zusammenfassung zu erstellen. Komplexe Retrieval-Pipelines oder Vektordatenbanken sind nicht nötig.

Der Code für gemma-brief ist open source und kann über GitHub bezogen werden. Nach dem Klonen des Repositories und der Einrichtung der abonnierten Kanäle startet man die Verarbeitung mit einem einfachen Befehl:

gemma-brief run

Warum Gemma 4 die richtige Wahl war

Gemma 4 E4B überzeugte durch drei zentrale Eigenschaften:

  1. Leistungsfähigkeit: Das Modell verarbeitet lange Texte effizient und liefert präzise Zusammenfassungen.
  2. Lokale Laufzeit: Keine API-Kosten, keine Rate-Limits, keine Datenweitergabe an Dritte.
  3. Hardware-Kompatibilität: Selbst auf einem MacBook Air der Basisserie läuft die Inferenz schnell genug, um eine Woche Uploads über Nacht zu verarbeiten.

Die lokale Ausführung bedeutet auch, dass keine sensiblen Daten das Gerät verlassen. Alles bleibt unter Kontrolle des Nutzers – ein wichtiger Aspekt für Datenschutzbewusste.

Die eigentliche Lösung: Zeit zurückgewinnen

Hinter gemma-brief steckt kein Faulenzen, sondern Realismus. Die Informationsflut auf Plattformen wie YouTube ist überwältigend. Wer versucht, alles zu verfolgen, scheitert entweder daran, Inhalte überhaupt zu sehen – oder verliert sich in stundenlangem Anschauen, ohne etwas zu behalten.

Mit diesem System lässt sich der Fokus wieder auf das Wesentliche lenken:

  • Mehr Kanäle verfolgen, ohne den Überblick zu verlieren.
  • Inhalte gezielt nachschlagen, ohne stundenlang suchen zu müssen.
  • Zeit sparen, ohne auf Qualität zu verzichten.

Die Lösung ist nicht perfekt – aber sie funktioniert. Und das ohne teure Abos oder leistungsstarke Hardware. Ein Beweis dafür, dass smarte Automatisierung auch mit begrenzten Mitteln möglich ist.

Der Autor entwickelte gemma-brief im Rahmen der Gemma 4 Challenge auf DEV.to. Der Quellcode steht unter github.com/amadeobonde/gemma-brief zur freien Verfügung – zum Ausprobieren, Anpassen und Weiterentwickeln.

KI-Zusammenfassung

Gemma-brief, YouTube kanallarınızı izler, yeni videoları indirir, yerel olarak transkribe eder ve Telegram'a formattilmiş bir PDF dosyası gönderir. Ücretsiz ve yerel bir çözüm.

Kommentare

00
KOMMENTAR SCHREIBEN
ID #1ALPD2

0 / 1200 ZEICHEN

Menschen-Check

6 + 6 = ?

Erscheint nach redaktioneller Prüfung

Moderation · Spam-Schutz aktiv

Noch keine Kommentare. Sei der erste.