iToverDose/Software· 29 APRIL 2026 · 00:08

Netflix-Inhaltsstrategie: Wie sich Filme und Serien über Jahre entwickelten

Eine Datenanalyse des Netflix-Katalogs zeigt, wie sich die Inhaltsstrategie des Streamingdienstes seit 2010 verändert hat – mit überraschenden Trends bei Genres und Herkunftsländern.

DEV Community5 min0 Kommentare

Netflix ist heute mehr als nur ein Streamingdienst – es ist ein globaler Mediengigant, dessen Inhalte über Jahre hinweg strategisch geplant und erweitert wurden. Doch wie hat sich das Angebot tatsächlich entwickelt? Um diese Frage zu beantworten, analysieren wir den Netflix-Katalog mithilfe von Datenwissenschaft und visualisieren, wie sich die Strategie des Unternehmens über die Zeit gewandelt hat.

Ein realistischer Datenanalyse-Prozess

Viele Tutorials und Online-Kurse vermitteln isolierte Fähigkeiten wie Datenbereinigung, Visualisierung oder statistische Auswertung – oft in getrennten Übungen. Doch im echten Arbeitsalltag laufen diese Schritte selten nacheinander ab. Stattdessen müssen Datenwissenschaftler*innen häufig mehrere Techniken kombinieren, um komplexe Fragen zu beantworten. Dieser Artikel zeigt, wie ein solcher Prozess in der Praxis aussieht: von der Rohdatenaufbereitung bis zur aussagekräftigen Visualisierung.

Der Fokus liegt auf einem konkreten Datensatz: dem offiziellen Netflix-Katalog mit über 8.800 Titeln. Die Analyse beginnt mit einer einfachen, aber zentralen Frage: Wie hat sich die Inhaltsstrategie von Netflix über die Jahre verändert? Um diese zu beantworten, durchlaufen wir alle Schritte einer explorativen Datenanalyse (EDA) – von der Bereinigung über die Strukturierung bis hin zur Interpretation.

Schritt 1: Daten laden und erste Erkenntnisse gewinnen

Der Datensatz stammt von Kaggle und enthält Informationen zu Filmen und TV-Serien auf Netflix. Die wichtigsten Spalten umfassen:

  • type: Gibt an, ob es sich um einen Film oder eine Serie handelt
  • country: Produktionsland (kann mehrere Länder enthalten)
  • release_year: Erscheinungsjahr des Titels
  • listed_in: Liste der Genres (als kommagetrennte Zeichenfolge)
  • date_added: Datum, an dem der Titel zur Plattform hinzugefügt wurde

Ein erster Blick auf die Daten zeigt einige Herausforderungen:

  • Fehlende Werte in Spalten wie director (über 2.600 Einträge) oder country (831 Einträge)
  • Gemischte Datenformate, etwa bei der duration (z. B. "90 min" für Filme oder "2 Seasons" für Serien)
  • Unklare Struktur bei den Genres, die in einer einzigen Spalte als kommagetrennte Liste gespeichert sind

Die Datenmenge umfasst 8.807 Einträge mit 12 Spalten, wobei einige Spalten wie director oder cast für die geplante Analyse weniger relevant sind. Dennoch müssen sie bereinigt werden, um verlässliche Ergebnisse zu erhalten.

Schritt 2: Daten bereinigen und strukturieren

Bevor wir mit der Analyse beginnen, müssen wir die Daten in eine analysierbare Form bringen. Hier sind die wichtigsten Schritte:

Datumsformate korrigieren

Die Spalte date_added enthält nicht nur das Datum, sondern oft auch Leerzeichen am Ende der Zeichenfolge. Diese müssen vor der Umwandlung in ein Datumsformat entfernt werden:

df["date_added"] = pd.to_datetime(df["date_added"].str.strip(), errors="coerce")

Fehlende Werte behandeln

Fehlende Werte in den Spalten director, cast und country werden mit "Unknown" gefüllt, da diese Informationen für die geplante Analyse nicht essenziell sind. Bei der country-Spalte wird zusätzlich nur das erste Land extrahiert, um Mehrfachnennungen (z. B. "United States, India") zu vereinfachen:

df["country_primary"] = df["country"].apply(
    lambda x: x.split(",")[0].strip() if x != "Unknown" else "Unknown"
)

Dauerangaben aufteilen

Die duration-Spalte enthält sowohl Filmlängen (z. B. "90 min") als auch Serienangaben (z. B. "2 Seasons"). Um diese zu analysieren, teilen wir sie in zwei separate Spalten auf:

df["duration_value"] = df["duration"].str.extract(r"(\d+)").astype(float)
df["duration_type"] = df["duration"].str.extract(r"([a-zA-Z]+)")

Nach der Bereinigung reduziert sich die Datenmenge leicht, da einige Einträge aufgrund von Fehlern oder ungültigen Jahren entfernt werden. Die finale Datenmenge umfasst etwa 8.000 Einträge.

Schritt 3: Entwicklung von Filmen und Serien über die Zeit

Eine zentrale Frage der Analyse zielt auf die strategische Ausrichtung von Netflix ab: Konzentriert sich das Unternehmen zunehmend auf Serien statt auf Filme? Um das zu überprüfen, betrachten wir die Anzahl der hinzugefügten Titel pro Jahr und deren Verteilung zwischen Filmen und Serien.

Visualisierung der Entwicklung

Die Daten werden nach Jahr und Inhaltstyp gruppiert und in zwei Diagrammen dargestellt:

  1. Anzahl der hinzugefügten Titel pro Jahr (Filme vs. Serien)
  2. Anteil der Serien am Gesamtinhalt (pro Jahr)

Die Diagramme zeigen zwei klare Trends:

  • Zwischen 2015 und 2019 stieg die Anzahl der hinzugefügten Titel stark an – ein Zeichen für aggressives Wachstum.
  • Im Jahr 2020 gab es einen deutlichen Rückgang, vermutlich aufgrund der COVID-19-Pandemie und damit verbundener Produktionsstillstände.
  • Der Anteil der Serien am Gesamtinhalt hat sich seit 2010 kontinuierlich erhöht. Während der Anteil 2010 noch bei etwa 20 % lag, stieg er bis 2021 auf über 50 % an.

Diese Entwicklung deutet darauf hin, dass Netflix seine Strategie von einem filmbasierten Angebot hin zu einer stärkeren Fokussierung auf Serien verschoben hat.

Schritt 4: Geografische Verteilung der Inhalte

Ein weiterer interessanter Aspekt ist die Herkunft der Inhalte. Welche Länder produzieren die meisten Titel für Netflix? Um das zu analysieren, extrahieren wir das primäre Produktionsland und zählen die Titel nach Ländern:

country_counts = df[df["country_primary"] != "Unknown"]["country_primary"].value_counts().head(15)

Die Top 5 Produktionsländer sind:

  • Vereinigte Staaten: Über 2.000 Titel
  • Indien: Rund 1.000 Titel
  • Südkorea: Etwa 300 Titel
  • Japan: Rund 250 Titel
  • Großbritannien: Etwa 200 Titel

Die Daten zeigen, dass die meisten Inhalte aus den USA stammen, gefolgt von Indien – ein Zeichen für die globale Ausrichtung von Netflix. Allerdings gibt es auch eine wachsende Anzahl an Produktionen aus Ländern wie Südkorea oder Japan, die zunehmend an Bedeutung gewinnen.

Schritt 5: Genres im Wandel der Zeit

Ein weiterer spannender Aspekt ist die Entwicklung der Genres. Welche Genres dominieren den Netflix-Katalog, und haben sie sich über die Jahre verändert? Die listed_in-Spalte enthält eine kommagetrennte Liste von Genres. Um diese zu analysieren, teilen wir sie in einzelne Genres auf:

df["genres"] = df["listed_in"].str.split(",")
all_genres = [genre.strip() for sublist in df["genres"] for genre in sublist]
genre_counts = Counter(all_genres)

Die häufigsten Genres sind:

  • Internationale Filme
  • Dramen
  • Komödien
  • Kinder- und Familienfilme
  • Action- und Abenteuerfilme

Interessanterweise gibt es eine klare Verschiebung hin zu internationaleren Inhalten. Während früher vor allem US-Produktionen dominierten, gewinnt der Anteil an nicht-amerikanischen Produktionen (z. B. aus Indien, Südkorea oder Europa) zunehmend an Bedeutung.

Fazit: Netflix‘ strategische Neuausrichtung

Die Analyse des Netflix-Katalogs zeigt, dass das Unternehmen seine Inhaltsstrategie in den letzten Jahren grundlegend verändert hat. Drei zentrale Erkenntnisse stechen hervor:

  1. Shift von Filmen zu Serien: Der Anteil an Serien am Gesamtinhalt hat sich seit 2010 mehr als verdoppelt, was auf eine strategische Neuausrichtung hindeutet.
  2. Globale Ausrichtung: Die meisten Inhalte stammen zwar weiterhin aus den USA, doch der Anteil an Produktionen aus anderen Ländern – insbesondere Indien und Südkorea – steigt kontinuierlich.
  3. Genre-Diversifizierung: Neben klassischen Hollywood-Genres gewinnen internationale und genreübergreifende Inhalte an Bedeutung.

Diese Entwicklung spiegelt die globale Expansion von Netflix wider und zeigt, wie das Unternehmen versucht, sich an die unterschiedlichen Geschmäcker und Märkte anzupassen. Für Nutzer*innen bedeutet dies eine immer vielfältigere Auswahl – von koreanischen Dramen bis hin zu indischen Blockbustern. Für die Konkurrenz bleibt die Frage: Wie wird Netflix diese Strategie in den kommenden Jahren weiterentwickeln?

KI-Zusammenfassung

Explore how Netflix’s content strategy evolved from 2010 to 2021 using real data. Learn end-to-end analysis techniques and uncover key trends in movies vs TV shows, top countries, and genre dominance.

Kommentare

00
KOMMENTAR SCHREIBEN
ID #SJNND3

0 / 1200 ZEICHEN

Menschen-Check

3 + 9 = ?

Erscheint nach redaktioneller Prüfung

Moderation · Spam-Schutz aktiv

Noch keine Kommentare. Sei der erste.