Daten sind nur so wertvoll wie ihre Qualität. Bevor Power BI aussagekräftige Dashboards erstellt, müssen Rohdaten zuerst bereinigt, strukturiert und vertrauenswürdig gemacht werden. Dieser Prozess beginnt im Power Query Editor – dem Herzstück der Datenaufbereitung in Power BI.
Viele Einsteiger unterschätzen die Bedeutung dieses Schrittes, doch ohne saubere Daten bleiben selbst die beeindruckendsten Visualisierungen wertlos. Power Query bietet alle Werkzeuge, um Inkonsistenzen zu korrigieren, fehlende Werte zu behandeln und Tabellen für die Analyse vorzubereiten. In diesem Leitfaden lernen Sie, wie Sie diese Transformationen Schritt für Schritt umsetzen – mit einem praxisnahen Datensatz.
Warum Datenaufbereitung in Power BI unverzichtbar ist
Ungefilterte oder fehlerhafte Daten führen zu verzerrten Analysen und falschen Entscheidungen. Power Query ermöglicht es Ihnen, Daten bereits vor dem Laden in das Datenmodell zu bereinigen. Zu den wichtigsten Aufgaben gehören:
- Beseitigung von Fehlern und Ungereimtheiten
- Behandlung fehlender oder leerer Werte
- Entfernung doppelter Einträge
- Anpassung von Tabellenstrukturen
- Zusammenführung oder Ergänzung von Datensätzen
- Vereinheitlichung von Bezeichnungen
- Aufbau eines zuverlässigen Datenmodells für Berichte
Diese Schritte bilden das Fundament für aussagekräftige Auswertungen. Ohne sie riskieren Sie, dass selbst die beste Visualisierung auf wackeligen Daten basiert.
Erste Schritte: Power Query Editor öffnen und Daten laden
Um mit der Datenaufbereitung zu beginnen, öffnen Sie zunächst den Power Query Editor in Power BI Desktop:
1. Wechseln Sie zur Registerkarte "Startseite"
2. Klicken Sie auf "Daten transformieren"Hier stehen Ihnen alle Tools zur Verfügung, um Daten zu bereinigen und umzustrukturieren. Der Editor zeigt die Originaldaten in Tabellenform an, während alle Änderungen in Echtzeit sichtbar werden. Sobald die Transformationen abgeschlossen sind, laden Sie die bereinigte Datenbasis in Ihr Power BI-Modell.
Spaltenüberschriften korrigieren: So ordnen Sie Daten richtig ein
Ein häufiger Fehler in Rohdaten sind falsch platzierte Spaltenüberschriften. Betrachten wir ein Beispiel aus einer CSV-Datei mit Verkaufsdaten. Hier sind die eigentlichen Daten in den ersten Zeilen versteckt, während die Überschriften erst in einer späteren Zeile beginnen.
Um dies zu korrigieren:
- Entfernen Sie überflüssige Zeilen am Tabellenanfang
- Heben Sie die erste Datensatzzeile als neue Überschrift hervor
Sie können dies auf zwei Wegen erreichen:
Option 1: Registerkarte "Startseite" → "Erste Zeile als Überschriften verwenden"
Option 2: Rechtsklick auf die Spalte → "Erste Zeile als Überschriften verwenden"Diese einfache Anpassung stellt sicher, dass alle Spalten korrekt benannt und die Daten für die weitere Verarbeitung strukturiert sind.
Spaltennamen anpassen: Konsistenz und Klarheit schaffen
Oft enthalten Datensätze Spalten mit unklaren oder fehlerhaften Bezeichnungen. Um diese zu verbessern:
- Rechtsklick auf die Spaltenüberschrift → "Umbenennen"
- Alternativ: Doppelklick auf die Überschrift und neuen Namen eingeben
Achten Sie darauf, dass die neuen Namen:
- Eindeutig und verständlich sind
- Einheitliche Schreibweise und Formatierung verwenden
- Keine Sonderzeichen oder Leerzeichen enthalten
Klar benannte Spalten erleichtern nicht nur die Arbeit im Editor, sondern auch die spätere Nutzung in Dashboards und Berichten.
Doppelte Einträge entfernen: Datenqualität steigern
Doppelte Datensätze verfälschen Analysen und führen zu unnötigem Speicherverbrauch. Um Duplikate zu entfernen:
1. Markieren Sie die Spalte(n), die eindeutige Werte enthalten sollten
2. Rechtsklick → "Doppelte entfernen"Power Query behält die erste Instanz jedes Datensatzes bei und löscht alle folgenden Duplikate. Diese Funktion ist besonders nützlich bei großen Datensätzen, in denen manuelle Überprüfung kaum möglich wäre.
Fehlende Werte behandeln: Nullen ersetzen oder bereinigen
Fehlende Daten können Analyseergebnisse stark beeinflussen. Power Query bietet zwei Hauptmethoden, um damit umzugehen:
Option 1: Nullwerte entfernen
1. Öffnen Sie den Filter der Spalte
2. Deaktivieren Sie die Auswahl von "Null"Option 2: Nullwerte durch Ersatzwerte ersetzen
1. Rechtsklick auf die Spalte → "Werte ersetzen"
2. Geben Sie den Ersatzwert ein (z. B. 0 oder ein Platzhalter wie "Unbekannt")In manchen Fällen ist es sinnvoll, Fehlerwerte separat zu behandeln. Hierfür stehen zusätzliche Funktionen wie "Fehler ersetzen" zur Verfügung, um die Datenqualität weiter zu verbessern.
Datenqualität analysieren: Profiling-Tools nutzen
Bevor Sie mit der Transformation fortfahren, sollten Sie die Datenqualität prüfen. Die Profiling-Tools im Power Query Editor helfen Ihnen dabei:
Aktivieren Sie im Menü "Ansicht" die Optionen:
- Spaltenqualität: Zeigt den Anteil leerer, fehlerhafter und gültiger Werte an
- Spaltenverteilung: Visualisiert die Häufigkeit verschiedener Werte
- Spaltenprofil: Bietet detaillierte Statistiken zu jeder Spalte
Diese Einblicke ermöglichen es Ihnen, potenzielle Probleme frühzeitig zu erkennen und gezielt zu beheben. Besonders bei großen Datensätzen sparen Sie so wertvolle Zeit.
Tabellen umstrukturieren: Pivot und Unpivot richtig einsetzen
Manchmal sind Daten in einer ungünstigen Formatierung gespeichert. Hier kommen die Funktionen Pivot und Unpivot ins Spiel:
- Unpivot: Wandelt Spalten in Zeilen um – ideal für monatliche oder wiederkehrende Werte
- Pivot: Wandelt Zeilen in Spalten um – nützlich für zusammenfassende Auswertungen
Ein Beispiel: Eine Tabelle mit monatlichen Verkaufszahlen pro Produkt kann durch Unpivot in ein formatiertes Analyseschema überführt werden. Umgekehrt lassen sich durch Pivoting Daten für eine kompakte Übersicht zusammenfassen.
Daten zusammenführen: Queries verbinden und kombinieren
Power Query ermöglicht das Zusammenführen von Datensätzen auf verschiedene Weisen:
Merging (Vereinigen) – ähnlich einem SQL-Join:
1. Registerkarte "Startseite" → "Queries vereinigen"
2. Wählen Sie den Verbindungstyp (z. B. Inner Join, Left Outer Join, Right Outer Join)
3. Definieren Sie die SchlüsselspaltenAppending (Anhängen) – zum Stapeln von Tabellen:
1. Registerkarte "Startseite" → "Queries anhängen"
2. Wählen Sie die zu kombinierenden Tabellen ausEin klassisches Beispiel ist die Zusammenführung von Verkaufsdaten aus verschiedenen Jahren. Durch Anhängen oder Vereinigen entsteht eine konsolidierte Datenbasis für die Analyse.
Fortgeschrittene Anpassungen: M-Code und erweiterte Transformationen
Für komplexere Anforderungen bietet Power Query den M-Code, die zugrundeliegende Programmiersprache der Transformationen. Der Erweiterte Editor ermöglicht es Ihnen, Anpassungen direkt im Code vorzunehmen:
let
Quelle = Excel.Workbook(File.Contents("Verkaufsdaten.xlsx"), null, true),
Verkaufstabelle = Quelle{[Item="Verkäufe",Kind="Table"]}[Data],
#"Gefilterte Zeilen" = Table.SelectRows(Verkaufstabelle, each [Betrag] <> null)
in
#"Gefilterte Zeilen"Obwohl der visuelle Editor für die meisten Anwendungsfälle ausreicht, bietet der M-Code maximale Flexibilität für spezielle Datenaufbereitungen.
Fazit: Saubere Daten als Schlüssel zu vertrauenswürdigen Analysen
Die Aufbereitung von Daten ist kein optionaler Schritt, sondern die Grundlage jeder erfolgreichen Power BI-Analyse. Mit Power Query stehen Ihnen leistungsstarke Werkzeuge zur Verfügung, um aus unordentlichen Rohdaten eine strukturierte, fehlerfreie Datenbasis zu schaffen.
Wenn Sie diese Techniken beherrschen, profitieren Sie von mehreren Vorteilen:
- Schnellere und genauere Analysen
- Professionellere Berichte und Dashboards
- Weniger Zeitaufwand für manuelle Fehlerkorrekturen
- Höhere Akzeptanz bei Entscheidern durch verlässliche Daten
Investieren Sie Zeit in die Datenaufbereitung – sie zahlt sich in Form besserer Erkenntnisse und fundierter Entscheidungen aus. Mit jedem Projekt werden Sie sicherer im Umgang mit Power Query und können komplexere Datenherausforderungen meistern.
KI-Zusammenfassung
Learn to clean, transform, and load data in Power BI with this step-by-step guide. Remove duplicates, handle nulls, and reshape datasets for accurate reporting.