Datenmodellierung für BI: Star Schema, Snowflake & Best Practices

Technologie

Datenmodellierung für BI: Star Schema, Snowflake & Best Practices

Wie Sie ein performantes, wartbares Datenmodell aufbauen, das die Grundlage für alle Ihre Dashboards und Analysen bildet.

Die unsichtbare Grundlage: 80% der BI-Arbeit steckt im Datenmodell – nicht in hübschen Diagrammen. Ein gutes Modell macht Dashboards schnell, Berechnungen korrekt und Erweiterungen einfach. Ein schlechtes Modell erzeugt falsche Zahlen und Frust.

Warum Datenmodellierung entscheidend ist

  • Performance: Ein optimiertes Modell beantwortet Abfragen in Millisekunden statt Minuten
  • Korrektheit: Fehlende oder falsche Beziehungen erzeugen falsche Aggregationen
  • Wartbarkeit: Neue Anforderungen lassen sich in einem guten Modell einfach ergänzen
  • Self-Service: Ein verständliches Modell befähigt Fachanwender zur eigenständigen Analyse

Star Schema vs. Snowflake Schema

Aspekt Star Schema ⭐ Snowflake Schema ❄️
Struktur Fakt-Tabelle + denormalisierte Dimensionen Fakt + normalisierte Subdimensionen
Komplexität Einfach (wenige Joins) Komplex (viele Joins)
Query-Performance ⭐⭐⭐⭐⭐ (schnell) ⭐⭐⭐ (mehr Joins)
Speicherplatz Mehr (Redundanz) Weniger (normalisiert)
Empfehlung Standard für BI ✓ Nur bei extremer Speicherknappheit

Anatomie eines Star Schemas

F

Fakt-Tabelle (Zentrum)

Enthält die messbaren Geschäftsereignisse: Umsatz, Menge, Kosten, Dauer. Jede Zeile = ein Geschäftsvorfall (z.B. eine Bestellposition). Plus Fremdschlüssel zu allen Dimensionen. Schmal und lang – viele Zeilen, wenige Spalten.

D

Dimensions-Tabellen (Umgebung)

Beschreiben die Fakten: Wer (Kunde), Was (Produkt), Wann (Datum), Wo (Region), Wie (Vertriebskanal). Denormalisiert = alle Attribute einer Hierarchie in einer Tabelle. Breit und kurz – wenige Zeilen, viele Spalten.

Die 10 Gebote der BI-Datenmodellierung

1️⃣

Star Schema bevorzugen

Denormalisierte Dimensionen. Keine 3NF im DWH.

2️⃣

Surrogate Keys nutzen

Integer-Schlüssel statt Business-Keys für Performance.

3️⃣

Date Dimension pflegen

Eigene Datumstabelle mit Jahr, Quartal, Monat, KW, Feiertagen.

4️⃣

Measures, keine berechneten Spalten

In Power BI: immer DAX Measures statt Calculated Columns.

5️⃣

Slowly Changing Dimensions

SCD Type 2 für historische Änderungen (z.B. Kundenadresse).

6️⃣

Keine Bidirektionalen Filter

Einheitliche Filterrichtung: Dimension → Fakt. Immer.

📚 Dieser Artikel ist Teil unseres Technologie-Guides: BI-Technologie Grundlagen →

Datenmodell optimieren?

Ob Neuaufbau oder Refactoring – ich helfe Ihnen, das optimale Datenmodell für Ihre Analysen zu entwerfen.

Modellierungs-Workshop anfragen →
Nach oben scrollen