BI-Technologie & Architektur: Der komplette Überblick
Data Warehouse, ETL, OLAP, Cloud – die technologischen Bausteine moderner Business Intelligence. Verständlich erklärt für Entscheider und IT-Verantwortliche.
Die BI-Architektur im Überblick
Jede BI-Lösung folgt einem grundlegenden Muster: Daten werden aus Quellsystemen extrahiert, transformiert, zentral gespeichert und für Analysen bereitgestellt. Die Komplexität liegt im Detail.
Quellsysteme (Source Layer)
Die operative Datenbasis: ERP (SAP, Microsoft Dynamics, DATEV), CRM (Salesforce, HubSpot), Webshops, Produktionssysteme, IoT-Sensoren, Excel-Dateien und externe APIs. Je heterogener die Landschaft, desto wichtiger wird die nächste Schicht.
Integrationsschicht (ETL/ELT)
ETL (Extract, Transform, Load) extrahiert Daten, transformiert sie in ein einheitliches Format und lädt sie ins Data Warehouse. ELT (Extract, Load, Transform) ist der moderne Ansatz: Daten werden roh geladen und erst im Zielsystem transformiert – schneller und flexibler dank Cloud-Computing-Power.
Tools: Microsoft SSIS, Informatica, Talend, Fivetran, dbt, Apache Airflow.
Speicherschicht (Storage Layer)
Data Warehouse: Optimiert für analytische Abfragen, strukturierte Daten, historische Speicherung. Star-/Snowflake-Schema. Beispiele: Snowflake, Azure Synapse, Amazon Redshift, Google BigQuery.
Data Lake: Speichert Rohdaten in jedem Format (strukturiert, semi-strukturiert, unstrukturiert). Günstiger, flexibler, aber weniger performant für direkte Abfragen. Beispiele: Azure Data Lake, AWS S3, Google Cloud Storage.
Data Lakehouse: Die Kombination aus beiden – Flexibilität des Lake mit der Performance des Warehouse. Beispiele: Databricks, Delta Lake.
Analyseschicht (Analytics Layer)
OLAP (Online Analytical Processing) ermöglicht multidimensionale Analysen: Drill-Down, Roll-Up, Slice & Dice über Dimensionen wie Zeit, Region und Produkt. Semantische Modelle und Measures definieren die Geschäftslogik zentral.
Präsentationsschicht (Presentation Layer)
Dashboards, Reports, Alerts und Self-Service-Tools machen die Analysen zugänglich. Hier interagieren die Endnutzer mit dem System. Tools: Power BI, Tableau, Qlik Sense, Metabase, Apache Superset.
Data Warehouse vs. Data Lake vs. Data Lakehouse
| Kriterium | Data Warehouse | Data Lake | Data Lakehouse |
|---|---|---|---|
| Datenstruktur | Strukturiert | Alle Formate | Alle Formate |
| Abfrage-Performance | Sehr hoch | Variabel | Hoch |
| Kosten | Hoch | Niedrig | Mittel |
| Governance | Stark | Schwach | Stark |
| Best für | Reporting, KPIs | ML, Data Science | Beides |
ETL vs. ELT: Welcher Ansatz passt?
ETL (klassisch)
Daten werden vor dem Laden transformiert. Ideal für On-Premise-Systeme mit begrenzter Rechenpower. Bewährt, aber weniger flexibel bei Schema-Änderungen.
ELT (modern)
Daten werden roh geladen und im Zielsystem transformiert. Nutzt die Cloud-Rechenpower. Schneller, flexibler, ideal mit dbt und modernen Cloud-DWH.
Cloud vs. On-Premise
Cloud BI
Skalierbar, nutzungsbasierte Kosten, automatische Updates, kein Hardware-Management. Azure, AWS, GCP. Klare Empfehlung für den Mittelstand.
On-Premise
Volle Datenkontrolle, kein Vendor Lock-in, aber höhere Initialkosten und eigenes IT-Team nötig. Noch relevant in regulierten Branchen (Banken, Rüstung).
Welche Architektur passt zu Ihnen?
- KMU mit 1-3 Datenquellen: Direktanbindung an Power BI, kein DWH nötig. Kosten: ab 500€/Monat.
- Mittelstand mit 5+ Quellen: Cloud-DWH (Snowflake/BigQuery) + dbt + Power BI. Kosten: 2.000-5.000€/Monat.
- Größerer Mittelstand mit ML: Data Lakehouse (Databricks) + ML-Pipeline. Kosten: 5.000-15.000€/Monat.
Welche Architektur brauchen Sie?
In einem technischen Beratungsgespräch analysiere ich Ihre Systemlandschaft und empfehle die passende BI-Architektur.
Technische Beratung anfragen →Weiterführende Artikel
Was ist Business Intelligence?
Grundlagen und Prozesse im Überblick.
Datenintegration & ETL
Praxisleitfaden zum Auflösen von Datensilos.
BI-Tools im Vergleich
Power BI, Tableau, Qlik & Co. – welches Tool passt?
