Was ist Data Warehouse
Strukturierter Speicher für Analytik
Was ist ein Data Warehouse
Data Warehouse ist ein zentralisierter strukturierter Speicher für Business-Analytik, der Daten aus verschiedenen Quellen in einem einheitlichen Modell konsolidiert.
Data Warehouse Architektur
| Schicht | Beschreibung | |---------|--------------| | Staging Area | Zwischenzone für Datenladung | | ODS | Operativer Datenspeicher | | Data Warehouse | Hauptspeicher (Fakten + Dimensionen) | | Data Marts | Abteilungsspezifische Sichten |
Modellierungsschemas
- Sternschema — zentrale Faktentabelle + Dimensionen
- Schneeflocken-Schema — normalisierte Dimensionen
- Galaxie-Schema — mehrere Faktentabellen
ETL-Prozess
| Phase | Beschreibung | |-------|--------------| | Extract | Extraktion aus Quellen | | Transform | Bereinigung, Transformation, Aggregation | | Load | Laden ins Warehouse |
Beliebte Lösungen
| Lösung | Typ | |--------|-----| | Snowflake | Cloud-native | | Amazon Redshift | AWS | | Google BigQuery | GCP | | Azure Synapse | Microsoft | | Teradata | Enterprise On-Premise | | Vertica | Spaltenbasierte Analytik |
Vorteile
- Single Source of Truth
- Historische Daten (SCD)
- Analytik-Optimierung
- Berichtskonsistenz
- OLTP/OLAP-Lastentrennung