Vad är Datalager
Strukturerad lagring för analys
Vad är Data Warehouse
Data Warehouse är ett centraliserat strukturerat lager för affärsanalys som konsoliderar data från olika källor i en enhetlig modell.
Data Warehouse-arkitektur
| Lager | Beskrivning | |-------|-------------| | Staging Area | Mellanliggande dataladdningszon | | ODS | Operativ datalagring | | Data Warehouse | Huvudlagring (fakta + dimensioner) | | Data Marts | Avdelningsspecifika vyer (försäljning, marknadsföring) |
Modelleringsscheman
- Stjärnschema — central faktatabell + dimensioner
- Snöflingschema — normaliserade dimensioner
- Galaxschema — flera faktatables
ETL-process
| Steg | Beskrivning | |------|-------------| | Extract | Extraktion från källor | | Transform | Rensning, transformation, aggregering | | Load | Laddning till lager |
Populära lösningar
| Lösning | Typ | |---------|-----| | Snowflake | Molnbaserad | | Amazon Redshift | AWS | | Google BigQuery | GCP | | Azure Synapse | Microsoft | | Teradata | Enterprise on-premise | | Vertica | Kolumnbaserad analys |
Fördelar
- Enda sanningskälla
- Historisk data (SCD)
- Analysoptimering
- Rapportkonsistens
- OLTP/OLAP-arbetsbelastningsseparation