Qué es Data Warehouse
Almacenamiento estructurado para análisis
Qué es Data Warehouse
Data Warehouse es un almacenamiento estructurado centralizado para análisis de negocio que consolida datos de diversas fuentes en un modelo unificado.
Arquitectura Data Warehouse
| Capa | Descripción | |------|-------------| | Staging Area | Zona intermedia de carga de datos | | ODS | Almacén de Datos Operacional | | Data Warehouse | Almacenamiento principal (hechos + dimensiones) | | Data Marts | Vistas departamentales (ventas, marketing) |
Esquemas de modelado
- Esquema Estrella — tabla de hechos central + dimensiones
- Esquema Copo de Nieve — dimensiones normalizadas
- Esquema Galaxia — múltiples tablas de hechos
Proceso ETL
| Etapa | Descripción | |-------|-------------| | Extract | Extracción de fuentes | | Transform | Limpieza, transformación, agregación | | Load | Carga al almacén |
Soluciones populares
| Solución | Tipo | |----------|------| | Snowflake | Cloud-native | | Amazon Redshift | AWS | | Google BigQuery | GCP | | Azure Synapse | Microsoft | | Teradata | Enterprise on-premise | | Vertica | Analítica columnar |
Beneficios
- Fuente única de verdad
- Datos históricos (SCD)
- Optimización para análisis
- Consistencia en reportes
- Separación de cargas OLTP/OLAP