O que é Data Warehouse
Armazenamento estruturado para análise
O que é Data Warehouse
Data Warehouse é um armazenamento estruturado centralizado para análise de negócios que consolida dados de várias fontes em um modelo unificado.
Arquitetura Data Warehouse
| Camada | Descrição | |--------|-----------| | Staging Area | Zona intermediária de carregamento | | ODS | Armazém de Dados Operacional | | Data Warehouse | Armazenamento principal (fatos + dimensões) | | Data Marts | Visões departamentais (vendas, marketing) |
Esquemas de modelagem
- Esquema Estrela — tabela fato central + dimensões
- Esquema Floco de Neve — dimensões normalizadas
- Esquema Galáxia — múltiplas tabelas fato
Processo ETL
| Etapa | Descrição | |-------|-----------| | Extract | Extração das fontes | | Transform | Limpeza, transformação, agregação | | Load | Carregamento no armazém |
Soluções populares
| Solução | Tipo | |---------|------| | Snowflake | Cloud-native | | Amazon Redshift | AWS | | Google BigQuery | GCP | | Azure Synapse | Microsoft | | Teradata | Enterprise on-premise | | Vertica | Análise colunar |
Benefícios
- Fonte única da verdade
- Dados históricos (SCD)
- Otimização para análise
- Consistência de relatórios
- Separação de cargas OLTP/OLAP