データウェアハウス とは
分析用の構造化ストレージ
データウェアハウスとは
データウェアハウスは、様々なソースからのデータを統一モデルに統合するビジネス分析用の集中構造化ストレージです。
データウェアハウスアーキテクチャ
| レイヤー | 説明 | |----------|------| | ステージングエリア | 中間データロードゾーン | | ODS | オペレーショナルデータストア | | データウェアハウス | メインストレージ(ファクト+ディメンション) | | データマート | 部門別ビュー(営業、マーケティング) |
モデリングスキーマ
- スタースキーマ — 中央ファクトテーブル+ディメンション
- スノーフレークスキーマ — 正規化ディメンション
- ギャラクシースキーマ — 複数ファクトテーブル
ETLプロセス
| 段階 | 説明 | |------|------| | Extract | ソースからの抽出 | | Transform | クレンジング、変換、集約 | | Load | ウェアハウスへのロード |
主要ソリューション
| ソリューション | タイプ | |----------------|--------| | Snowflake | クラウドネイティブ | | Amazon Redshift | AWS | | Google BigQuery | GCP | | Azure Synapse | Microsoft | | Teradata | エンタープライズオンプレミス | | Vertica | カラム型分析 |
メリット
- 単一の真実の情報源
- 履歴データ(SCD)
- 分析最適化
- レポート一貫性
- OLTP/OLAPワークロード分離