คืออะไร คลังข้อมูล
ที่เก็บข้อมูลแบบมีโครงสร้างสำหรับการวิเคราะห์
Data Warehouse คืออะไร
Data Warehouse คือที่เก็บข้อมูลแบบมีโครงสร้างที่รวมศูนย์สำหรับการวิเคราะห์ธุรกิจ ที่รวมข้อมูลจากแหล่งต่างๆ ในโมเดลเดียว
สถาปัตยกรรม Data Warehouse
| ชั้น | คำอธิบาย | |------|----------| | Staging Area | โซนโหลดข้อมูลระหว่างกลาง | | ODS | ที่เก็บข้อมูลปฏิบัติการ | | Data Warehouse | ที่เก็บหลัก (facts + dimensions) | | Data Marts | มุมมองแผนก (ขาย, การตลาด) |
สคีมาการสร้างแบบจำลอง
- Star Schema — ตารางข้อเท็จจริงกลาง + มิติ
- Snowflake Schema — มิติที่ปรับมาตรฐาน
- Galaxy Schema — ตารางข้อเท็จจริงหลายตาราง
กระบวนการ ETL
| ขั้นตอน | คำอธิบาย | |---------|----------| | Extract | ดึงข้อมูลจากแหล่ง | | Transform | ทำความสะอาด แปลง รวม | | Load | โหลดเข้าคลัง |
โซลูชันยอดนิยม
| โซลูชัน | ประเภท | |---------|--------| | Snowflake | Cloud-native | | Amazon Redshift | AWS | | Google BigQuery | GCP | | Azure Synapse | Microsoft | | Teradata | Enterprise on-premise | | Vertica | Columnar analytics |
ประโยชน์
- แหล่งความจริงเดียว
- ข้อมูลประวัติ (SCD)
- ปรับให้เหมาะกับการวิเคราะห์
- ความสอดคล้องของรายงาน
- แยกโหลด OLTP/OLAP