Nedir Veri Dönüştürme
Verileri bir formattan diğerine dönüştürme
Veri Dönüştürme, analiz, entegrasyon veya depolama için verileri kaynak formatından veya yapısından hedef formata dönüştürme işlemidir.
Dönüştürme Türleri
- Yapısal — veri şemasını değiştirme (normalleştirme, denormalizasyon)
- Format — formatlar arası dönüştürme (JSON, XML, CSV)
- Semantik — birleşik referans kodlarına eşleme
- Toplama — verileri gruplama ve özetleme
- Temizleme — yinelenen öğeleri kaldırma, hataları düzeltme
ETL/ELT Süreçleri
Dönüştürme, veri ambarlarına veri yüklemek için ETL (Ayıkla, Dönüştür, Yükle) ve ELT (Ayıkla, Yükle, Dönüştür) boru hatlarındaki önemli bir adımdır.
Araçlar
- Apache Spark, Apache Beam
- dbt (data build tool)
- Talend, Informatica
- Python (pandas, PySpark)
Kaliteli dönüştürme, veri tutarlılığını ve analiz için hazırlığı sağlar.