ما هو تحويل البيانات
تحويل البيانات من تنسيق إلى آخر
تحويل البيانات هو عملية تحويل البيانات من تنسيقها أو هيكلها المصدر إلى تنسيق هدف للتحليل أو التكامل أو التخزين.
أنواع التحويلات
- الهيكلية — تغيير مخطط البيانات (التطبيع، إلغاء التطبيع)
- التنسيق — التحويل بين التنسيقات (JSON، XML، CSV)
- الدلالية — التعيين إلى رموز مرجعية موحدة
- التجميع — تجميع وتلخيص البيانات
- التنظيف — إزالة التكرارات، إصلاح الأخطاء
عمليات ETL/ELT
التحويل هو خطوة رئيسية في خطوط أنابيب ETL (الاستخراج، التحويل، التحميل) و ELT (الاستخراج، التحميل، التحويل) لتحميل البيانات في المستودعات.
الأدوات
- Apache Spark، Apache Beam
- dbt (أداة بناء البيانات)
- Talend، Informatica
- Python (pandas، PySpark)
يضمن التحويل عالي الجودة اتساق البيانات وجاهزيتها للتحليل.