Qué es Transformación de datos
Conversión de datos de un formato a otro
Transformación de datos es el proceso de convertir datos de su formato o estructura de origen a un formato de destino para análisis, integración o almacenamiento.
Tipos de transformaciones
- Estructural — cambio de esquema de datos (normalización, desnormalización)
- Formato — conversión entre formatos (JSON, XML, CSV)
- Semántica — mapeo a códigos de referencia unificados
- Agregación — agrupación y resumen de datos
- Limpieza — eliminación de duplicados, corrección de errores
Procesos ETL/ELT
La transformación es un paso clave en los pipelines ETL (Extract, Transform, Load) y ELT (Extract, Load, Transform) para cargar datos en almacenes.
Herramientas
- Apache Spark, Apache Beam
- dbt (data build tool)
- Talend, Informatica
- Python (pandas, PySpark)
Una transformación de calidad garantiza la consistencia de los datos y su preparación para el análisis.