Mikä on Tietomuunnos
Tietojen muuntaminen muodosta toiseen
Tietomuunnos on prosessi, jossa tiedot muunnetaan lähdemuodostaan tai -rakenteestaan kohdemuotoon analysointia, integrointia tai tallennusta varten.
Muunnostyypit
- Rakenteellinen — dataskeeman muuttaminen (normalisointi, denormalisointi)
- Muoto — muuntaminen muotojen välillä (JSON, XML, CSV)
- Semanttinen — kartoitus yhtenäisiin viitekoodeihin
- Aggregointi — tietojen ryhmittely ja yhteenveto
- Puhdistus — kopioiden poisto, virheiden korjaus
ETL/ELT-prosessit
Muunnos on keskeinen vaihe ETL- (Extract, Transform, Load) ja ELT-putkistoissa (Extract, Load, Transform) datan lataamiseksi tietovarastoihin.
Työkalut
- Apache Spark, Apache Beam
- dbt (data build tool)
- Talend, Informatica
- Python (pandas, PySpark)
Laadukas muunnos varmistaa datan johdonmukaisuuden ja valmiuden analytiikkaan.