Mikä on Datakartoitus
Kenttävastaavuus järjestelmien välillä
Datakartoitus on prosessi, jossa luodaan vastaavuus kenttien, attribuuttien ja datarakenteiden välille eri järjestelmissä, tietokannoissa tai formaateissa.
Kartoitustyypit
| Tyyppi | Kuvaus | Esimerkki | |--------|--------|-----------| | Skeemasta skeemaan | Vastaavuus DB-skeemojen välillä | Oracle → PostgreSQL | | Formaatista formaattiin | Formaattimuunnos | XML → JSON | | Semanttinen | Merkitykseen perustuva suhde | "Asiakas" ↔ "Customer" | | Tekninen | Tietotyyppien vastaavuus | VARCHAR → STRING |
Prosessin vaiheet
- Lähdeanalyysi — lähdedatarakenteen tutkiminen
- Kohdeanalyysi — kohderakenteen tutkiminen
- Sääntöjen määrittely — muunnoslogiikka
- Poikkeusten käsittely — null, tyhjät arvot, virheet
- Validointi — kartoituksen oikeellisuuden tarkistus
Muunnossäännöt
Yksinkertaiset muunnokset
- Suora kopiointi: source.name → target.name
- Uudelleennimeäminen: source.client_id → target.customer_id
- Tyypin muutos: INTEGER → STRING
Monimutkaiset muunnokset
- Yhdistäminen: first_name + last_name → full_name
- Jakaminen: full_address → city, street, zip
- Haku: code → kuvaus viitetaulukosta
- Laskelmat: price * quantity → total
Työkalut
- ETL-alustat — Informatica, Talend, SSIS
- iPaaS — MuleSoft, Dell Boomi, Workato
- Erikoistuneet — Altova MapForce, CloverDX
- Avoimen lähdekoodin — Apache NiFi, Pentaho
Sovellukset
Datakartoitus on kriittinen järjestelmäintegraatiolle, datamigraatiolle, tietovarastojen rakentamiselle ja B2B-datanvaihdolle. Laadukas kartoitus varmistaa datan eheyden ja yhtenäisyyden koko organisaatiossa.