Mis on Andmete kaardistamine
Väljade vastavus süsteemide vahel
Andmete kaardistamine on protsess, mille käigus luuakse vastavused väljade, atribuutide ja andmestruktuuride vahel erinevates süsteemides, andmebaasides või formaatides.
Kaardistamise tüübid
| Tüüp | Kirjeldus | Näide | |------|-----------|-------| | Skeemast skeemani | Vastavus DB skeemade vahel | Oracle → PostgreSQL | | Formaadist formaadini | Formaadi teisendamine | XML → JSON | | Semantiline | Tähenduspõhine seos | "Klient" ↔ "Customer" | | Tehniline | Andmetüüpide vastavus | VARCHAR → STRING |
Protsessi etapid
- Allika analüüs — lähteandmete struktuuri uurimine
- Sihtmärgi analüüs — sihtstruktuuri uurimine
- Reeglite määratlus — teisenduse loogika
- Erandite käsitlemine — null, tühjad väärtused, vead
- Valideerimine — kaardistamise õigsuse kontroll
Teisendusreeglid
Lihtsad teisendused
- Otsene kopeerimine: source.name → target.name
- Ümbernimetamine: source.client_id → target.customer_id
- Tüübi muutmine: INTEGER → STRING
Keerulised teisendused
- Liitmine: first_name + last_name → full_name
- Jagamine: full_address → city, street, zip
- Otsing: code → kirjeldus viitetabelist
- Arvutused: price * quantity → total
Tööriistad
- ETL platvormid — Informatica, Talend, SSIS
- iPaaS — MuleSoft, Dell Boomi, Workato
- Spetsialiseeritud — Altova MapForce, CloverDX
- Avatud lähtekoodiga — Apache NiFi, Pentaho
Rakendused
Andmete kaardistamine on kriitilise tähtsusega süsteemide integreerimiseks, andmete migreerimiseks, andmeladude ehitamiseks ja B2B andmevahetuseks. Kvaliteetne kaardistamine tagab andmete tervikluse ja järjepidevuse kogu organisatsioonis.