Mikä on ETL
Tietojen poiminta, muunnos, lataus
ETL (Extract, Transform, Load) on prosessi, jossa poimitaan tietoja eri lähteistä, muunnetaan ne ja ladataan kohdevarastoon analysointia ja raportointia varten.
ETL-vaiheet
- Extract (Poiminta) — tietojen kerääminen tietokannoista, API:sta, tiedostoista
- Transform (Muunnos) — puhdistus, validointi, aggregointi
- Load (Lataus) — siirto data warehouseen tai data lakeen
ETL-työkalut
- Apache Airflow — pipeline-orkestrointi
- Talend — yritystason ETL-alusta
- dbt — muunnos warehousessa
- Fivetran — automatisoitu integraatio
Liiketoimintasovellukset
- Data warehousejen rakentaminen
- CRM-, ERP-, markkinointi-integraatio
- Tietojen valmistelu BI-raportteihin
- Järjestelmämigraatio