Что такое ETL
Извлечение, преобразование, загрузка данных
ETL (Extract, Transform, Load) — это процесс извлечения данных из различных источников, их преобразования и загрузки в целевое хранилище для анализа и отчётности.
Этапы ETL
- Extract (Извлечение) — сбор данных из баз, API, файлов
- Transform (Преобразование) — очистка, валидация, агрегация
- Load (Загрузка) — перенос в хранилище данных или озеро данных
Инструменты ETL
- Apache Airflow — оркестрация пайплайнов
- Talend — enterprise ETL платформа
- dbt — трансформация в хранилище
- Fivetran — автоматическая интеграция
Применение в бизнесе
- Построение хранилищ данных
- Интеграция CRM, ERP, маркетинга
- Подготовка данных для BI-отчётов
- Миграция между системами