Что такое Дрифт модели
Снижение качества ML-модели со временем
Дрифт модели (Model Drift) — это постепенное снижение качества и точности ML-модели со временем из-за изменений в данных или окружении.
Типы дрифта
- Data Drift — изменение входных данных
- Concept Drift — изменение связи между признаками и целью
- Prediction Drift — изменение распределения предсказаний
- Label Drift — изменение целевой переменной
Причины возникновения
- Изменение поведения пользователей
- Сезонные колебания данных
- Внешние экономические факторы
- Технические изменения в источниках данных
- Устаревание обучающих данных
Обнаружение дрифта
- Мониторинг метрик качества модели
- Статистические тесты (KS-test, PSI)
- Отслеживание распределения признаков
- A/B тестирование предсказаний
Методы борьбы
- Регулярное переобучение модели
- Online learning — непрерывное обучение
- Ensemble методы с обновлением
- Автоматические пайплайны MLOps