Что такое Дистилляция знаний
Передача знаний от большой модели к малой
Дистилляция знаний — это техника машинного обучения, при которой компактная модель (ученик) обучается воспроизводить поведение более крупной и мощной модели (учителя).
Как работает дистилляция
Процесс включает:
- Модель-учитель — большая предобученная нейросеть
- Модель-ученик — компактная архитектура
- Soft labels — вероятностные выходы учителя
- Temperature scaling — сглаживание распределений
Преимущества метода
- Сжатие моделей в 10-100 раз
- Сохранение 90-95% качества
- Ускорение инференса
- Снижение требований к памяти
- Возможность деплоя на edge-устройства
Применение в бизнесе
- Мобильные AI-приложения
- Встраиваемые системы
- Real-time обработка
- Снижение затрат на GPU
- Локальные модели вместо облачных