Артық оқыту дегеніміз не
Модель оқыту деректерін тым жақсы есте сақтағанда
Артық оқыту — бұл модель оқыту деректерін тым жақсы есте сақтап, жаңа деректерге жалпылай алмайтын машиналық оқыту мәселесі.
Артық оқытудың белгілері
- Оқыту деректеріндегі жоғары дәлдік
- Тест деректеріндегі төмен дәлдік
- Train және test көрсеткіштері арасындағы үлкен алшақтық
- Модель деректердегі шуды есте сақтайды
Себептері
- Тым күрделі модель
- Оқыту деректері жеткіліксіз
- Тым ұзақ оқыту
- Регуляризация жоқтығы
Алдын алу әдістері
- Регуляризация (L1, L2)
- Нейрондық желілердегі Dropout
- Ерте тоқтату
- Кросс-валидация
- Деректерді көбейту
- Модельді жеңілдету
Bias-Variance теңгерімі
Артық оқыту төмен bias және жоғары variance-пен байланысты. Дұрыс теңгерімді табу маңызды.