Mis on Ülesobitus
Kui mudel mäletab treeningandmeid liiga hästi
Ülesobitus on masinõppe probleem, kus mudel mäletab treeningandmeid liiga hästi ega suuda uutele andmetele üldistada.
Ülesobituse tunnused
- Kõrge täpsus treeningandmetel
- Madal täpsus testandmetel
- Suur lõhe treeningu ja testi mõõdikute vahel
- Mudel mäletab andmetes müra
Põhjused
- Liiga keeruline mudel
- Ebapiisavad treeningandmed
- Liiga pikk treening
- Regulariseerimise puudumine
Ennetusmeetodid
- Regulariseerimine (L1, L2)
- Dropout närvivõrkudes
- Varajane peatamine
- Ristvalideerimine
- Andmete täiendamine
- Mudeli lihtsustamine
Nihke-dispersiooni kompromiss
Ülesobitus on seotud madala nihke ja kõrge dispersiooniga. Õige tasakaalu leidmine on oluline.