Vad är Överanpassning
När en modell memorerar träningsdata för bra
Överanpassning är ett maskininlärningsproblem när en modell memorerar träningsdata för bra och misslyckas med att generalisera till nya data.
Tecken på Överanpassning
- Hög noggrannhet på träningsdata
- Låg noggrannhet på testdata
- Stort gap mellan tränings- och testmått
- Modellen memorerar brus i data
Orsaker
- För komplex modell
- Otillräcklig träningsdata
- Träning för länge
- Brist på regularisering
Förebyggande metoder
- Regularisering (L1, L2)
- Dropout i neurala nätverk
- Tidig avstängning
- Korsvalidering
- Dataförstärkning
- Modellförenkling
Bias-Variansavvägning
Överanpassning är associerat med låg bias och hög varians. Att hitta rätt balans är avgörande.