Hva er Overtilpasning
Når en modell memorerer treningsdata for godt
Overtilpasning er et maskinlæringsproblem når en modell memorerer treningsdata for godt og ikke klarer å generalisere til nye data.
Tegn på Overtilpasning
- Høy nøyaktighet på treningsdata
- Lav nøyaktighet på testdata
- Stort gap mellom trenings- og testmålinger
- Modellen memorerer støy i data
Årsaker
- For kompleks modell
- Utilstrekkelig treningsdata
- Trening for lenge
- Mangel på regularisering
Forebyggingsmetoder
- Regularisering (L1, L2)
- Dropout i nevrale nettverk
- Tidlig stopp
- Kryssvalidering
- Dataforsterkning
- Modellforenkling
Bias-Variansavveining
Overtilpasning er assosiert med lav bias og høy varians. Å finne riktig balanse er avgjørende.