क्या है ओवरफिटिंग
जब मॉडल प्रशिक्षण डेटा को बहुत अच्छी तरह याद कर लेता है
ओवरफिटिंग एक मशीन लर्निंग समस्या है जब मॉडल प्रशिक्षण डेटा को बहुत अच्छी तरह याद कर लेता है और नए डेटा पर सामान्यीकरण नहीं कर पाता।
ओवरफिटिंग के संकेत
- प्रशिक्षण डेटा पर उच्च सटीकता
- परीक्षण डेटा पर कम सटीकता
- ट्रेन और टेस्ट मेट्रिक्स के बीच बड़ा अंतर
- मॉडल डेटा में शोर को याद करता है
कारण
- बहुत जटिल मॉडल
- अपर्याप्त प्रशिक्षण डेटा
- बहुत लंबे समय तक प्रशिक्षण
- नियमितीकरण की कमी
रोकथाम के तरीके
- नियमितीकरण (L1, L2)
- न्यूरल नेटवर्क में ड्रॉपआउट
- जल्दी रोकना
- क्रॉस-वैलिडेशन
- डेटा संवर्धन
- मॉडल सरलीकरण
बायस-वेरिएंस ट्रेडऑफ
ओवरफिटिंग कम बायस और उच्च वेरिएंस से जुड़ी है। सही संतुलन खोजना महत्वपूर्ण है।