क्या है टेक्स्ट वर्गीकरण
स्वचालित पाठ श्रेणीकरण
टेक्स्ट वर्गीकरण सामग्री के आधार पर टेक्स्ट को स्वचालित रूप से श्रेणियाँ या लेबल असाइन करने का एक मशीन लर्निंग कार्य है।
वर्गीकरण प्रकार
- बाइनरी — दो वर्ग (स्पैम/नॉन-स्पैम)
- मल्टी-क्लास — कई परस्पर अनन्य वर्ग
- मल्टी-लेबल — एक साथ कई लेबल
विधियाँ
- पारंपरिक ML — Naive Bayes, SVM, Random Forest
- डीप लर्निंग — LSTM, टेक्स्ट के लिए CNN
- ट्रांसफॉर्मर — BERT, RoBERTa, GPT
व्यावसायिक अनुप्रयोग
- स्पैम और अवांछित सामग्री फ़िल्टरिंग
- सपोर्ट टिकट रूटिंग
- दस्तावेज़ वर्गीकरण
- समीक्षाओं का भावना विश्लेषण
- समाचार विषय पहचान
गुणवत्ता मेट्रिक्स
- Accuracy, Precision, Recall
- F1-score (हार्मोनिक माध्य)
- बाइनरी वर्गीकरण के लिए AUC-ROC