ما هو تصنيف النص
التصنيف التلقائي للنصوص
تصنيف النص هي مهمة تعلم آلي لتعيين الفئات أو التسميات تلقائياً للنصوص بناءً على محتواها.
أنواع التصنيف
- ثنائي — فئتان (بريد عشوائي/ليس بريد عشوائي)
- متعدد الفئات — عدة فئات متنافية
- متعدد التسميات — تسميات متعددة في وقت واحد
الطرق
- ML التقليدي — Naive Bayes، SVM، Random Forest
- التعلم العميق — LSTM، CNN للنصوص
- المحولات — BERT، RoBERTa، GPT
التطبيقات التجارية
- تصفية البريد العشوائي والمحتوى غير المرغوب فيه
- توجيه تذاكر الدعم
- تصنيف المستندات
- تحليل مشاعر المراجعات
- اكتشاف موضوعات الأخبار
مقاييس الجودة
- الدقة، الضبط، الاستدعاء
- F1-score (المتوسط التوافقي)
- AUC-ROC للتصنيف الثنائي