Qu'est-ce que Classification de Texte
Catégorisation automatique des textes
Classification de Texte est une tâche d'apprentissage automatique consistant à attribuer automatiquement des catégories ou des étiquettes aux textes en fonction de leur contenu.
Types de classification
- Binaire — deux classes (spam/non spam)
- Multi-classes — plusieurs classes mutuellement exclusives
- Multi-étiquettes — plusieurs étiquettes simultanément
Méthodes
- ML traditionnel — Naive Bayes, SVM, Random Forest
- Deep Learning — LSTM, CNN pour textes
- Transformers — BERT, RoBERTa, GPT
Applications métier
- Filtrage du spam et du contenu indésirable
- Routage des tickets de support
- Catégorisation de documents
- Analyse des sentiments des avis
- Détection des sujets d'actualité
Métriques de qualité
- Accuracy, Precision, Recall
- F1-score (moyenne harmonique)
- AUC-ROC pour la classification binaire