Was ist Textklassifikation
Automatische Textkategorisierung
Textklassifikation ist eine Machine-Learning-Aufgabe zur automatischen Zuweisung von Kategorien oder Labels zu Texten basierend auf deren Inhalt.
Klassifikationstypen
- Binär — zwei Klassen (Spam/kein Spam)
- Multi-Klassen — mehrere sich gegenseitig ausschließende Klassen
- Multi-Label — mehrere Labels gleichzeitig
Methoden
- Traditionelles ML — Naive Bayes, SVM, Random Forest
- Deep Learning — LSTM, CNN für Texte
- Transformer — BERT, RoBERTa, GPT
Geschäftsanwendungen
- Spam- und unerwünschte Inhaltsfilterung
- Support-Ticket-Routing
- Dokumentenkategorisierung
- Sentiment-Analyse von Bewertungen
- Erkennung von Nachrichtenthemen
Qualitätsmetriken
- Accuracy, Precision, Recall
- F1-Score (harmonisches Mittel)
- AUC-ROC für binäre Klassifikation