Hva er Tekstklassifisering
Automatisk tekstkategorisering
Tekstklassifisering er en maskinlæringsoppgave for automatisk å tildele kategorier eller etiketter til tekster basert på innholdet.
Klassifiseringstyper
- Binær — to klasser (spam/ikke spam)
- Multi-klasse — flere gjensidig utelukkende klasser
- Multi-etikett — flere etiketter samtidig
Metoder
- Tradisjonell ML — Naive Bayes, SVM, Random Forest
- Deep Learning — LSTM, CNN for tekster
- Transformers — BERT, RoBERTa, GPT
Forretningsanvendelser
- Filtrering av spam og uønsket innhold
- Ruting av supportbilletter
- Dokumentkategorisering
- Sentimentanalyse av anmeldelser
- Deteksjon av nyhetsemner
Kvalitetsmålinger
- Accuracy, Precision, Recall
- F1-score (harmonisk gjennomsnitt)
- AUC-ROC for binær klassifisering