O que é Classificação de Texto
Categorização automática de textos
Classificação de Texto é uma tarefa de aprendizado de máquina para atribuir automaticamente categorias ou rótulos a textos com base em seu conteúdo.
Tipos de classificação
- Binária — duas classes (spam/não spam)
- Multi-classe — várias classes mutuamente exclusivas
- Multi-rótulo — múltiplos rótulos simultaneamente
Métodos
- ML tradicional — Naive Bayes, SVM, Random Forest
- Deep Learning — LSTM, CNN para textos
- Transformers — BERT, RoBERTa, GPT
Aplicações empresariais
- Filtragem de spam e conteúdo indesejado
- Roteamento de tickets de suporte
- Categorização de documentos
- Análise de sentimento de avaliações
- Detecção de tópicos de notícias
Métricas de qualidade
- Accuracy, Precision, Recall
- F1-score (média harmônica)
- AUC-ROC para classificação binária