Qué es Clasificación de Texto
Categorización automática de textos
Clasificación de Texto es una tarea de aprendizaje automático para asignar automáticamente categorías o etiquetas a textos según su contenido.
Tipos de clasificación
- Binaria — dos clases (spam/no spam)
- Multi-clase — varias clases mutuamente excluyentes
- Multi-etiqueta — múltiples etiquetas simultáneamente
Métodos
- ML tradicional — Naive Bayes, SVM, Random Forest
- Deep Learning — LSTM, CNN para textos
- Transformers — BERT, RoBERTa, GPT
Aplicaciones empresariales
- Filtrado de spam y contenido no deseado
- Enrutamiento de tickets de soporte
- Categorización de documentos
- Análisis de sentimientos de reseñas
- Detección de temas de noticias
Métricas de calidad
- Accuracy, Precision, Recall
- F1-score (media armónica)
- AUC-ROC para clasificación binaria