Qué es Sobreajuste
Cuando un modelo memoriza demasiado bien los datos de entrenamiento
Sobreajuste es un problema de aprendizaje automático cuando un modelo memoriza demasiado bien los datos de entrenamiento y no logra generalizar a nuevos datos.
Señales de Sobreajuste
- Alta precisión en datos de entrenamiento
- Baja precisión en datos de prueba
- Gran brecha entre métricas de train y test
- El modelo memoriza ruido en los datos
Causas
- Modelo demasiado complejo
- Datos de entrenamiento insuficientes
- Entrenamiento demasiado prolongado
- Falta de regularización
Métodos de Prevención
- Regularización (L1, L2)
- Dropout en redes neuronales
- Parada temprana
- Validación cruzada
- Aumento de datos
- Simplificación del modelo
Equilibrio Sesgo-Varianza
El sobreajuste está asociado con bajo sesgo y alta varianza. Encontrar el equilibrio correcto es crucial.