Qué es Hiperparámetros
Configuraciones del modelo definidas antes del entrenamiento
Los hiperparámetros son parámetros del modelo de aprendizaje automático que se establecen antes de que comience el entrenamiento y no cambian durante el proceso. A diferencia de los parámetros regulares, los hiperparámetros definen la arquitectura y el comportamiento del modelo.
Hiperparámetros principales
- Tasa de aprendizaje — velocidad de aprendizaje del modelo
- Tamaño del lote — tamaño del lote de datos para una iteración
- Número de épocas — número de pasadas por todo el conjunto de datos
- Número de capas — número de capas de la red neuronal
- Regularización — parámetros de regularización (L1, L2, dropout)
Métodos de ajuste
- Grid Search — búsqueda exhaustiva de todas las combinaciones de valores
- Random Search — búsqueda aleatoria en el espacio de parámetros
- Optimización Bayesiana — optimización bayesiana
- AutoML — selección automática de arquitectura y parámetros
Impacto en el modelo
- Tasa de aprendizaje muy alta — el modelo no converge
- Tasa de aprendizaje muy baja — entrenamiento lento
- Tamaño de lote grande — más rápido pero peor generalización
- Tamaño de lote pequeño — mejor generalización pero más lento