Qué es Datos Sintéticos
Datos de entrenamiento creados artificialmente
Datos Sintéticos son datos generados artificialmente que imitan datos reales preservando sus propiedades estadísticas y estructura.
Ventajas
- Privacidad — sin riesgo de fuga de datos personales
- Escalabilidad — se puede crear cualquier volumen de datos
- Balance de clases — fácil eliminar desequilibrios
- Escenarios raros — modelado de casos límite
Métodos de generación
- Modelos estadísticos — basados en distribuciones
- GAN — redes generativas adversarias
- VAE — autoencoders variacionales
- Simulaciones — modelado físico
Aplicaciones
- Entrenamiento de modelos ML con datos limitados
- Pruebas de sistemas de procesamiento de datos
- Desarrollo y depuración de aplicaciones
- Aumento de conjuntos de datos existentes