O que é Dados Sintéticos
Dados de treinamento criados artificialmente
Dados Sintéticos são dados gerados artificialmente que imitam dados reais preservando suas propriedades estatísticas e estrutura.
Vantagens
- Privacidade — sem risco de vazamento de dados pessoais
- Escalabilidade — pode criar qualquer volume de dados
- Balanceamento de classes — fácil eliminar desequilíbrios
- Cenários raros — modelagem de casos extremos
Métodos de geração
- Modelos estatísticos — baseados em distribuições
- GAN — redes adversárias generativas
- VAE — autoencoders variacionais
- Simulações — modelagem física
Aplicações
- Treinamento de modelos ML com dados limitados
- Teste de sistemas de processamento de dados
- Desenvolvimento e depuração de aplicações
- Aumento de conjuntos de dados existentes