Mikä on Synteettinen data
Keinotekoisesti luotu harjoitusdata
Synteettinen data on keinotekoisesti luotua dataa, joka jäljittelee todellista dataa säilyttäen sen tilastolliset ominaisuudet ja rakenteen.
Edut
- Yksityisyys — ei henkilötietojen vuotoriskiä
- Skaalautuvuus — voidaan luoda mikä tahansa määrä dataa
- Luokkatasapaino — epätasapainon helppo poistaminen
- Harvinaiset skenaariot — reunatapausten mallintaminen
Generointimenetelmät
- Tilastolliset mallit — jakaumiin perustuvat
- GAN — generatiiviset kilpailevat verkot
- VAE — variationaaliset autoenkoodit
- Simulaatiot — fyysinen mallintaminen
Sovellukset
- ML-mallien koulutus rajallisella datalla
- Tietojenkäsittelyjärjestelmien testaus
- Sovellusten kehitys ja virheenkorjaus
- Olemassa olevien datasettien laajentaminen