Mis on Sünteetilised andmed
Kunstlikult loodud treeningandmed
Sünteetilised andmed on kunstlikult genereeritud andmed, mis jäljendavad pärisandmeid, säilitades nende statistilisi omadusi ja struktuuri.
Eelised
- Privaatsus — puudub isikuandmete lekke oht
- Skaleeritavus — saab luua mis tahes andmehulga
- Klasside tasakaal — lihtne kõrvaldada andmestiku tasakaalustamatust
- Haruldased stsenaariumid — äärejuhtumite modelleerimine
Genereerimismeetodid
- Statistilised mudelid — jaotustel põhinevad
- GAN — generatiivsed võistlevad võrgud
- VAE — variatsioonsed autoenkoodrid
- Simulatsioonid — füüsikaline modelleerimine
Rakendused
- ML-mudelite treenimine piiratud andmetega
- Andmetöötlussüsteemide testimine
- Rakenduste arendamine ja silumine
- Olemasolevate andmekogumite täiendamine