Hva er Syntetiske data
Kunstig opprettede treningsdata
Syntetiske data er kunstig genererte data som etterligner ekte data samtidig som de bevarer deres statistiske egenskaper og struktur.
Fordeler
- Personvern — ingen risiko for lekkasje av personopplysninger
- Skalerbarhet — kan opprette hvilken som helst mengde data
- Klassebalanse — lett å eliminere ubalanse i datasett
- Sjeldne scenarier — modellering av grensetilfeller
Genereringsmetoder
- Statistiske modeller — basert på fordelinger
- GAN — generative motstandernettverk
- VAE — variasjonelle autoencodere
- Simuleringer — fysisk modellering
Anvendelser
- Trening av ML-modeller ved datamangel
- Testing av databehandlingssystemer
- Applikasjonsutvikling og feilsøking
- Forsterkning av eksisterende datasett