Was ist Synthetische Daten
Künstlich erstellte Trainingsdaten
Synthetische Daten sind künstlich generierte Daten, die echte Daten imitieren und dabei ihre statistischen Eigenschaften und Struktur bewahren.
Vorteile
- Datenschutz — kein Risiko von Datenlecks
- Skalierbarkeit — beliebige Datenmengen erstellbar
- Klassenbalance — einfache Beseitigung von Ungleichgewichten
- Seltene Szenarien — Modellierung von Grenzfällen
Generierungsmethoden
- Statistische Modelle — basierend auf Verteilungen
- GAN — Generative Adversarial Networks
- VAE — Variational Autoencoder
- Simulationen — physikalische Modellierung
Anwendungen
- Training von ML-Modellen bei Datenmangel
- Testen von Datenverarbeitungssystemen
- Anwendungsentwicklung und Debugging
- Erweiterung bestehender Datensätze