Was ist Datenerweiterung
Künstliche Erweiterung von Trainingsdaten
Datenerweiterung
Datenerweiterung ist eine Technik zur künstlichen Vergrößerung des Trainingsdatenvolumens durch Erstellung modifizierter Kopien bestehender Daten.
Warum Augmentation verwenden
- Datensatzgröße erhöhen — wenn unzureichende Daten für das Training vorhanden sind
- Überanpassung verhindern — Modell lernt aus vielfältigen Variationen
- Robustheit verbessern — Modell generalisiert besser auf neuen Daten
- Kosten reduzieren — günstiger als echte Daten zu sammeln
Methoden für Bilder
| Methode | Beschreibung | |---------|--------------| | Rotation | Drehung um beliebigen Winkel | | Spiegelung | Horizontale/vertikale Spiegelung | | Skalierung | Vergrößern/Verkleinern | | Zuschnitt | Zufälliger Bildausschnitt | | Helligkeit/Kontrast | Farbcharakteristikanpassungen | | Rauschen | Gaußsches Rauschen hinzufügen | | Cutout/Mixup | Moderne Techniken |
Methoden für Text
- Back-Translation — Übersetzung hin und zurück durch eine andere Sprache
- Synonyme — Wörter durch Synonyme ersetzen
- Einfügen/Löschen — zufällige Wörter
- Mischen — Wortfolge ändern
- Generierung — neue Texte mit LLM erstellen
Methoden für Audio
- Wiedergabegeschwindigkeitsmodifikation
- Tonhöhenverschiebung
- Hintergrundgeräusche hinzufügen
- Zeitverzerrung
Werkzeuge
- imgaug — Bildaugmentationsbibliothek (Python)
- Albumentations — schnelle Bildaugmentation
- nlpaug — Textaugmentation
- audiomentations — Audioaugmentation
- TensorFlow/PyTorch — eingebaute Transform-Schichten