Hva er Dataforsterkning
Kunstig utvidelse av treningsdata
Dataforsterkning
Dataforsterkning er en teknikk for kunstig å øke volumet av treningsdata ved å lage modifiserte kopier av eksisterende data.
Hvorfor bruke forsterkning
- Øke datasettstørrelse — når det er utilstrekkelig data for trening
- Forhindre overtilpasning — modellen lærer fra diverse variasjoner
- Forbedre robusthet — modellen generaliserer bedre på nye data
- Redusere kostnader — billigere enn å samle inn ekte data
Metoder for Bilder
| Metode | Beskrivelse | |--------|-------------| | Rotasjon | Rotasjon med vilkårlig vinkel | | Speiling | Horisontal/vertikal speiling | | Skalering | Zoome inn/ut | | Beskjæring | Tilfeldig beskjæring av bildedel | | Lysstyrke/Kontrast | Fargekarakteristikkjusteringer | | Støy | Legge til Gaussisk støy | | Cutout/Mixup | Moderne teknikker |
Metoder for Tekst
- Tilbakeoversettelse — oversette frem og tilbake gjennom et annet språk
- Synonymer — erstatte ord med synonymer
- Innsetting/sletting — tilfeldige ord
- Blanding — endre ordrekkefølge
- Generering — lage nye tekster med LLM
Metoder for Lyd
- Avspillingshastighetsendring
- Tonehøydeforskyvning
- Legge til bakgrunnsstøy
- Tidsforvrengning
Verktøy
- imgaug — bildeforsterkningsbibliotek (Python)
- Albumentations — rask bildeforsterkning
- nlpaug — tekstforsterkning
- audiomentations — lydforsterkning
- TensorFlow/PyTorch — innebygde transformasjonslag