Vad är Dataförstärkning
Artificiell expansion av träningsdata
Dataförstärkning
Dataförstärkning är en teknik för att artificiellt öka volymen av träningsdata genom att skapa modifierade kopior av befintlig data.
Varför använda förstärkning
- Öka datamängdens storlek — när det finns otillräcklig data för träning
- Förhindra överanpassning — modellen lär sig från olika variationer
- Förbättra robusthet — modellen generaliserar bättre på ny data
- Minska kostnader — billigare än att samla in verklig data
Metoder för Bilder
| Metod | Beskrivning | |-------|-------------| | Rotation | Rotation med godtycklig vinkel | | Spegling | Horisontell/vertikal spegling | | Skalning | Zooma in/ut | | Beskärning | Slumpmässig beskärning av bilddel | | Ljusstyrka/Kontrast | Färgkarakteristikjusteringar | | Brus | Lägga till Gaussiskt brus | | Cutout/Mixup | Moderna tekniker |
Metoder för Text
- Tillbakaöversättning — översätta fram och tillbaka genom ett annat språk
- Synonymer — ersätta ord med synonymer
- Infogning/radering — slumpmässiga ord
- Blandning — ändra ordföljd
- Generering — skapa nya texter med LLM
Metoder för Ljud
- Uppspelningshastighetsändring
- Tonhöjdsförskjutning
- Lägga till bakgrundsljud
- Tidsförvrängning
Verktyg
- imgaug — bildförstärkningsbibliotek (Python)
- Albumentations — snabb bildförstärkning
- nlpaug — textförstärkning
- audiomentations — ljudförstärkning
- TensorFlow/PyTorch — inbyggda transformationslager