Mis on Andmete suurendamine
Treeningandmete kunstlik laiendamine
Andmete Suurendamine
Andmete suurendamine on tehnika treeningandmete mahu kunstlikuks suurendamiseks, luues olemasolevate andmete muudetud koopiaid.
Miks kasutada suurendamist
- Andmekogumi suuruse suurendamine — kui treenimiseks pole piisavalt andmeid
- Ülitreenimise vältimine — mudel õpib erinevatest variatsioonidest
- Vastupidavuse parandamine — mudel üldistab paremini uutel andmetel
- Kulude vähendamine — odavam kui pärisandmete kogumine
Meetodid Piltidele
| Meetod | Kirjeldus | |--------|-----------| | Pööramine | Pööramine suvalise nurga võrra | | Peegeldamine | Horisontaalne/vertikaalne peegeldamine | | Skaleerimine | Sisse/välja suumimine | | Kärpimine | Juhuslik pildi osa kärpimine | | Heledus/Kontrast | Värviomaduste kohandamine | | Müra | Gaussi müra lisamine | | Cutout/Mixup | Kaasaegsed tehnikad |
Meetodid Tekstile
- Tagasitõlge — tõlkimine edasi-tagasi teise keele kaudu
- Sünonüümid — sõnade asendamine sünonüümidega
- Sisestamine/kustutamine — juhuslikud sõnad
- Segamine — sõnajärjekorra muutmine
- Genereerimine — uute tekstide loomine LLM-iga
Meetodid Helile
- Taasesituse kiiruse muutmine
- Helikõrguse nihutamine
- Taustamüra lisamine
- Aja moonutamine
Tööriistad
- imgaug — pildi suurendamise teek (Python)
- Albumentations — kiire pildi suurendamine
- nlpaug — teksti suurendamine
- audiomentations — heli suurendamine
- TensorFlow/PyTorch — sisseehitatud teisenduslad