Nedir Veri Artırma
Eğitim verisini yapay olarak genişletme
Veri Artırma
Veri artırma, mevcut verilerin değiştirilmiş kopyalarını oluşturarak eğitim verisi hacmini yapay olarak artırma tekniğidir.
Neden Artırma Kullanılır
- Veri seti boyutunu artırma — eğitim için yeterli veri olmadığında
- Aşırı öğrenmeyi önleme — model çeşitli varyasyonlardan öğrenir
- Sağlamlığı iyileştirme — model yeni verilerde daha iyi genelleştirir
- Maliyetleri azaltma — gerçek veri toplamaktan daha ucuz
Görüntüler için Yöntemler
| Yöntem | Açıklama | |--------|----------| | Döndürme | Rastgele açıyla döndürme | | Çevirme | Yatay/dikey yansıtma | | Ölçekleme | Yakınlaştırma/uzaklaştırma | | Kırpma | Görüntü bölümünü rastgele kırpma | | Parlaklık/Kontrast | Renk özelliği ayarlamaları | | Gürültü | Gauss gürültüsü ekleme | | Cutout/Mixup | Modern teknikler |
Metin için Yöntemler
- Geri çeviri — başka bir dil üzerinden ileri geri çeviri
- Eş anlamlılar — kelimeleri eş anlamlılarıyla değiştirme
- Ekleme/silme — rastgele kelimeler
- Karıştırma — kelime sırasını değiştirme
- Oluşturma — LLM ile yeni metinler oluşturma
Ses için Yöntemler
- Oynatma hızı değişikliği
- Perde kaydırma
- Arka plan gürültüsü ekleme
- Zaman bükme
Araçlar
- imgaug — görüntü artırma kütüphanesi (Python)
- Albumentations — hızlı görüntü artırma
- nlpaug — metin artırma
- audiomentations — ses artırma
- TensorFlow/PyTorch — yerleşik dönüşüm katmanları