Деректерді ұлғайту дегеніміз не
Оқыту деректерін жасанды кеңейту
Деректерді Ұлғайту
Деректерді ұлғайту — бар деректердің өзгертілген көшірмелерін жасау арқылы оқыту деректерінің көлемін жасанды түрде арттыру техникасы.
Неге ұлғайту қажет
- Деректер жинағының көлемін арттыру — оқытуға жеткілікті деректер болмаған кезде
- Артық оқытудың алдын алу — модель әртүрлі вариациялардан үйренеді
- Төзімділікті жақсарту — модель жаңа деректерде жақсырақ жалпылайды
- Шығындарды азайту — нақты деректерді жинаудан арзанырақ
Кескіндер үшін әдістер
| Әдіс | Сипаттама | |------|-----------| | Айналдыру | Еркін бұрышпен айналдыру | | Аудару | Көлденең/тік айналау | | Масштабтау | Үлкейту/кішірейту | | Қию | Кескін бөлігін кездейсоқ қиып алу | | Жарықтық/Контраст | Түс сипаттамаларын реттеу | | Шу | Гаусс шуын қосу | | Cutout/Mixup | Заманауи техникалар |
Мәтін үшін әдістер
- Кері аударма — басқа тіл арқылы алға-артқа аудару
- Синонимдер — сөздерді синонимдерге ауыстыру
- Қосу/жою — кездейсоқ сөздер
- Араластыру — сөз тәртібін өзгерту
- Генерация — LLM көмегімен жаңа мәтіндер жасау
Аудио үшін әдістер
- Ойнату жылдамдығын өзгерту
- Дыбыс биіктігін ауыстыру
- Фон шуын қосу
- Уақытты бұрау
Құралдар
- imgaug — кескін ұлғайту кітапханасы (Python)
- Albumentations — жылдам кескін ұлғайту
- nlpaug — мәтін ұлғайту
- audiomentations — аудио ұлғайту
- TensorFlow/PyTorch — кіріктірілген түрлендіру қабаттары