Tăng cường dữ liệu là gì
Mở rộng nhân tạo dữ liệu huấn luyện
Tăng cường Dữ liệu
Tăng cường dữ liệu là kỹ thuật tăng nhân tạo khối lượng dữ liệu huấn luyện bằng cách tạo các bản sao đã sửa đổi của dữ liệu hiện có.
Tại sao sử dụng tăng cường
- Tăng kích thước dataset — khi không đủ dữ liệu để huấn luyện
- Ngăn overfitting — mô hình học từ các biến thể đa dạng
- Cải thiện độ bền — mô hình tổng quát hóa tốt hơn trên dữ liệu mới
- Giảm chi phí — rẻ hơn thu thập dữ liệu thực
Phương pháp cho Hình ảnh
| Phương pháp | Mô tả | |-------------|-------| | Xoay | Xoay theo góc tùy ý | | Lật | Phản chiếu ngang/dọc | | Thu phóng | Phóng to/thu nhỏ | | Cắt | Cắt ngẫu nhiên phần hình ảnh | | Độ sáng/Độ tương phản | Điều chỉnh đặc tính màu | | Nhiễu | Thêm nhiễu Gaussian | | Cutout/Mixup | Kỹ thuật hiện đại |
Phương pháp cho Văn bản
- Back-translation — dịch qua lại qua ngôn ngữ khác
- Từ đồng nghĩa — thay thế từ bằng từ đồng nghĩa
- Chèn/xóa — từ ngẫu nhiên
- Xáo trộn — thay đổi thứ tự từ
- Tạo sinh — tạo văn bản mới bằng LLM
Phương pháp cho Âm thanh
- Sửa đổi tốc độ phát
- Pitch shifting
- Thêm tiếng ồn nền
- Time warping
Công cụ
- imgaug — thư viện tăng cường hình ảnh (Python)
- Albumentations — tăng cường hình ảnh nhanh
- nlpaug — tăng cường văn bản
- audiomentations — tăng cường âm thanh
- TensorFlow/PyTorch — các lớp transform tích hợp