데이터 증강 이란
훈련 데이터의 인위적 확장
데이터 증강
데이터 증강은 기존 데이터의 수정된 복사본을 생성하여 훈련 데이터의 양을 인위적으로 늘리는 기술입니다.
증강을 사용하는 이유
- 데이터셋 크기 증가 — 훈련에 충분한 데이터가 없을 때
- 과적합 방지 — 모델이 다양한 변형에서 학습
- 견고성 향상 — 새로운 데이터에서 일반화 성능 향상
- 비용 절감 — 실제 데이터 수집보다 저렴
이미지 방법
| 방법 | 설명 | |------|------| | 회전 | 임의 각도로 회전 | | 뒤집기 | 수평/수직 미러링 | | 스케일링 | 확대/축소 | | 크롭 | 이미지 일부 랜덤 크롭 | | 밝기/대비 | 색상 특성 조정 | | 노이즈 | 가우시안 노이즈 추가 | | Cutout/Mixup | 현대적 기술 |
텍스트 방법
- 역번역 — 다른 언어를 통해 왕복 번역
- 동의어 — 단어를 동의어로 대체
- 삽입/삭제 — 랜덤 단어
- 섞기 — 어순 변경
- 생성 — LLM으로 새 텍스트 생성
오디오 방법
- 재생 속도 수정
- 피치 시프팅
- 배경 소음 추가
- 타임 워핑
도구
- imgaug — 이미지 증강 라이브러리 (Python)
- Albumentations — 빠른 이미지 증강
- nlpaug — 텍스트 증강
- audiomentations — 오디오 증강
- TensorFlow/PyTorch — 내장 변환 레이어