Related to: Fundamentals
개요
Data Augmentation은 약간의 수정이 가해진 복제본을 추가하여 데이터의 수를 늘리는 기법으로, 모델의 과적합(Overfitting)을 방지하는 정규화 방법 중 하나입니다.
핵심 개념
주요 기법
- Geometric Transform: 회전, 뒤집기, 자르기, 이동 등
- Color Jitter: 밝기, 대비, 채도, 색조 변환
- Noise Addition: 가우시안 노이즈 추가
- Mixup: 두 이미지와 레이블을 혼합
- CutOut / CutMix: 이미지의 일부를 자르거나 다른 이미지와 교체
효과
- 학습 데이터가 부족할 때 효과적으로 데이터를 확보
- 다양한 변형에 대한 모델의 강건성(Robustness) 향상
- Dropout, Batch Normalization과 함께 사용하면 더욱 효과적
관련 개념
- Regularization - Dropout — 또 다른 대표적인 정규화 기법
- Regularization - Batch normalization — 배치 정규화를 통한 정규화
- Regularization - Early Stopping — 조기 종료를 통한 과적합 방지
- Regularization - Label Smoothing — 레이블 스무딩을 통한 정규화
- BirdNET — 도메인별 데이터 증강이 핵심인 실제 적용 사례