OCR 이란
광학 문자 인식
OCR(광학 문자 인식) 은 이미지, 스캔 문서, 사진의 텍스트를 자동으로 인식하여 편집 가능한 디지털 형식으로 변환하는 기술입니다.
OCR 작동 방식
- 이미지 전처리 — 품질 향상, 노이즈 제거, 정렬
- 세분화 — 줄, 단어, 문자로 분할
- 인식 — 템플릿 데이터베이스 또는 신경망과 문자 매칭
- 후처리 — 맞춤법 검사 및 컨텍스트 확인
OCR 응용 분야
- 종이 문서 및 아카이브 디지털화
- 송장에서 데이터 입력 자동화
- 여권 및 신분증 인식
- 사진에서 텍스트 번역
- 스캔 문서 검색
최신 기술
- Tesseract — Google 오픈소스 엔진
- ABBYY FineReader — 상용 솔루션
- Google Cloud Vision — 클라우드 서비스
- AI/ML 모델 — 복잡한 케이스를 위한 신경망
OCR 자동화의 이점
- 수동 데이터 입력 90% 감소
- 인적 오류 최소화
- 문서 처리 가속화
- ERP, CRM, 문서 관리 시스템과 통합