Vad är OCR
Optisk teckenigenkänning
OCR (Optisk teckenigenkänning) är en teknik för att automatiskt känna igen text i bilder, skannade dokument och fotografier och konvertera den till redigerbart digitalt format.
Hur OCR fungerar
- Bildförbehandling — kvalitetsförbättring, brusreducering, justering
- Segmentering — uppdelning i rader, ord och tecken
- Igenkänning — matchning av tecken mot malldatabas eller neuralt nätverk
- Efterbehandling — stavningskontroll och kontextverifiering
OCR-tillämpningar
- Digitalisering av pappersdokument och arkiv
- Automatisering av datainmatning från fakturor
- Igenkänning av pass och ID-handlingar
- Översättning av text från foton
- Sökning i skannade dokument
Modern teknik
- Tesseract — öppen källkodsmotor från Google
- ABBYY FineReader — kommersiell lösning
- Google Cloud Vision — molntjänst
- AI/ML-modeller — neurala nätverk för komplexa fall
Fördelar med OCR-automatisering
- Minskning av manuell datainmatning med 90%
- Minimering av mänskliga fel
- Acceleration av dokumentbearbetning
- Integration med ERP, CRM och dokumenthanteringssystem