Hva er Tale-til-tekst
Konvertering av tale til tekst
Tale-til-tekst (Speech-to-Text, STT) er en teknologi for automatisk konvertering av tale til skrevet tekst ved hjelp av maskinlæringsalgoritmer.
Hvordan det fungerer
- Akustisk modell — analyserer lydbølger
- Språkmodell — forutsier sannsynlige ord
- Dekoder — velger den mest sannsynlige sekvensen
Teknologier
- Whisper (OpenAI) — flerspråklig modell
- Google Speech-to-Text — skytjeneste
- Azure Speech Services — fra Microsoft
- Vosk — åpen kildekode offline-løsning
Forretningsanvendelser
- Transkribering av samtaler og møter
- Stemmeassistenter og IVR-systemer
- Undertekster for videoinnhold
- Stemmeinntasting i apper
- Analyse av kundesamtaler