Mis on Kõne tekstiks
Kõne teisendamine tekstiks
Kõne tekstiks (Speech-to-Text, STT) on tehnoloogia kõne automaatseks teisendamiseks kirjalikuks tekstiks masinõppe algoritmide abil.
Kuidas see töötab
- Akustiline mudel — analüüsib helilaineid
- Keele mudel — ennustab tõenäolisi sõnu
- Dekoodri — valib kõige tõenäolisema järjestuse
Tehnoloogiad
- Whisper (OpenAI) — mitmekeelne mudel
- Google Speech-to-Text — pilveteenus
- Azure Speech Services — Microsoftilt
- Vosk — avatud lähtekoodiga võrguühenduseta lahendus
Ärirakendused
- Kõnede ja koosolekute transkribeerimine
- Hääleassistendid ja IVR-süsteemid
- Subtiitrid videosisule
- Häälsisestus rakendustes
- Kliendikõneluste analüüs