ما هو تحويل الكلام إلى نص
تحويل الصوت إلى نص
تحويل الكلام إلى نص (Speech-to-Text، STT) هي تقنية لتحويل الكلام المنطوق تلقائياً إلى نص مكتوب باستخدام خوارزميات التعلم الآلي.
كيف يعمل
- النموذج الصوتي — يحلل الموجات الصوتية
- النموذج اللغوي — يتنبأ بالكلمات المحتملة
- المفكك — يختار التسلسل الأكثر احتمالاً
التقنيات
- Whisper (OpenAI) — نموذج متعدد اللغات
- Google Speech-to-Text — خدمة سحابية
- Azure Speech Services — من مايكروسوفت
- Vosk — حل مفتوح المصدر يعمل دون اتصال
التطبيقات التجارية
- نسخ المكالمات والاجتماعات
- المساعدات الصوتية وأنظمة IVR
- ترجمات للمحتوى المرئي
- الإدخال الصوتي في التطبيقات
- تحليل محادثات العملاء