ما هو التضمينات
تمثيلات متجهة للبيانات للتعلم الآلي
التضمينات — متجهات رقمية تمثل الكائنات (الكلمات والصور والمستخدمين) في فضاء متعدد الأبعاد بحيث تكون الكائنات المتشابهة قريبة من بعضها.
أنواع التضمينات
- النص — Word2Vec وGloVe وFastText وتضمينات BERT
- الجمل — Sentence-BERT وUniversal Sentence Encoder
- الصور — ميزات ResNet وتضمينات CLIP
- المستخدم/المنتج — لأنظمة التوصية
- الرسوم البيانية — Node2Vec وGraphSAGE لبيانات الشبكة
الخصائص الرئيسية
- التشابه الدلالي — الكائنات المتشابهة قريبة في الفضاء
- حساب المتجهات — ملك - رجل + امرأة = ملكة
- الأبعاد — عادة 128-1536 بعد
- تشابه جيب التمام — مقياس لمقارنة المتجهات
التطبيقات التجارية
- البحث الدلالي — البحث بالمعنى وليس بالكلمات المفتاحية
- التوصيات — "منتجات مشابهة" و"قد يعجبك"
- روبوتات الدردشة — أنظمة RAG للإجابات من قاعدة المعرفة
- التجميع — تجميع المحتوى التلقائي
- كشف التكرار — إيجاد المستندات والصور المتشابهة