ما هو ضغط النماذج
تقليل حجم نماذج التعلم الآلي
ضغط النماذج هو مجموعة من التقنيات لتقليل حجم ومتطلبات الحوسبة لنماذج التعلم الآلي دون فقدان كبير في الجودة.
طرق الضغط
- التكميم — تقليل دقة الأوزان (FP32 → INT8)
- التقليم — إزالة الاتصالات غير المهمة
- تقطير المعرفة — تدريب نموذج صغير على نموذج كبير
- التحليل منخفض الرتبة — تحليل مصفوفات الأوزان
الفوائد
- تقليل الحجم 4-10 مرات
- تسريع الاستدلال 2-5 مرات
- تقليل استهلاك الطاقة
- النشر على أجهزة الحافة
- توفير تكاليف البنية التحتية
التطبيقات
- التطبيقات المحمولة
- إنترنت الأشياء والأنظمة المدمجة
- تطبيقات ML في المتصفح
- الأنظمة الفورية
- الأجهزة المستقلة