Nedir Model Sıkıştırma
ML model boyutunu azaltma
Model Sıkıştırma önemli kalite kaybı olmadan ML modellerinin boyutunu ve hesaplama gereksinimlerini azaltmak için teknikler setidir.
Sıkıştırma Yöntemleri
- Kuantizasyon — ağırlık hassasiyetini azaltma (FP32 → INT8)
- Budama — önemsiz bağlantıları kaldırma
- Bilgi damıtma — küçük modeli büyük model üzerinde eğitme
- Düşük ranklı faktorizasyon — ağırlık matrislerini ayrıştırma
Faydalar
- Boyutta 4-10 kat azalma
- Çıkarımda 2-5 kat hızlanma
- Azaltılmış güç tüketimi
- Edge cihaz dağıtımı
- Altyapı maliyet tasarrufu
Uygulamalar
- Mobil uygulamalar
- IoT ve gömülü sistemler
- Tarayıcı tabanlı ML uygulamaları
- Gerçek zamanlı sistemler
- Otonom cihazlar