Tinh chỉnh là gì
Đào tạo bổ sung cho mô hình trên dữ liệu cụ thể
Tinh chỉnh — quá trình đào tạo bổ sung mô hình đã được huấn luyện trước trên tập dữ liệu cụ thể để thích ứng với nhiệm vụ hoặc lĩnh vực cụ thể.
Phương pháp Tinh chỉnh
- Tinh chỉnh đầy đủ — cập nhật tất cả trọng số mô hình
- LoRA — Low-Rank Adaptation, chỉ huấn luyện adapters
- QLoRA — LoRA lượng tử hóa để tiết kiệm bộ nhớ
- Prompt tuning — chỉ huấn luyện soft prompts
- Adapter tuning — thêm các module có thể huấn luyện nhỏ
Khi nào sử dụng
- Lĩnh vực cụ thể — văn bản pháp lý, y tế
- Phong cách doanh nghiệp — giọng điệu, thuật ngữ công ty
- Nhiệm vụ hẹp — phân loại, trích xuất thực thể
- Định dạng — định dạng phản hồi cụ thể
Tham số chính
- Tốc độ học — tốc độ huấn luyện (thường thấp: 1e-5 — 5e-5)
- Epochs — số epochs (thường 1-5)
- Batch size — kích thước batch
- Warmup — tăng dần tốc độ học
Ứng dụng kinh doanh
- Chatbot doanh nghiệp — huấn luyện trên tài liệu nội bộ
- Phân loại ticket — định tuyến yêu cầu tự động
- Tạo nội dung — văn bản theo phong cách thương hiệu
- Trợ lý code — huấn luyện trên codebase công ty