RAG là gì
Tạo sinh tăng cường truy xuất — tăng cường LLM với dữ liệu bên ngoài
RAG (Tạo sinh tăng cường truy xuất) — kiến trúc tăng cường phản hồi LLM với thông tin liên quan từ cơ sở tri thức bên ngoài.
RAG hoạt động như thế nào
- Truy vấn — người dùng đặt câu hỏi
- Truy xuất — hệ thống tìm tài liệu liên quan trong cơ sở tri thức
- Ngữ cảnh — tài liệu tìm được được thêm vào prompt
- Tạo sinh — LLM tạo phản hồi xem xét ngữ cảnh
Thành phần hệ thống RAG
- Mô hình embedding — chuyển văn bản thành vector
- Vector DB — lưu trữ và tìm kiếm embeddings
- Chunking — chia tài liệu thành các phần
- Xếp hạng — sắp xếp kết quả theo độ liên quan
- LLM — tạo phản hồi cuối cùng
Kỹ thuật nâng cao
- Tìm kiếm hybrid — kết hợp tìm kiếm vector và từ khóa
- Re-ranking — sắp xếp lại kết quả
- Mở rộng truy vấn — mở rộng truy vấn với từ đồng nghĩa
- Multi-hop RAG — chuỗi tìm kiếm cho câu hỏi phức tạp
Ứng dụng kinh doanh
- Trợ lý doanh nghiệp — câu trả lời từ tài liệu nội bộ
- Hỗ trợ kỹ thuật — cơ sở tri thức cho bot hỗ trợ
- Hệ thống pháp lý — tìm kiếm luật và tiền lệ
- Y tế — thông tin về triệu chứng và giao thức