คืออะไร RAG
Retrieval-Augmented Generation — เสริม LLM ด้วยข้อมูลภายนอก
RAG (Retrieval-Augmented Generation) — สถาปัตยกรรมที่เสริมการตอบสนองของ LLM ด้วยข้อมูลที่เกี่ยวข้องจากฐานความรู้ภายนอก
RAG ทำงานอย่างไร
- Query — ผู้ใช้ถามคำถาม
- การค้นหา — ระบบค้นหาเอกสารที่เกี่ยวข้องในฐานความรู้
- บริบท — เอกสารที่พบถูกเพิ่มใน prompt
- การสร้าง — LLM สร้างการตอบสนองโดยพิจารณาบริบท
ส่วนประกอบของระบบ RAG
- โมเดล Embedding — แปลงข้อความเป็นเวกเตอร์
- Vector DB — จัดเก็บและค้นหา embeddings
- Chunking — แบ่งเอกสารเป็นส่วนๆ
- การจัดอันดับ — เรียงผลลัพธ์ตามความเกี่ยวข้อง
- LLM — สร้างการตอบสนองสุดท้าย
เทคนิคขั้นสูง
- การค้นหาแบบไฮบริด — รวมการค้นหาเวกเตอร์และคำสำคัญ
- Re-ranking — จัดอันดับผลลัพธ์ใหม่
- การขยาย query — ขยาย query ด้วยคำพ้องความหมาย
- Multi-hop RAG — ห่วงโซ่การค้นหาสำหรับคำถามซับซ้อน
การประยุกต์ใช้ทางธุรกิจ
- ผู้ช่วยองค์กร — คำตอบจากเอกสารภายใน
- สนับสนุนด้านเทคนิค — ฐานความรู้สำหรับบอทสนับสนุน
- ระบบกฎหมาย — ค้นหากฎหมายและบรรทัดฐาน
- สุขภาพ — ข้อมูลอาการและโปรโตคอล