Vad är RAG
Retrieval-Augmented Generation — förstärka LLM med extern data
RAG (Retrieval-Augmented Generation) — en arkitektur som förstärker LLM-svar med relevant information från en extern kunskapsbas.
Hur RAG fungerar
- Fråga — användaren ställer en fråga
- Hämtning — systemet hittar relevanta dokument i kunskapsbasen
- Kontext — hittade dokument läggs till prompten
- Generering — LLM genererar svar med hänsyn till kontexten
RAG-systemkomponenter
- Embedding-modell — konverterar text till vektorer
- Vektor-DB — lagrar och söker embeddings
- Chunking — dela upp dokument i fragment
- Rankning — sortera resultat efter relevans
- LLM — genererar slutligt svar
Avancerade tekniker
- Hybrid sökning — kombination av vektor- och nyckelordssökning
- Re-rankning — omordna resultat
- Frågeexpansion — utöka frågan med synonymer
- Multi-hop RAG — sökkedja för komplexa frågor
Affärstillämpningar
- Företagsassistenter — svar från intern dokumentation
- Teknisk support — kunskapsbas för supportbots
- Juridiska system — sökning i lagar och prejudikat
- Hälsovård — information om symtom och protokoll