Hva er RAG
Retrieval-Augmented Generation — forsterke LLM med ekstern data
RAG (Retrieval-Augmented Generation) — en arkitektur som forsterker LLM-svar med relevant informasjon fra en ekstern kunnskapsbase.
Hvordan RAG fungerer
- Spørring — brukeren stiller et spørsmål
- Henting — systemet finner relevante dokumenter i kunnskapsbasen
- Kontekst — funne dokumenter legges til prompten
- Generering — LLM genererer svar med hensyn til konteksten
RAG-systemkomponenter
- Embedding-modell — konverterer tekst til vektorer
- Vektor-DB — lagrer og søker embeddings
- Chunking — dele dokumenter i fragmenter
- Rangering — sortere resultater etter relevans
- LLM — genererer endelig svar
Avanserte teknikker
- Hybridsøk — kombinasjon av vektor- og nøkkelordsøk
- Re-rangering — omordne resultater
- Spørringsutvidelse — utvide spørringen med synonymer
- Multi-hop RAG — søkekjede for komplekse spørsmål
Forretningsanvendelser
- Bedriftsassistenter — svar fra intern dokumentasjon
- Teknisk støtte — kunnskapsbase for støtteboter
- Juridiske systemer — søk i lover og presedens
- Helsevesen — informasjon om symptomer og protokoller