Was ist RAG
Retrieval-Augmented Generation — LLM mit externen Daten erweitern
RAG (Retrieval-Augmented Generation) — eine Architektur, die LLM-Antworten mit relevanten Informationen aus einer externen Wissensbasis erweitert.
Wie RAG funktioniert
- Anfrage — Benutzer stellt eine Frage
- Abruf — System findet relevante Dokumente in der Wissensbasis
- Kontext — gefundene Dokumente werden zum Prompt hinzugefügt
- Generierung — LLM generiert Antwort unter Berücksichtigung des Kontexts
RAG-Systemkomponenten
- Embedding-Modell — wandelt Text in Vektoren um
- Vektor-DB — speichert und durchsucht Embeddings
- Chunking — Aufteilung von Dokumenten in Fragmente
- Ranking — Sortierung der Ergebnisse nach Relevanz
- LLM — generiert finale Antwort
Fortgeschrittene Techniken
- Hybride Suche — Kombination von Vektor- und Schlüsselwortsuche
- Re-Ranking — Neuordnung der Ergebnisse
- Query-Erweiterung — Erweiterung der Anfrage mit Synonymen
- Multi-Hop RAG — Suchkette für komplexe Fragen
Geschäftsanwendungen
- Unternehmensassistenten — Antworten aus interner Dokumentation
- Technischer Support — Wissensbasis für Support-Bots
- Rechtssysteme — Suche in Gesetzen und Präzedenzfällen
- Gesundheitswesen — Informationen zu Symptomen und Protokollen