Qu'est-ce que RAG
Génération augmentée par récupération — enrichir LLM avec des données externes
RAG (Génération Augmentée par Récupération) — architecture qui enrichit les réponses LLM avec des informations pertinentes d'une base de connaissances externe.
Comment fonctionne RAG
- Requête — l'utilisateur pose une question
- Récupération — le système trouve des documents pertinents dans la base de connaissances
- Contexte — les documents trouvés sont ajoutés au prompt
- Génération — le LLM génère une réponse en tenant compte du contexte
Composants du Système RAG
- Modèle d'embedding — convertit le texte en vecteurs
- BD vectorielle — stocke et recherche les embeddings
- Chunking — division des documents en fragments
- Classement — tri des résultats par pertinence
- LLM — génère la réponse finale
Techniques Avancées
- Recherche hybride — combinaison recherche vectorielle et mots-clés
- Re-classement — réorganisation des résultats
- Expansion de requête — enrichir la requête avec des synonymes
- RAG multi-sauts — chaîne de recherches pour questions complexes
Applications Business
- Assistants d'entreprise — réponses depuis documentation interne
- Support technique — base de connaissances pour bots support
- Systèmes juridiques — recherche lois et jurisprudence
- Santé — informations sur symptômes et protocoles