RAG 이란
검색 증강 생성 — 외부 데이터로 LLM 강화
RAG (검색 증강 생성) — 외부 지식 베이스의 관련 정보로 LLM 응답을 강화하는 아키텍처.
RAG 작동 방식
- 쿼리 — 사용자가 질문
- 검색 — 시스템이 지식 베이스에서 관련 문서 검색
- 컨텍스트 — 찾은 문서를 프롬프트에 추가
- 생성 — LLM이 컨텍스트를 고려하여 응답 생성
RAG 시스템 구성요소
- 임베딩 모델 — 텍스트를 벡터로 변환
- 벡터 DB — 임베딩 저장 및 검색
- 청킹 — 문서를 조각으로 분할
- 랭킹 — 관련성별 결과 정렬
- LLM — 최종 응답 생성
고급 기술
- 하이브리드 검색 — 벡터와 키워드 검색 조합
- 리랭킹 — 결과 재정렬
- 쿼리 확장 — 동의어로 쿼리 확장
- 멀티홉 RAG — 복잡한 질문을 위한 검색 체인
비즈니스 적용
- 기업 어시스턴트 — 내부 문서에서 답변
- 기술 지원 — 지원 봇용 지식 베이스
- 법률 시스템 — 법률과 판례 검색
- 의료 — 증상과 프로토콜 정보