Topic

RAG-Fusion(Retrieval-Augmented Generation Fusion)

JackerLab 2026. 2. 1. 00:16
728x90
반응형

개요

RAG-Fusion은 검색 기반 생성(RAG) 시스템의 성능을 향상시키기 위한 전략 중 하나로, 다양한 질의(Query Variants)를 통해 수집된 검색 결과를 융합(Fusion)하여 보다 정확하고 풍부한 문맥 정보를 생성 모델에 제공하는 방식입니다. 복수의 질의를 활용함으로써 검색 커버리지를 확장하고, 다양한 관점의 정보를 반영할 수 있어 정답률과 응답 다양성이 크게 향상됩니다.


1. 개념 및 정의

항목 설명
정의 여러 형태의 질의에서 얻은 문서들을 결합하여 RAG 시스템의 정답률을 높이는 검색 강화 기법
목적 문맥 검색의 다양성과 정보 포괄성 증대
필요성 단일 질의로는 얻기 어려운 다양한 관점의 정보 확보

Fusion은 단순한 병합이 아닌 중복 제거, 중요도 기반 재정렬 등의 전처리도 포함함


2. 특징

특징 설명 비교
다중 질의 기반 본질적으로 query rewriting 또는 variation 사용 단일 검색 대비 recall 향상
문서 융합 다양한 문서 소스를 통합 평균 또는 학습 기반 가중치 적용 가능
전처리 + 재정렬 문서 유사도, diversity 기반 재정렬 naive concat 대비 효율적

RAG-Fusion은 특히 open-domain QA 및 복잡 질의 응답에서 효과적


3. 구성 요소

구성 요소 설명 예시
Query Generator 다양한 질의 표현 생성기 LLM 기반 또는 패턴 기반 변형
Retriever 각 질의에 대해 문서 검색 BM25, Dense Retriever 등
Fusion Module 검색 결과 병합 및 정렬 RRF, MMR 등 알고리즘 활용

Fusion 방식에는 단순 union 외에 score normalization, rank aggregation 기법이 포함될 수 있음


4. 기술 요소

기술 설명 사용 예
RRF(Rank Fusion) 여러 검색 결과를 순위 기반으로 통합 RAG-Fusion의 핵심 기법 중 하나
Query Rewriting 원질의에서 다양한 표현 생성 paraphrase, synonym 대체 등
Diversity-aware Selection 중복 제거 및 정보 다양성 유지 MMR(Maximal Marginal Relevance) 등 활용

LLM 기반 query-expansion과 결합 시 성능 향상 폭이 큼


5. 장점 및 이점

장점 설명 효과
정답률 향상 다양한 문맥 포함으로 응답 정확도 증가 factual QA 개선 효과 큼
정보 다양성 확보 하나의 관점에 치우친 응답 방지 정형/비정형 정보 모두 활용 가능
LLM 호환성 강화 더 풍부한 컨텍스트 입력 제공 hallucination 방지 기여

복잡한 질의일수록 RAG-Fusion의 효과가 뚜렷함


6. 주요 활용 사례 및 고려사항

사례 설명 참고사항
기업용 Q&A 업무 문서 기반 다양한 질의 응답 표준어/줄임말 혼합 질의 처리 가능
학술정보 검색 논문 기반 질문 응답 시스템 복수 키워드 기반 정보 탐색 강화
멀티턴 대화형 RAG 사용자의 재질문에 다양한 관점 제공 이전 문맥과 통합된 문서 융합 필요

질의 다양성이 낮거나 단순 질의일 경우 오히려 noise 가능성 존재


7. 결론

RAG-Fusion은 단일 질의 기반 검색의 한계를 극복하고, 보다 풍부하고 정확한 문서 기반 응답 생성을 가능하게 하는 RAG 시스템의 강화 전략입니다. 특히 고도화된 정보 검색, 멀티도메인 QA, 기업용 검색형 챗봇 등에서 유용하며, 다양한 검색 및 재정렬 기법과 융합하여 지속적으로 발전 중입니다.

728x90
반응형