Topic

Retrieval-Augmented Prompting (RAP)

JackerLab 2025. 4. 7. 08:33
728x90
반응형

개요

Retrieval-Augmented Prompting(RAP)은 대규모 언어모델(LLM)의 응답 생성 능력을 향상시키기 위해, 모델 외부에서 정보를 검색(retrieve)한 후 해당 지식을 프롬프트에 삽입하여 모델이 활용하도록 만드는 전략입니다. 이는 대규모 언어모델이 가지고 있지 않은 최신 정보, 사실 기반 지식, 도메인 문서를 활용할 수 있게 하여 정확도, 최신성, 신뢰도 모두를 강화합니다. 대표적으로 RAG(Retrieval-Augmented Generation), ChatGPT+Bing, LangChain 기반 검색 에이전트 등에 활용됩니다.


1. 개념 및 정의

Retrieval-Augmented Prompting은 크게 다음 3단계로 구성됩니다:

  1. Query 생성: 사용자의 질문 또는 요청을 기반으로 검색 쿼리 구성
  2. Retrieval (검색): 벡터DB, 검색 API, 문서 저장소 등에서 관련 정보 검색
  3. Prompt 구성: 검색된 정보를 프롬프트에 삽입하여 LLM이 응답 생성
사용자 입력: '토끼는 야행성인가요?'
검색 결과: '토끼는 주로 새벽과 해질녘에 활동하는 습성이 있다.'
프롬프트:
[참고 문서]: 토끼는 주로 새벽과 해질녘에 활동한다.
[질문]: 토끼는 야행성인가요?
[답변]:

2. 특징

항목 설명 비고
외부 지식 통합 사전학습된 모델 외의 정보 반영 모델이 몰라도 실시간 활용 가능
프롬프트 기반 통합 파인튜닝 없이도 지식 확장 가능 Lightweight 접근 방식
문서 수준 활용 긴 텍스트를 chunk 단위로 검색 가능 Contextual QA에 효과적

RAP는 ‘모델이 알고 있는 것’ 이상으로 확장하는 방법입니다.


3. RAP vs 일반 프롬프트 vs RAG

항목 일반 Prompt RAP RAG
정보 출처 모델 내 학습 데이터 외부 검색 + 프롬프트 삽입 외부 검색 + 모델 통합 학습
구조 단일 입력 검색 + 보강된 프롬프트 검색 + 생성 통합 아키텍처
유지관리 정적 모델 의존 외부 지식만 업데이트 가능 사전 구축 시스템 필요

RAP는 RAG보다 단순하면서도 실용적인 구현이 가능한 장점이 있습니다.


4. 구성 요소

구성 요소 설명 예시 도구
Retriever 사용자 쿼리와 유사한 문서 검색 FAISS, Weaviate, BM25, Bing API
Chunking & Embedding 문서를 조각내고 벡터화 SentenceTransformers, OpenAI Embedding
Prompt Composer 검색 결과를 프롬프트로 정제 삽입 LangChain, PromptTemplate
LLM 응답 생성 최종 프롬프트를 기반으로 출력 생성 GPT-4, Claude, LLaMA 등

5. 주요 활용 사례

분야 활용 사례 기대 효과
기업 문서 QA 내부 정책, 매뉴얼 기반 질문 응답 정보의 최신성 확보
기술 문서 요약 검색된 기술 문서 기반 자동 요약 기술 보고서 자동화
의료 상담 의학 논문 기반 답변 생성 의학 정확도 향상
고객 상담 챗봇 상품 정보, 환불 정책 자동 반영 실시간 정보 응답 가능

6. 프롬프트 설계 팁

  • 출처 명시: “다음 문서를 기반으로 대답해줘…”
  • 문서 요약 추가: 검색된 문서가 길면 요약 후 삽입
  • 문맥 유지: 질문 → 문서 → 응답 흐름 유지
  • 출력 형식 지정: “표로 요약”, “한 문장으로 정리” 등

7. 결론

Retrieval-Augmented Prompting은 LLM의 한계를 뛰어넘는 가장 실용적인 방법 중 하나로, 모델 파인튜닝 없이 외부 정보를 활용해 정답률, 신뢰성, 최신성을 확보할 수 있는 전략입니다. 향후에는 멀티모달 검색, 사용자 맞춤 Knowledge Injection, RAG 에이전트 등과 결합되어 더욱 강력한 실시간 정보형 AI로 발전할 것입니다.

728x90
반응형

'Topic' 카테고리의 다른 글

ECN (Explicit Congestion Notification)  (1) 2025.04.07
Delay Tolerant Networking (DTN)  (0) 2025.04.07
ReAct (Reasoning and Acting)  (0) 2025.04.07
Tree-of-Thought (ToT) Prompting  (1) 2025.04.07
Instruction-based Prompting  (0) 2025.04.07