728x90
반응형

RAG 최적화 2

Cross-Encoder Rerank

개요Cross-Encoder Rerank는 대규모 검색 시스템에서 초기 검색 결과(candidate set)에 대해 문서와 쿼리를 함께 입력으로 사용하여, 정밀한 의미 기반 점수를 계산하고 상위 결과를 재정렬하는 방식의 랭킹 기법이다. Dense Retrieval의 효율성과 Cross-Encoder의 정밀도를 결합한 Hybrid Search 시스템에서 주로 사용된다.1. 개념 및 정의 항목 설명 정의문서-쿼리 쌍을 입력으로 받아 의미 유사도를 계산하는 딥러닝 기반 랭커 모델목적초기 검색 결과 중 의미적으로 정확한 상위 결과를 선별필요성Dense Vector 유사도 기반 검색의 정밀도 한계를 극복Semantic Search, RAG, QA 시스템 등에서 핵심 역할을 수행한다.2. 특징특징설명비교쿼리-문서..

Topic 2026.01.15

DSPy

개요DSPy는 대규모 언어 모델(LLM)을 활용한 자연어 처리 파이프라인을 모듈화하고 최적화할 수 있도록 지원하는 선언형 Python 프레임워크입니다. LLM Prompt Engineering, 증강생성(Augmented Generation), Retriever 구성, Multi-step Reasoning 등을 학습 가능한 파이프라인으로 정의하고, 자동 튜닝을 통해 모델 성능을 개선하는 새로운 접근 방식을 제공합니다.이 글에서는 DSPy의 개념, 아키텍처, 주요 모듈, 기술적 강점 및 활용 사례를 중심으로 LLM 어플리케이션 개발의 구조화 전략을 소개합니다.1. 개념 및 정의 항목 설명 정의DSPy는 LLM 기반 파이프라인을 선언적으로 구성하고 튜닝 가능한 학습 객체로 다룰 수 있게 하는 파이썬 프레임..

Topic 2025.09.07
728x90
반응형