728x90
반응형

Reranking 2

Min-PPL Decoding(Minimum Perplexity Decoding)

개요Min-PPL Decoding은 대규모 언어모델(LLM)의 출력 문장 중 퍼플렉서티(Perplexity)가 가장 낮은 후보를 선택하여 생성 품질을 향상시키는 디코딩 전략이다. 퍼플렉서티는 모델이 특정 시퀀스를 얼마나 자연스럽게 예측하는지를 나타내는 지표로, 값이 낮을수록 모델의 확률 분포와 일치하는 문장임을 의미한다.기존 Greedy, Beam Search, Top-k, Top-p 방식은 확률 기반 토큰 선택에 초점을 두지만, Min-PPL은 완성된 시퀀스의 전반적 언어 적합도(Global Fluency)를 기준으로 후보를 평가한다는 점에서 차별화된다.1. 개념 및 정의Min-PPL Decoding은 여러 후보 시퀀스를 생성한 후, 각 시퀀스의 평균 음의 로그 확률(또는 퍼플렉서티)을 계산하여 가장 ..

Topic 2026.02.23

Cross-Encoder Rerank

개요Cross-Encoder Rerank는 대규모 검색 시스템에서 초기 검색 결과(candidate set)에 대해 문서와 쿼리를 함께 입력으로 사용하여, 정밀한 의미 기반 점수를 계산하고 상위 결과를 재정렬하는 방식의 랭킹 기법이다. Dense Retrieval의 효율성과 Cross-Encoder의 정밀도를 결합한 Hybrid Search 시스템에서 주로 사용된다.1. 개념 및 정의 항목 설명 정의문서-쿼리 쌍을 입력으로 받아 의미 유사도를 계산하는 딥러닝 기반 랭커 모델목적초기 검색 결과 중 의미적으로 정확한 상위 결과를 선별필요성Dense Vector 유사도 기반 검색의 정밀도 한계를 극복Semantic Search, RAG, QA 시스템 등에서 핵심 역할을 수행한다.2. 특징특징설명비교쿼리-문서..

Topic 2026.01.15
728x90
반응형