
개요ColBERTv2는 효율성과 표현력을 동시에 달성하는 최신 신경 정보 검색(Neural Information Retrieval, Neural IR) 모델입니다. 기존 dense retrieval과는 달리, 쿼리와 문서를 토큰 수준에서 분리하여 임베딩한 후, 유사도 스코어를 Late Interaction 방식으로 계산함으로써 검색 성능과 효율의 균형을 이루는 구조를 갖습니다.ColBERTv2는 대규모 사전 훈련 및 양방향 LLM 임베딩 구조를 기반으로 sparse + dense hybrid 검색과의 융합도 용이하여 최신 LLM-RAG 기반 시스템에서 핵심적인 Retriever 구성 요소로 주목받고 있습니다.1. 개념 및 정의 항목 설명 정의ColBERTv2는 세분화된 토큰 임베딩과 Late Inter..