728x90
반응형

문서검색 3

E5(Embedding from Explanation, Extreme, Efficient, Effective, Embedding)

개요E5는 다양한 자연어 처리 태스크에서 고품질의 텍스트 임베딩을 제공하기 위해 설계된 범용 임베딩 모델 시리즈입니다. 검색(Retrieval), 분류(Classification), RAG(Retrieval-Augmented Generation) 등에 특화된 모델로, 텍스트 간 의미 유사도를 고정된 벡터 공간에서 계산할 수 있게 해 줍니다. E5는 명시적 프롬프트와 다태스크 학습 방식으로 높은 정확도와 확장성을 확보합니다.1. 개념 및 정의 항목 설명 정의프롬프트 기반 다태스크 학습을 통해 다양한 태스크에 적합한 텍스트 임베딩 생성 모델목적의미 기반 검색 및 NLP 응용을 위한 강력한 벡터 표현 제공필요성sparse 방법(BM25) 대비 의미 중심 검색 정확도 개선E5는 HuggingFace Trans..

Topic 2026.01.31

Contriever

개요Contriever는 Meta AI에서 개발한 비지도 학습 기반의 문서 임베딩 및 검색 모델로, 사전 학습(pretraining)만으로도 다양한 오픈 도메인 질문응답(Open-domain QA) 및 문서 검색(Doc Retrieval) 태스크에서 높은 성능을 보입니다. 기존의 Supervised Dense Retriever보다도 우수한 성능을 보이며, 별도의 라벨링 데이터 없이도 강력한 검색 품질을 제공합니다.1. 개념 및 정의 항목 설명 비고 정의Contriever는 contrastive learning 기반의 비지도 학습 문서 검색 모델Dense Passage Retriever 계열목적오픈 도메인 검색에서 고품질의 문서 검색을 비지도 학습만으로 구현Supervised 대비 비용 절감필요성라벨링..

Topic 2026.01.08

정적 인덱싱(Static Indexing) vs 동적 인덱싱(Dynamic Indexing)

개요데이터베이스와 검색 시스템에서 인덱스는 성능을 결정짓는 핵심 요소입니다. 특히 정적 인덱싱(Static Indexing)과 동적 인덱싱(Dynamic Indexing)은 데이터의 갱신 주기와 활용 목적에 따라 다른 전략을 취해야 합니다. 이 글에서는 두 방식의 개념, 차이점, 사용 예시, 장단점, 실무 전략을 체계적으로 비교 분석합니다.1. 개념 및 정의 구분 정의 적용 영역 정적 인덱싱데이터를 수집한 후 일괄적으로 인덱스를 생성배치 처리 기반, 문서 검색 시스템 등동적 인덱싱데이터가 추가·변경될 때마다 실시간으로 인덱스를 갱신실시간 검색, 온라인 트랜잭션 처리 (OLTP)정적 인덱싱은 초기 구축 비용이 높지만 안정적이며, 동적 인덱싱은 유연하고 즉시성 있는 반응이 장점입니다.2. 작동 방식단계정..

Topic 2025.04.20
728x90
반응형