728x90
반응형

pinecone 2

Vector Database

개요AI, 추천 시스템, 자연어 처리, 이미지 분석 등 고차원 데이터를 기반으로 하는 애플리케이션이 급증하면서, 기존 관계형 또는 문서형 데이터베이스로는 대응이 어려운 벡터(Vector) 기반 데이터 저장 및 검색 요구가 커지고 있습니다. 이러한 배경에서 등장한 **Vector Database(벡터 데이터베이스)**는 벡터 임베딩을 효율적으로 저장하고, 유사도 기반 검색을 빠르게 수행할 수 있는 특화된 데이터베이스입니다.1. 개념 및 정의Vector Database는 고차원 공간의 벡터 데이터를 저장하고, 입력 벡터와의 유사도를 기준으로 가장 가까운 결과를 검색하는 벡터 유사도 검색에 특화된 데이터베이스입니다.벡터: 이미지, 텍스트, 오디오 등에서 추출된 고차원 임베딩유사도 검색: Cosine Simil..

Topic 2025.06.18

HyDE RAG(Hypothetical Document Embeddings for Retrieval-Augmented Generation)

개요RAG(Retrieval-Augmented Generation)은 검색과 생성형 AI를 결합하여 신뢰도 높은 응답을 생성하는 핵심 프레임워크입니다. 하지만 기존 RAG는 쿼리와 문서의 의미적 거리만을 기준으로 유사 문서를 검색하기 때문에, 질문과 관련된 문서가 누락되거나, 부정확한 문서가 검색되는 한계가 존재합니다. 이를 개선하기 위해 등장한 기술이 HyDE RAG입니다. HyDE는 질문에 대한 가상의 정답(Hypothetical Answer)을 생성하고 이를 임베딩하여 검색하는 방식으로, RAG의 정확성과 정밀도를 크게 향상시킵니다.1. 개념 및 정의**HyDE(Hypothetical Document Embeddings)**는 사용자의 질문을 먼저 LLM을 통해 **가상의 정답 문장(Hypothet..

Topic 2025.05.28
728x90
반응형