728x90
반응형

유사도검색 2

LSH(Locality-Sensitive Hashing)

개요Locality-Sensitive Hashing(LSH)은 고차원 벡터 공간에서 유사한 데이터 포인트를 빠르게 검색하기 위한 해시 기반 알고리즘입니다. 일반적인 해시 함수가 충돌을 피하려는 것과 달리, LSH는 유사한 입력값일수록 동일한 해시값으로 매핑될 확률이 높도록 설계되어, 대용량 데이터에서 근사 최근접 이웃(ANN, Approximate Nearest Neighbors) 검색에 활용됩니다.1. 개념 및 정의 항목 내용 정의유사한 객체들이 동일한 해시값을 가질 확률이 높은 해시 함수 집합을 사용하는 알고리즘목적고차원 공간에서의 유사 항목 검색 속도 개선필요성대용량 벡터 데이터에서의 실시간 검색 및 분류 최적화2. 주요 특징특징설명효과근사 최근접 검색정확한 거리 계산 없이 근접 데이터 추정속도 ..

Topic 2026.02.06

Vector Database

개요AI, 추천 시스템, 자연어 처리, 이미지 분석 등 고차원 데이터를 기반으로 하는 애플리케이션이 급증하면서, 기존 관계형 또는 문서형 데이터베이스로는 대응이 어려운 벡터(Vector) 기반 데이터 저장 및 검색 요구가 커지고 있습니다. 이러한 배경에서 등장한 **Vector Database(벡터 데이터베이스)**는 벡터 임베딩을 효율적으로 저장하고, 유사도 기반 검색을 빠르게 수행할 수 있는 특화된 데이터베이스입니다.1. 개념 및 정의Vector Database는 고차원 공간의 벡터 데이터를 저장하고, 입력 벡터와의 유사도를 기준으로 가장 가까운 결과를 검색하는 벡터 유사도 검색에 특화된 데이터베이스입니다.벡터: 이미지, 텍스트, 오디오 등에서 추출된 고차원 임베딩유사도 검색: Cosine Simil..

Topic 2025.06.18
728x90
반응형