'rag' 태그의 글 목록

In-Network AI Pre-Filter

개요In-Network AI Pre-Filter는 데이터센터나 클라우드 경계 외부의 네트워크 계층(엣지, 스위치, 게이트웨이 등)에서 실시간으로 흐르는 데이터를 분석하고 불필요하거나 위험한 트래픽, 민감 정보를 사전에 필터링하는 AI 기반의 선처리(pre-filtering) 기술입니다. 대규모 LLM 시스템, AI API 게이트웨이, 고속 IoT 환경 등에서 처리 효율성 및 보안성 확보를 위한 핵심 인프라로 주목받고 있습니다.1. 개념 및 정의In-Network AI: 네트워크 내에서 ML 모델을 실시간 실행하여 트래픽 흐름을 분석하고 반응하는 기술Pre-Filter: 메인 AI 모델 또는 백엔드 시스템에 도달하기 전 사전 조건 검사를 통해 유효성 판단 및 필터링In-Network AI Pre-Filte..

Topic 2025.07.06

FERPA-Safe RAG Gateway

개요FERPA-Safe RAG Gateway는 RAG(Retrieval-Augmented Generation) 기반 AI 시스템이 FERPA(Family Educational Rights and Privacy Act)의 개인정보 보호 요건을 준수하면서 민감한 교육 데이터를 활용할 수 있도록 설계된 게이트웨이입니다. 텍스트 생성 AI가 검색 데이터에 접근하고 응답을 생성하는 전 과정에서 학생 정보 보호를 위한 필터링, 토큰 기반 접근 제어, 감사 추적 기능 등을 제공하여 교육 분야에서 안전하게 생성형 AI를 활용할 수 있도록 지원합니다.1. 개념 및 정의FERPA: 미국 연방법으로 학생 교육기록의 프라이버시 보호를 규정함RAG Gateway: 외부 검색 소스를 활용하는 AI 응답 구조에서 검색·생성 전후 ..

Topic 2025.07.06

VDBench-v1 (Vector DB Benchmark)

개요VDBench-v1은 다양한 벡터 데이터베이스(Vector DB)의 검색 성능, 정밀도, 확장성을 비교 평가할 수 있도록 설계된 오픈 벤치마크 도구이다. ANN(Search), Filtering, Re-ranking, Index 유형 등 주요 기능을 중심으로 통일된 평가 지표와 실행 방식을 제공하며, LLM 시대 RAG(Relevance-Augmented Generation) 아키텍처의 인프라 선택에 핵심 역할을 한다.1. 개념 및 정의 항목 설명 정의VDBench-v1은 벡터 DB 간 기능적/비기능적 성능 비교를 위해 설계된 오픈소스 벤치마크 프레임워크이다.목적벡터 검색 성능 및 시스템적 확장성 비교, 표준화된 테스트 제공평가 방식공통 질의 집합과 동일 데이터셋으로 latency, recall, ..

Topic 2025.07.02

Self-Correcting RAG (ReAct + Retrieval Re-rank)

개요Self-Correcting RAG는 Retrieval-Augmented Generation(RAG)의 한계를 극복하기 위한 차세대 구성 방식으로, **ReAct 방식의 반응형 추론(Reasoning + Acting)**과 재검색 기반 재정렬(Retrieval Re-ranking) 기법을 결합해 생성형 AI의 정확도, 신뢰도, 자기 검증력을 향상시키는 구조입니다. 정보 검색과 응답 생성을 반복 순환함으로써 ‘자기 수정(Self-Correction)’ 능력을 내재화합니다.1. 개념 및 정의 용어 설명 RAG검색된 문서를 기반으로 LLM이 답변 생성ReActLLM이 사고하며 행위하도록 유도하는 방식 (예: 추론 + 검색 + 검토 반복)Re-ranking검색된 문서의 관련도를 재평가하여 우선순위 조정Se..

Topic 2025.06.26

LLMOps

개요LLMOps는 LLM(Large Language Models) 기반 애플리케이션을 개발, 배포, 모니터링, 최적화하는 전체 수명 주기를 관리하는 운영 프레임워크이다. 기존 MLOps의 확장된 개념으로, LLM 특유의 대규모 파라미터, 프롬프트 관리, 레이턴시 대응, 평가 지표 등의 요구를 반영한다. GenAI 시대의 AI 운영 패러다임으로 주목받고 있다.1. 개념 및 정의 항목 내용 정의LLM 기반 시스템의 훈련, 배포, 프롬프트 관리, 성능 모니터링 등을 포함하는 엔드투엔드 운영 체계목적LLM 서비스 품질 보장, 비용 효율화, 사용자 경험 최적화구성 범위프롬프트 엔지니어링, 파인튜닝, 캐시, 보안·감사, A/B 테스트 등 포함LLMOps는 단순 모델 배포를 넘어서, 대규모 모델 특화 운영 자동화에..

Topic 2025.06.20

Knowledge-Graph Embedding

개요지식 그래프(Knowledge Graph, KG)는 개체(entity)와 관계(relation)를 구조화하여 표현한 지식 표현 모델입니다. 하지만 KG는 기계가 직접 처리하기 어려운 기호(symbolic) 형태이기 때문에, 이를 수치 벡터 형태로 변환해 머신러닝이나 딥러닝에서 활용할 수 있도록 만드는 기술이 바로 **Knowledge Graph Embedding(KGE)**입니다. 본 글에서는 KGE의 정의, 주요 알고리즘, 활용 사례 및 한계점에 대해 살펴봅니다.1. 개념 및 정의Knowledge Graph Embedding은 KG 내의 각 entity와 relation을 연속적인 저차원 벡터 공간에 매핑하는 표현 학습 기법입니다.목표: 구조화된 관계형 데이터를 신경망에서 활용 가능한 형태로 변환구..

Topic 2025.06.18

Vector Database

개요AI, 추천 시스템, 자연어 처리, 이미지 분석 등 고차원 데이터를 기반으로 하는 애플리케이션이 급증하면서, 기존 관계형 또는 문서형 데이터베이스로는 대응이 어려운 벡터(Vector) 기반 데이터 저장 및 검색 요구가 커지고 있습니다. 이러한 배경에서 등장한 **Vector Database(벡터 데이터베이스)**는 벡터 임베딩을 효율적으로 저장하고, 유사도 기반 검색을 빠르게 수행할 수 있는 특화된 데이터베이스입니다.1. 개념 및 정의Vector Database는 고차원 공간의 벡터 데이터를 저장하고, 입력 벡터와의 유사도를 기준으로 가장 가까운 결과를 검색하는 벡터 유사도 검색에 특화된 데이터베이스입니다.벡터: 이미지, 텍스트, 오디오 등에서 추출된 고차원 임베딩유사도 검색: Cosine Simil..

Topic 2025.06.18

HyDE RAG(Hypothetical Document Embeddings for Retrieval-Augmented Generation)

개요RAG(Retrieval-Augmented Generation)은 검색과 생성형 AI를 결합하여 신뢰도 높은 응답을 생성하는 핵심 프레임워크입니다. 하지만 기존 RAG는 쿼리와 문서의 의미적 거리만을 기준으로 유사 문서를 검색하기 때문에, 질문과 관련된 문서가 누락되거나, 부정확한 문서가 검색되는 한계가 존재합니다. 이를 개선하기 위해 등장한 기술이 HyDE RAG입니다. HyDE는 질문에 대한 가상의 정답(Hypothetical Answer)을 생성하고 이를 임베딩하여 검색하는 방식으로, RAG의 정확성과 정밀도를 크게 향상시킵니다.1. 개념 및 정의**HyDE(Hypothetical Document Embeddings)**는 사용자의 질문을 먼저 LLM을 통해 **가상의 정답 문장(Hypothet..

Topic 2025.05.28

OpenSearch Vector Engine (OVE)

개요OpenSearch Vector Engine(OVE)은 OpenSearch에 내장된 벡터 기반 검색(ANN: Approximate Nearest Neighbor)을 고속, 고정확도로 수행할 수 있도록 설계된 벡터 검색 전용 엔진입니다. 대규모 텍스트, 이미지, 코드, 오디오 등 임베딩된 데이터의 유사도 기반 검색에 특화되어 있으며, LLM 기반 RAG(Retrieval-Augmented Generation) 아키텍처의 핵심 구성 요소로 각광받고 있습니다.1. 개념 및 정의 항목 설명 정의OpenSearch Vector Engine은 벡터 임베딩 기반의 유사 검색 기능을 제공하는 OpenSearch의 통합 검색 모듈입니다.목적텍스트·이미지 등 임베딩된 벡터 간 근접 유사도를 빠르고 정확하게 검색필요성..

Topic 2025.05.16

ANN (Approximate Nearest Neighbor)

개요ANN(Approximate Nearest Neighbor)은 고차원 벡터 공간에서 주어진 쿼리 벡터에 가장 가까운 이웃(neighbor)을 빠르게 찾기 위한 근사 알고리즘이다. 정확한 최근접 탐색(Exact NN)은 계산 비용이 매우 높기 때문에, ANN은 속도와 정확도 사이의 균형을 추구하며 대규모 데이터셋에서 벡터 검색, 이미지 유사도 탐색, AI 임베딩 검색 등에 널리 활용된다.1. 개념 및 정의ANN은 고차원 공간에서 거리(코사인 거리, 유클리드 거리 등)를 기준으로 가장 가까운 벡터를 찾는 과정을 근사적으로 처리하는 기법이다. 정확한 결과 대신 유사한(approximate) 결과를 빠르게 도출하는 데 초점을 맞춘다.목적: 계산 효율성을 극대화한 고속 벡터 검색필요성: 고차원에서의 NN 탐색..

Topic 2025.05.11

Vector Extension for Postgres

개요Vector Extension for Postgres는 PostgreSQL 데이터베이스에 벡터 연산 기능을 추가하여, 고차원 벡터 검색, 유사도 기반 질의, AI 임베딩 저장 및 질의응답 시스템 등에 활용할 수 있도록 만든 확장 모듈이다. 최근 AI 검색과 추천 시스템의 인기로 인해 PostgreSQL과 같은 범용 DB에서의 벡터 기반 질의 지원이 중요해지고 있다.1. 개념 및 정의Vector Extension은 PostgreSQL에서 벡터 데이터를 컬럼 형태로 저장하고, cosine similarity, L2 distance, inner product 등을 기반으로 한 유사도 검색 기능을 지원하는 확장(extension) 기능이다.목적: PostgreSQL에서 AI 임베딩을 기반으로 유사도 질의 수..

Topic 2025.05.11

Retrieval-Augmented Generation v2 (RAG++)

개요RAG(Retrieval-Augmented Generation)는 언어 모델의 한계를 보완하기 위해 사전 학습된 LLM에 검색기(Retriever)를 연결해 외부 지식을 동적으로 주입하는 프레임워크입니다. RAG v2(RAG++)는 이 기본 개념을 발전시켜, 더 정교한 문서 검색, 필터링, 다중 문서 reasoning, 그리고 지식 신뢰도 기반 재구성 기능을 통해 정확도, 일관성, 신뢰도 모두를 향상시킨 차세대 구조입니다.1. 개념 및 정의RAG++는 질문 → 검색 → 요약/생성의 세 단계 파이프라인을 다음과 같이 강화합니다:Retriever: 다중 문서 벡터 검색 (Dense/Sparse Hybrid, Re-ranking 포함)Knowledge Selection: 문서 정합성, 출처 신뢰도 기반 필..

Topic 2025.05.08

LangChain

개요LangChain은 대형 언어 모델(LLM)을 실제 애플리케이션 수준으로 확장 가능하도록 돕는 오픈소스 프레임워크입니다. 단순한 프롬프트 호출을 넘어서, 외부 데이터 연결, 도구 사용, 멀티스텝 추론, 메모리 유지, 에이전트 기반 설계를 가능하게 합니다. LLM 오케스트레이션 분야에서 가장 널리 사용되는 프레임워크로, AI 챗봇, 문서 검색, 자동화 업무 시스템 등에 폭넓게 활용됩니다.1. 개념 및 정의LangChain은 Python 및 JavaScript에서 사용할 수 있으며, LLM을 중심으로 다양한 컴포넌트(메모리, 툴, 에이전트 등)를 조합해 복잡한 워크플로우를 구성할 수 있도록 설계된 프레임워크입니다.프롬프트 템플릿, 체인(chain), 메모리, 툴, 에이전트 등 다양한 구성 요소를 통해 L..

Topic 2025.04.28

LLM 오케스트레이션

개요LLM 오케스트레이션(Orchestration)은 하나의 대형 언어 모델(Large Language Model)이 아닌 여러 LLM을 조율하여 복잡한 업무를 수행하거나, LLM과 외부 도구를 결합해 확장된 인공지능 서비스를 구축하는 기술 전략입니다. LangChain, Semantic Kernel, CrewAI 등의 프레임워크가 대표적으로 활용되며, AI 에이전트, 챗봇, 검색 강화 생성(RAG) 등 고도화된 애플리케이션 구현의 핵심입니다.1. 개념 및 정의LLM 오케스트레이션은 단일 LLM의 한계를 극복하고, 다양한 언어 모델과 도구, API, 데이터 소스들을 통합하여 복합적인 태스크를 수행할 수 있도록 하는 시스템 아키텍처입니다.기본적으로는 LLM의 입력/출력을 관리하고, 필요시 외부 메모리, 데..

Topic 2025.04.28

Retrieval-Augmented Prompting (RAP)

개요Retrieval-Augmented Prompting(RAP)은 대규모 언어모델(LLM)의 응답 생성 능력을 향상시키기 위해, 모델 외부에서 정보를 검색(retrieve)한 후 해당 지식을 프롬프트에 삽입하여 모델이 활용하도록 만드는 전략입니다. 이는 대규모 언어모델이 가지고 있지 않은 최신 정보, 사실 기반 지식, 도메인 문서를 활용할 수 있게 하여 정확도, 최신성, 신뢰도 모두를 강화합니다. 대표적으로 RAG(Retrieval-Augmented Generation), ChatGPT+Bing, LangChain 기반 검색 에이전트 등에 활용됩니다.1. 개념 및 정의Retrieval-Augmented Prompting은 크게 다음 3단계로 구성됩니다:Query 생성: 사용자의 질문 또는 요청을 기반으..

Topic 2025.04.07

RAG(Retrieval-Augmented Generation)

개요RAG(Retrieval-Augmented Generation)는 인공지능(AI) 모델이 문서를 검색(Retrieval)하여 최신 정보 또는 외부 데이터에 접근한 후, 이를 기반으로 텍스트를 생성(Generation)하는 방식입니다. 이는 기존 언어 모델이 가지고 있는 정보 제한성을 극복하고, 실시간으로 최신 데이터를 반영할 수 있도록 도와줍니다. 본 글에서는 RAG의 개념, 주요 기술 요소, 활용 사례 및 도입 시 고려사항을 살펴봅니다.1. RAG란 무엇인가?RAG는 자연어 처리(NLP) 모델이 외부 지식 저장소에서 관련 정보를 검색한 후, 이를 바탕으로 답변을 생성하는 기술입니다. 기존의 대형 언어 모델(LLM)과 결합하여 최신 정보를 반영할 수 있으며, 정보의 정확성을 높일 수 있습니다.1.1 ..

Topic 2025.03.07

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

ITPE * JackerLab

rag 16

티스토리툴바