728x90
반응형

rag 시스템 2

RAGAS

개요RAGAS(Retrieval-Augmented Generation Assessment Score)는 RAG 기반 LLM 시스템의 응답 품질을 체계적으로 측정하기 위한 평가 프레임워크입니다. 신뢰도, 관련성, 정확성, 유창성 등 여러 항목에 대해 정량적 지표를 산출하며, 실험 또는 운영 환경에서 RAG 시스템을 개선하는 데 필수적인 도구로 자리 잡고 있습니다.본 글에서는 RAGAS의 개념, 지표 구조, 평가 방식, 기술 요소, 활용 사례 등을 통해 LLM 평가 자동화의 전략적 도입 방안을 소개합니다.1. 개념 및 정의 항목 설명 정의RAGAS는 RAG 시스템의 응답 품질을 다양한 관점에서 평가하는 오픈소스 평가 지표 프레임워크입니다.목적RAG 응답에 대한 품질 관리 및 개선을 위한 정량적 기준 제공필..

Topic 2025.09.07

RAG Evaluation Harness

개요RAG Evaluation Harness는 RAG(Retrieval-Augmented Generation) 기반 시스템의 응답 품질을 정량적, 정성적으로 측정하고 반복적으로 개선하기 위한 자동화된 평가 프레임워크다. 다양한 평가 지표와 평가자(모델/사람)를 통합하여 소스 기반 정확성, 맥락 정합성, 유용성 등을 다차원적으로 분석한다.1. 개념 및 정의RAG Evaluation Harness는 검색 기반 생성 시스템에서 입력 쿼리, 검색된 문서(Context), 생성 응답(Answer)을 기반으로 다양한 평가 기법을 적용해 응답 품질을 검증하는 자동화된 평가 툴 또는 프레임워크이다.목적: RAG 시스템의 품질 편차를 측정하고 개선 루프를 자동화기반 단위: (Query, Context, Generatio..

Topic 2025.07.15
728x90
반응형