'openaievals' 태그의 글 목록

Evals-as-Code

개요Evals-as-Code는 소프트웨어 및 AI 모델 평가를 코드화하여 반복 가능하고 확장 가능한 방식으로 운영하는 접근 방식입니다. 기존 수작업 기반 또는 문서 기반 평가 방식의 한계를 극복하고, CI/CD 파이프라인 내에 자연스럽게 통합될 수 있도록 설계되어 AI 시스템의 품질 관리와 실험 투명성을 향상시킵니다.1. 개념 및 정의Evals-as-Code: 평가 스크립트를 버전 관리되는 코드로 관리하고, 자동화된 테스트와 통합하는 방식적용 대상: LLM, ML 모델, API 응답, 사용자 입력 시스템 등특징: 평가 기준 명시화, 자동화, 반복 실행 가능성 확보2. 특징 항목 설명 기존 방식과 비교 버전 관리 가능Git으로 평가 기준/코드 관리수기 점검 대비 추적성 높음자동화CI/CD 파이프라인 연..

Topic 2025.07.05

« 2026/02 »

일

월

화

수

목

금

토

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

ITPE * JackerLab

openaievals 2

티스토리툴바