728x90
반응형

품질측정 2

OpenAI Evals SDK

개요OpenAI Evals SDK는 대규모 언어 모델(LLM)의 성능을 반복 가능하고 체계적으로 평가하기 위한 오픈소스 기반의 평가 프레임워크입니다. 이 도구는 평가 기준을 코드로 정의할 수 있게 하여, 실험 자동화, 결과 재현성, 팀 협업을 가능하게 하고 LLM 기반 서비스 개발의 품질과 신뢰성을 크게 높입니다.1. 개념 및 정의OpenAI Evals SDK: LLM 또는 기타 모델에 대한 입력/출력 테스트를 코드로 구현할 수 있도록 하는 Python 기반 SDK기반 철학: 평가도 테스트처럼 다루며, 자동화 및 협업을 고려한 설계평가 방식: 프롬프트 기반, 기준 정답과 비교, LLM judge 사용 등 다양한 방식 지원2. 특징 항목 설명 비교 대상 평가 코드화평가 기준, 데이터셋, 메트릭을 코드로..

Topic 2025.07.05

ISO 8000-8

개요ISO 8000-8은 ISO 8000 시리즈 중 데이터 품질에 대한 구체적인 요구사항(Requirements)을 명시한 핵심 파트입니다. 이 표준은 데이터가 비즈니스 목적에 부합하도록 품질을 보장하기 위한 명확한 기준을 제공하며, 기업의 데이터 품질 정책 수립, 측정, 평가 및 개선 활동에 구조적 틀을 마련해 줍니다.1. 개념 및 정의 항목 설명 비고 정의데이터 품질을 달성하기 위한 요구조건과 적합성 기준을 정의한 표준ISO 8000 Part 8목적데이터 품질 관리의 실무적 요구사항 명시데이터 신뢰성 확보필요성다양한 출처의 데이터를 수용·활용하기 위한 품질 통제데이터 유통 및 재사용 가능성 보장ISO 8000-8은 공공/민간의 마스터데이터, 참조데이터, 비정형 데이터 품질을 실질적으로 관리하기 위..

Topic 2025.06.10
728x90
반응형