728x90
반응형

trustworthyai 3

ISO/IEC 24028

개요ISO/IEC 24028은 인공지능(AI) 시스템의 신뢰성(Trustworthiness)을 확보하기 위한 리스크 기반 접근과 설계 원칙을 제시하는 국제 표준 가이드라인이다. AI의 투명성, 공정성, 보안성, 안정성 등을 체계적으로 평가하고 설계 단계에서부터 이를 고려하도록 하는 것이 핵심이다.1. 개념 및 정의 항목 내용 정의인공지능 시스템의 신뢰성을 확보하기 위한 품질 속성 및 리스크 요소를 정의한 ISO/IEC 가이드라인제정기관ISO/IEC JTC 1/SC 42 (AI 국제 표준 기술위원회)적용 대상정부, 기업, AI 개발 조직, 평가기관 등ISO/IEC 24028은 'AI 시스템이 얼마나 안전하고 예측 가능하며 책임 있는 방식으로 동작하는가'에 대한 판단 기준을 제공한다.2. 특징특징설명기존 ..

Topic 2025.06.20

Holistic Evaluation of Language Models (HELM)

개요HELM(Holistic Evaluation of Language Models)은 대형언어모델(LLM)의 성능을 단순 정확도나 정답률을 넘어, 공정성, 편향성, 신뢰성, 견고성, 효율성 등 다차원적 관점에서 정량·정성 평가하는 포괄적 벤치마크 프레임워크입니다. 스탠포드 CRFM(Center for Research on Foundation Models)이 주도하여 개발하였으며, LLM에 대한 책임 있는 도입과 운영을 위한 필수 도구로 부상하고 있습니다.1. 개념 및 정의 구분 내용 정의LLM을 다양한 사용 시나리오와 평가 차원에서 분석·비교하는 벤치마크 체계목적단일 지표 평가의 한계를 극복하고, LLM의 전반적 신뢰성 및 사회적 영향력까지 진단필요성AI 사용 확대에 따른 윤리·안전·공정성 문제를 사전..

Topic 2025.05.19

Constitutional AI

개요Constitutional AI는 인공지능 시스템이 사람의 지시나 가치 판단 없이도 스스로 윤리적·법적으로 더 나은 결정을 내릴 수 있도록 학습시키는 기술 패러다임입니다. AI 모델에 일련의 “헌법(Constitution)” 문서를 명시하고, 이를 기반으로 자기 검열(Self-Critique)과 개선(Self-Improvement)을 반복하여 인간 개입 없이도 안전하고 일관된 행동을 유도하는 방식입니다. Anthropic의 Claude 모델 개발을 통해 본격화되었으며, LLM 안전성의 새로운 기준으로 떠오르고 있습니다.1. 개념 및 정의 구분 내용 정의AI가 사전에 주어진 윤리/가이드라인(헌법)에 따라 스스로 판단과 응답을 조정하도록 학습하는 방식목적인간 피드백 없이도 윤리성과 일관성을 갖춘 AI ..

Topic 2025.05.19
728x90
반응형