개요AI Alignment(AI 정렬)는 인공지능 시스템이 인간의 가치, 의도, 윤리 기준에 부합하도록 설계하고 제어하는 기술 및 연구 분야이다. 특히 대규모 언어모델(LLM)과 Agentic AI의 발전으로 인해 AI의 자율성이 증가하면서, 잘못된 목표 설정이나 예측 불가능한 행동을 방지하기 위한 핵심 과제로 부상하고 있다.1. 개념 및 정의AI 정렬은 AI가 단순히 명령을 수행하는 것을 넘어, 인간이 의도한 방향으로 안전하고 일관되게 행동하도록 만드는 것을 의미한다. 이는 목표 설정, 보상 함수 설계, 행동 제어 등 다양한 요소를 포함한다.2. 특징항목설명영향가치 정렬인간 가치 반영윤리적 AI 구현안전성 중심위험 행동 방지신뢰성 확보불확실성 관리예측 불가능성 대응안정성 증가장기적 관점AGI 대비미래 ..