728x90
반응형

ai제어 2

MADDPG (Multi-Agent Deep Deterministic Policy Gradient)

개요MADDPG는 다중 에이전트 강화학습(MARL)을 위한 대표적인 알고리즘으로, 각 에이전트가 독립적으로 정책을 학습하면서도, 공동의 환경 이해를 통해 협력 및 경쟁 전략을 최적화할 수 있도록 설계된 Off-policy Actor-Critic 방식의 알고리즘이다. 이는 복잡한 상호작용이 존재하는 환경(예: 로봇 군집, 자율 주행 차량, 게임 에이전트 등)에서 효과적으로 학습할 수 있는 프레임워크를 제공한다.1. 개념 및 정의 항목 설명 정의MADDPG는 DDPG 기반으로 확장된 알고리즘으로, 다중 에이전트 환경에서 각 에이전트가 고유한 정책을 가지며, 중앙집중식 비판자(Critic)를 통해 공동 훈련하는 방식목적에이전트 간 상호작용을 고려한 안정적 정책 학습 수행필요성독립형 DDPG는 상대 에이전트의..

Topic 2025.06.15

자율 시스템(Autonomous Systems)

개요자율 시스템(Autonomous Systems)은 외부의 지속적인 인간 개입 없이도 주어진 목표를 달성하기 위해 스스로 판단하고 행동하는 시스템을 의미한다. 센서, AI, 로보틱스, 제어 알고리즘을 기반으로 하여, 실제 환경에서 상황을 인지하고, 계획하고, 실행하는 능력을 갖춘 것이 특징이다. 특히 제조, 물류, 교통, 국방 등 다양한 산업에서 활용도가 증가하고 있으며, 미래의 핵심 인프라로 주목받고 있다.1. 개념 및 정의자율 시스템은 데이터를 기반으로 한 상황 인식, 의사결정, 실행을 자동화하며, 인간의 감독 없이도 지속적으로 작동하는 시스템이다.목적: 반복적이거나 위험한 작업의 자동화 및 효율성 극대화필요성: 인력 부족, 안전 문제, 실시간 대응의 필요성 증가핵심 특징: 자기 인식(Self-aw..

Topic 2025.04.27
728x90
반응형