728x90
반응형

MADDPG 2

MADDPG (Multi-Agent Deep Deterministic Policy Gradient)

개요MADDPG는 다중 에이전트 강화학습(MARL)을 위한 대표적인 알고리즘으로, 각 에이전트가 독립적으로 정책을 학습하면서도, 공동의 환경 이해를 통해 협력 및 경쟁 전략을 최적화할 수 있도록 설계된 Off-policy Actor-Critic 방식의 알고리즘이다. 이는 복잡한 상호작용이 존재하는 환경(예: 로봇 군집, 자율 주행 차량, 게임 에이전트 등)에서 효과적으로 학습할 수 있는 프레임워크를 제공한다.1. 개념 및 정의 항목 설명 정의MADDPG는 DDPG 기반으로 확장된 알고리즘으로, 다중 에이전트 환경에서 각 에이전트가 고유한 정책을 가지며, 중앙집중식 비판자(Critic)를 통해 공동 훈련하는 방식목적에이전트 간 상호작용을 고려한 안정적 정책 학습 수행필요성독립형 DDPG는 상대 에이전트의..

Topic 2025.06.15

Multi-Agent Reinforcement Learning (MARL)

개요Multi-Agent Reinforcement Learning(MARL)은 다수의 에이전트(Agent)가 하나의 환경에서 상호작용하며 동시에 학습하는 강화학습의 확장 개념입니다. 전통적인 단일 에이전트 강화학습(SARL)이 독립적인 상황에서 최적 행동을 학습하는 데 반해, MARL은 협력(Collaboration), 경쟁(Competition), 공존(Coexistence) 등의 다양한 상호작용을 기반으로 복잡한 문제 해결이 가능합니다.MARL은 자율주행차 군집, 로봇 협업, 분산 에너지 시스템, 전략 게임, 분산 네트워크 제어 등에서 핵심 기술로 활용됩니다.1. 개념 및 정의MARL은 강화학습의 핵심 요소인 상태(State), 행동(Action), 보상(Reward)을 복수의 에이전트와 공유된 환경..

Topic 2025.04.06
728x90
반응형