728x90
반응형

로봇학습 2

PaLM-E (Pathways Language Model - Embodied)

개요PaLM-E는 Google Research가 발표한 'Embodied Multimodal Language Model(VLM)'로, 로봇 제어 능력을 갖춘 대형 언어 모델입니다. Vision-Language-Action의 통합 아키텍처를 지향하며, 언어, 이미지, 센서 데이터를 동시에 처리하여 로봇에 직접적인 명령을 수행할 수 있는 특징을 갖습니다. 이는 기존 언어 모델과는 다른 실시간 상호작용 중심의 AI로서 새로운 진화를 예고합니다.1. 개념 및 정의 항목 내용 정의텍스트, 이미지, 로봇 센서 데이터를 입력으로 받아 언어 출력 및 로봇 행동 시퀀스를 생성하는 멀티모달 모델목표로봇이 사람의 명령을 언어와 시각정보로 이해하고 실세계에서 직접 실행 가능하게 함구성 기반PaLM (Language) + V..

Topic 2025.05.26

Memory Replay Buffer(메모리 리플레이 버퍼)

개요Memory Replay Buffer(메모리 리플레이 버퍼)는 강화 학습(Reinforcement Learning, RL)에서 에이전트가 수집한 과거 경험을 저장하고, 이를 반복적으로 학습에 활용하기 위해 사용하는 핵심 구조입니다. 비효율적인 학습을 방지하고, 데이터의 다양성을 확보하여 더 안정적이고 효율적인 정책 학습을 가능하게 만듭니다.1. 개념 및 정의메모리 리플레이 버퍼는 에이전트가 환경과 상호작용하며 얻은 상태(state), 행동(action), 보상(reward), 다음 상태(next state)의 튜플을 저장하는 버퍼입니다. 이 저장된 경험을 샘플링하여, 모델이 다양한 상황을 다시 학습하게 함으로써 데이터 효율성 향상, 표본 상관관계 감소, 모델의 안정성 증가라는 효과를 기대할 수 있습니..

Topic 2025.04.08
728x90
반응형