728x90
반응형

분산 학습 2

DeepSpeed ZeRO-Infinity

개요DeepSpeed ZeRO-Infinity는 마이크로소프트가 오픈소스로 개발한 대규모 언어 모델(LLM) 학습 프레임워크 DeepSpeed의 최신 확장 기술로, 수조(trillion)-단위 파라미터 모델의 효율적 학습과 추론을 가능하게 하는 메모리 최적화 솔루션입니다. 기존 DeepSpeed ZeRO(Zero Redundancy Optimizer)의 한계를 극복하고, GPU와 CPU 메모리는 물론 NVMe 저장장치까지 포함한 하이브리드 메모리 계층을 활용함으로써 GPU 메모리 병목을 완화합니다.1. 개념 및 정의 항목 설명 정의DeepSpeed ZeRO-Infinity는 모델 파라미터, 옵티마이저 상태, 활성값(activations)을 GPU/CPU/NVMe 계층으로 분산 저장하여 대규모 모델 학습..

Topic 2025.06.06

Federated Reinforcement Learning (FRL)

개요Federated Reinforcement Learning(FRL)은 여러 에이전트가 로컬 환경에서 학습한 강화학습 정책(Policy)을 중앙 서버로 공유하고 통합함으로써, 전체 시스템의 학습 성능을 향상시키면서도 사용자 데이터는 로컬에 보존하는 프라이버시 중심의 학습 프레임워크입니다. FRL은 스마트 디바이스, 자율주행, 산업 로봇, 의료 시스템 등 민감 데이터를 포함한 분산 환경에서 안전하고 효율적인 AI 학습을 가능하게 합니다.1. 개념 및 정의 항목 설명 비고 정의각 에이전트가 로컬 환경에서 강화학습을 수행하고, 정책 또는 파라미터를 중앙 서버에 공유하여 집합적 학습을 수행하는 프레임워크FL(Federated Learning) + RL(Reinforcement Learning) 결합목적데이..

Topic 2025.05.30
728x90
반응형