728x90
반응형

메모리최적화 2

메모리 인터리빙(Memory Interleaving)

개요메모리 인터리빙(Memory Interleaving)은 시스템의 주기억장치를 여러 개의 뱅크(Bank)로 나누고, 각 메모리 뱅크에 데이터를 분산 저장하여 CPU의 연속적인 메모리 접근 시 병목 현상을 줄이고 전체 처리 속도를 향상시키는 기술이다. 현대 컴퓨터 아키텍처에서 메모리 대역폭과 접근 효율을 높이는 중요한 역할을 한다.1. 개념 및 정의메모리 인터리빙은 연속적인 주소 공간을 여러 메모리 뱅크에 순차적으로 할당하여 병렬 접근을 가능하게 만드는 설계 방식이다.목적: CPU의 메모리 접근 대기 시간을 줄이고, 병렬화된 데이터 처리 구현원리: 주소의 일부 비트를 사용해 메모리 뱅크를 구분하고, 교차 저장 방식으로 인터리빙적용 대상: 고속 CPU와 느린 메모리 간 속도 차이를 해소하기 위한 아키텍처 ..

Topic 2025.04.22

Mixed Precision Training(FP16/BF16)

개요Mixed Precision Training(혼합 정밀도 학습)은 딥러닝 모델 학습 시 다양한 정밀도의 숫자 타입(FP32, FP16, BF16)을 혼합 사용하여 학습 속도는 높이고 메모리 사용량은 줄이는 최적화 기법입니다. NVIDIA, Google 등 주요 AI 칩셋 제조사에서 지원하는 이 기술은, 모델 성능은 유지하면서도 GPU 활용도를 극대화할 수 있어 대규모 딥러닝 학습의 새로운 표준으로 자리 잡고 있습니다.1. 개념 및 정의Mixed Precision Training은 신경망의 연산 과정에서 **정밀도가 낮은 포맷(FP16 또는 BF16)**과 **기존의 32비트 부동소수점(FP32)**을 혼용하여 학습을 수행하는 기법입니다. 일반적으로는 다음 방식으로 사용됩니다:Forward/Backwa..

Topic 2025.04.09
728x90
반응형