728x90
반응형

2025/11/17 2

DCQCN (Data Center Quantized Congestion Notification)

개요DCQCN(Data Center Quantized Congestion Notification)은 데이터센터 네트워크의 RoCEv2 (RDMA over Converged Ethernet) 환경에서 혼잡을 효율적으로 제어하기 위한 전송 프로토콜입니다. IEEE 802.1Qau QCN(Quantized Congestion Notification) 표준을 기반으로 하며, 저지연·고대역폭·무손실 네트워크(Zero Loss Network) 구현을 목표로 합니다.1. 개념 및 정의 항목 내용 비고 정의RoCEv2 네트워크에서 혼잡을 제어하기 위해 설계된 TCP-친화적 혼잡 제어 알고리즘Mellanox/NVIDIA 주도 개발목적혼잡 시 대역폭 효율적 사용과 패킷 손실 방지RDMA 트래픽 안정화필요성데이터센터 내..

Topic 2025.11.17

NEFTune (Neural Efficient Fine-Tuning)

개요NEFTune(Neural Efficient Fine-Tuning)은 대규모 언어 모델(LLM: Large Language Model)의 파인튜닝 과정에서 효율성과 성능을 동시에 향상시키기 위해 고안된 최적화 기술이다. LoRA(Low-Rank Adaptation), PEFT(Parameter-Efficient Fine-Tuning) 등 기존 방법론의 한계를 보완하면서, 모델의 일반화 성능과 계산 효율성을 극대화한다.1. 개념 및 정의 항목 내용 비교 개념사전 학습된 대형 모델의 일부 파라미터만 조정하여 효율적 학습을 수행하는 방법론LoRA, Prefix Tuning 대비 학습 효율 향상목적GPU 메모리 절약 및 학습 시간 단축대형 모델 실험 비용 절감필요성LLM 파인튜닝의 자원 요구량 급증 대응..

Topic 2025.11.17
728x90
반응형