728x90
반응형

nVidia 5

NVLink-C2C Chiplet Fabric (NVC2C)

개요AI, HPC, 데이터센터 워크로드가 폭발적으로 증가하면서 단일 SoC(System on Chip)의 한계를 넘어서기 위한 칩렛 기반 아키텍처가 급부상하고 있다. 칩렛은 기능별 반도체 블록을 조합하여 하나의 시스템을 구성하는 방식으로, 설계 유연성과 제조 효율을 동시에 제공한다. 이러한 칩렛 간 연결에서 핵심적인 기술이 바로 **NVIDIA NVLink-C2C (Chip-to-Chip)**이다.NVC2C는 NVIDIA가 2023년 발표한 초고속, 저지연 칩렛 인터커넥트 기술로, 멀티 칩렛 기반 GPU 및 CPU-GPU 통합 칩에서 초고속 데이터 교환을 실현한다. 이는 AI 슈퍼컴퓨팅, 차세대 데이터센터 플랫폼, 고성능 엣지 디바이스의 핵심 인프라로 자리잡고 있다.1. 개념 및 정의 항목 설명 정의N..

Topic 2025.08.07

Triton Inference Server

개요AI 모델을 실제 서비스에 적용하려면, 학습 이후 단계인 **추론(Inference)**을 빠르고 안정적으로 처리할 수 있어야 합니다. 이를 위한 대표적 오픈소스 플랫폼이 NVIDIA의 Triton Inference Server입니다. 다양한 프레임워크 모델을 일관된 방식으로 배포하고, GPU 및 CPU 리소스를 효율적으로 활용하며, 대규모 AI 추론 워크로드를 안정적으로 처리할 수 있는 서버입니다. 본 글에서는 Triton Inference Server의 구조, 기능, 장점 및 적용 사례를 상세히 살펴봅니다.1. 개념 및 정의Triton Inference Server는 NVIDIA가 개발한 범용 AI 추론 서버로, 다양한 딥러닝 프레임워크(PyTorch, TensorFlow, ONNX 등) 기반의 ..

Topic 2025.07.16

Instant-NGP

개요Instant-NGP(Instant Neural Graphics Primitives)는 NVIDIA가 발표한 3D 그래픽용 신경망 학습 프레임워크로, NeRF(Neural Radiance Fields)와 Signed Distance Field(SDF) 기반의 고해상도 3D 표현을 단 몇 초 만에 학습하고 렌더링할 수 있게 한다. 본 글에서는 Instant-NGP의 개념, 핵심 구조, 성능 특징 항목 설명 정의Instant-NGP는 hash encoding과 작은 MLP 기반 구조로 NeRF 학습을 극도로 빠르게 수행하는 실시간 Neural Field 엔진이다.목적수 분~수 시간이 소요되던 NeRF 훈련을 수초~수분 내로 단축기술 기반Multi-resolution Hash Encoding + Tiny..

Topic 2025.07.02

NVSwitch

개요NVSwitch는 NVIDIA가 설계한 고속 GPU 인터커넥트 스위치로, 복수의 GPU를 단일 시스템 내에서 **풀 메쉬(Fully Connected Topology)**로 연결하여 고속 데이터 전송을 실현하는 핵심 기술입니다. 기존 NVLink보다 더욱 확장성 있고, 고대역폭 연결이 가능해 AI 모델 학습, HPC, 클라우드 데이터센터 환경에서 핵심적 역할을 수행합니다.1. 개념 및 정의NVSwitch는 NVIDIA의 고성능 스위칭 ASIC으로, 다수의 GPU를 고속으로 상호 연결하여 마치 하나의 통합 메모리 공간처럼 작동할 수 있도록 지원하는 장치입니다.목적: GPU 간 병렬 작업에서 발생하는 대역폭 병목 해결필요성: AI, 시뮬레이션, 과학계산 등에서 메모리 공유 및 대규모 연산 처리 가속화기반..

Topic 2025.05.06

NVLink

개요NVLink는 NVIDIA가 개발한 고속 GPU 인터커넥트 기술로, GPU 간 및 GPU-CPU 간 대역폭과 효율성을 획기적으로 향상시키는 것을 목표로 합니다. 기존의 PCIe 인터페이스의 한계를 극복하고, 대규모 병렬 컴퓨팅 환경에서 탁월한 성능을 발휘하며, AI, HPC(High Performance Computing), 데이터센터 환경에서 핵심적인 역할을 합니다.1. 개념 및 정의NVLink는 NVIDIA GPU 및 CPU 간의 고대역폭, 저지연의 직렬 인터커넥트 기술입니다. 멀티 GPU 환경에서 더 빠른 메모리 공유와 동기화가 가능하도록 설계되어, 데이터 병목을 최소화하고 GPU 간 협업 처리를 원활하게 해줍니다.목적: PCIe 대비 높은 대역폭을 제공하여 GPU 간 병렬 작업 최적화필요성: ..

Topic 2025.05.06
728x90
반응형