728x90
반응형

gpu가상화 5

NVIDIA GPU Operator

개요NVIDIA GPU Operator는 Kubernetes 클러스터 내에서 GPU 리소스를 자동으로 배포, 구성, 모니터링 및 관리하는 오픈소스 오퍼레이터(Operator)입니다. AI/ML, HPC, 데이터 분석 워크로드를 위한 GPU 인프라를 컨테이너 환경에 최적화된 형태로 운영할 수 있도록 지원하며, NVIDIA의 GPU Cloud(NGC) 생태계와 통합되어 GPU 사용 효율성과 안정성을 극대화합니다.1. 개념 및 정의 항목 내용 비고 정의Kubernetes에서 GPU 드라이버, 런타임, 모니터링 등을 자동으로 관리하는 오퍼레이터CNCF 호환 오픈소스 솔루션목적GPU 리소스의 자동화된 프로비저닝 및 유지관리GPU 인프라 운영 효율화필요성클라우드 네이티브 AI 워크로드 증가 및 GPU 복잡성 완..

Topic 2025.12.16

NVIDIA MIG (Multi-Instance GPU)

개요NVIDIA MIG(Multi-Instance GPU)는 NVIDIA의 Ampere 및 Hopper 아키텍처 기반 GPU에서 하나의 물리 GPU를 여러 개의 독립적인 GPU 인스턴스로 분할하여 사용하도록 지원하는 기술입니다. 이를 통해 단일 GPU를 다수의 사용자 또는 워크로드가 동시에 활용할 수 있으며, AI, HPC, 클라우드 환경에서 GPU 활용도를 극대화합니다.1. 개념 및 정의 항목 내용 비고 정의하나의 GPU를 여러 개의 독립적 GPU 인스턴스로 분리하여 병렬 사용 가능하게 하는 기술NVIDIA Ampere/Hopper 기반목적GPU 자원의 효율적 분배 및 멀티테넌트 환경 지원리소스 낭비 최소화필요성AI/ML, 클라우드, 데이터센터에서 다양한 워크로드 병행 수행 필요GPU 가상화의 핵심..

Topic 2025.12.16

GPU Leasing Marketplace (GPUL)

개요GPU Leasing Marketplace(GPUL)는 유휴 GPU 자원을 필요로 하는 수요자와, 이를 임대하고자 하는 공급자 간의 거래를 중개하는 플랫폼이다. 클라우드 서비스의 고비용·자원 부족 문제를 보완하면서, AI·머신러닝·영상처리 등의 연산 집약적 워크로드에 필요한 GPU 인프라를 실시간으로 확보할 수 있도록 한다.1. 개념 및 정의 항목 설명 정의GPU 자원을 임대하고 빌릴 수 있는 디지털 중개 플랫폼으로, 온디맨드 GPU 공유를 가능케 함목적고성능 컴퓨팅(GPU) 자원의 유휴화 방지와 수요자 중심의 확장성 제공필요성AI 붐에 따른 GPU 수요 폭증, 클라우드 GPU 한정성, 고비용 문제 해결 위한 대안2. 특징특징설명기존 인프라 대비 차별점실시간 임대수요에 맞춰 즉시 GPU 확보 가능기..

Topic 2025.07.18

VFIO-PCI Passthrough

개요VFIO-PCI Passthrough는 가상 머신(Guest OS)에 호스트의 물리적인 PCI 장치를 직접 할당하여, 거의 네이티브 수준의 성능으로 접근할 수 있도록 하는 가상화 기술입니다. KVM(QEMU) 환경에서 주로 사용되며, GPU, NIC, NVMe 등의 장치에 대한 직접적인 DMA 접근을 가능하게 해 고성능 컴퓨팅 환경에서 필수적인 요소로 자리 잡고 있습니다.1. 개념 및 정의 항목 설명 정의VFIO(Virtual Function I/O)를 이용하여 PCI 장치를 게스트 VM에 직접 할당하는 가상화 기법주요 목적낮은 레이턴시, 높은 대역폭을 요구하는 워크로드에 적합구성 환경KVM, QEMU, libvirt, IOMMU (VT-d/AMD-Vi) 필수VFIO는 사용자 공간에서 장치 접근을 ..

Topic 2025.06.12

IOMMU (Input-Output Memory Management Unit)

개요IOMMU(Input-Output Memory Management Unit)는 CPU와 메모리 사이에 존재하는 메모리 관리 장치처럼, I/O 디바이스가 메모리 접근을 할 때 주소를 변환하고 접근 권한을 제어하는 하드웨어 컴포넌트입니다. 특히 DMA(Direct Memory Access)를 사용하는 장치와의 안전한 데이터 통신, 그리고 가상화 환경에서 보안성과 효율성을 동시에 제공하는 핵심 기술로 활용됩니다.1. 개념 및 정의 항목 설명 정의I/O 장치가 메인 메모리에 직접 접근할 수 있도록 주소 변환 및 접근 제어를 수행하는 하드웨어 유닛주요 기능주소 변환, 접근 권한 검증, DMA 보호유사 구성MMU(Memory Management Unit)의 I/O 버전IOMMU는 주로 서버, 가상 머신, 고속..

Topic 2025.06.12
728x90
반응형