728x90
반응형

HPC 23

AI Supercomputing Platform

개요AI Supercomputing Platform은 대규모 인공지능 모델의 학습과 추론을 위해 설계된 초고성능 컴퓨팅 인프라를 의미한다. 기존 슈퍼컴퓨터가 과학 계산 중심이었다면, AI 슈퍼컴퓨팅은 LLM, 멀티모달 AI, 자율 시스템 등 AI 워크로드에 최적화된 구조를 갖는다. NVIDIA DGX, Microsoft Azure AI Supercomputer, OpenAI 인프라 등이 대표 사례로, 수천~수만 개의 GPU를 활용한 초병렬 처리 구조가 특징이다.1. 개념 및 정의AI Supercomputing Platform은 대규모 AI 모델의 학습 및 실행을 위해 GPU/TPU 기반의 초고성능 연산과 고속 네트워크, 분산 시스템을 결합한 컴퓨팅 플랫폼이다.2. 특징구분설명비교/차별점초대규모 병렬 처리..

Topic 2026.05.25

AI for Science

개요AI for Science는 인공지능(AI)을 활용하여 물리학, 화학, 생명과학, 기후과학 등 다양한 과학 분야의 연구를 혁신적으로 가속화하는 접근 방식이다. 대규모 데이터 분석, 시뮬레이션, 패턴 발견, 신약 개발 등 기존 연구 방식으로는 수십 년이 걸릴 문제를 단축할 수 있으며, 최근 AlphaFold, Materials Discovery AI 등 사례를 통해 그 효과가 입증되고 있다.1. 개념 및 정의AI for Science는 과학적 문제 해결을 위해 머신러닝, 딥러닝, 시뮬레이션 AI 등을 활용하여 새로운 지식 발견과 연구 효율을 극대화하는 기술 및 방법론이다.2. 특징구분설명비교/차별점데이터 기반 연구대규모 데이터 분석실험 중심 연구 대비 속도 향상예측 능력미래 결과 예측단순 분석 대비 활..

Topic 2026.05.24

AI Supercomputing Platform

개요AI Supercomputing Platform은 대규모 인공지능 모델 학습과 추론을 위해 설계된 초고성능 컴퓨팅 인프라이다. GPU, NPU, 고속 네트워크, 분산 스토리지 등을 결합하여 수십억~수조 개의 파라미터를 가진 모델을 처리할 수 있도록 한다. ChatGPT와 같은 LLM, 자율주행, 기후 시뮬레이션 등 다양한 분야에서 핵심 역할을 수행한다.1. 개념 및 정의AI 슈퍼컴퓨팅 플랫폼은 대규모 병렬 연산을 기반으로 AI 워크로드를 처리하기 위해 최적화된 컴퓨팅 시스템이다. 이는 기존 HPC(High Performance Computing)를 AI 중심으로 확장한 형태로, 학습 속도와 효율성을 극대화하는 것이 목적이다.2. 특징항목설명영향초대규모 병렬 처리수천~수만 GPU 사용학습 속도 증가고속..

Topic 2026.05.09

Heterogeneous Integration

개요이종 집적(Heterogeneous Integration)은 서로 다른 공정, 기능, 소재로 제작된 반도체 칩들을 하나의 시스템으로 통합하는 기술이다. 기존 단일 칩 기반(SoC)의 한계를 극복하고, 성능·전력·비용을 최적화하기 위해 등장하였다. AI, HPC, 5G, 자율주행 등 고성능 컴퓨팅 시대에서 핵심 기술로 부상하고 있으며, Chiplet, SiP, 3D 패키징과 밀접하게 연관된다.1. 개념 및 정의이종 집적은 CPU, GPU, 메모리, RF, 센서 등 서로 다른 기능과 제조 공정을 가진 칩을 하나의 패키지 또는 시스템으로 결합하여 동작하도록 하는 기술이다. 이를 통해 각 기능별 최적 공정을 활용하면서도 하나의 시스템처럼 통합된 성능을 제공한다.2. 특징항목설명영향이종 결합서로 다른 공정/기..

Topic 2026.05.05

TSV (Through-Silicon Via)

개요TSV(Through-Silicon Via)는 실리콘 웨이퍼를 관통하는 수직 전기 연결 구조로, 반도체 칩을 3차원으로 적층(3D Stacking)하여 고성능, 고대역폭, 저전력 시스템을 구현하는 핵심 기술이다. 기존 2D 패키징의 한계를 극복하고 데이터 이동 거리를 획기적으로 줄일 수 있어, HBM(High Bandwidth Memory), AI 칩, 고성능 컴퓨팅(HPC) 분야에서 필수 기술로 자리 잡고 있다.1. 개념 및 정의TSV는 실리콘 칩 내부를 수직으로 관통하는 미세한 전도성 비아(Via)를 형성하여, 칩 간 전기적 연결을 구현하는 기술이다. 이를 통해 여러 칩을 수직으로 적층하면서도 고속 데이터 통신이 가능하다.2. 특징항목설명영향수직 연결 구조칩을 관통하는 전기 연결고집적 설계고대역폭..

Topic 2026.05.05

MCM (Multi-Chip Module)

개요MCM(Multi-Chip Module)은 여러 개의 반도체 칩을 하나의 모듈(패키지 또는 기판)에 집적하여 고성능 시스템을 구현하는 기술이다. SiP와 유사하지만, 주로 고성능 컴퓨팅(HPC) 및 서버 환경에서 사용되며, 칩 간 고속 인터커넥트를 통해 시스템 성능을 극대화하는 데 초점을 둔다. 최근 AI, 데이터센터, GPU 설계에서 핵심 기술로 활용되고 있다.1. 개념 및 정의MCM은 CPU, GPU, 메모리 등 여러 기능을 가진 칩들을 하나의 기판 위에 배치하고 고속 연결을 통해 단일 시스템처럼 동작하도록 구성한 반도체 모듈 기술이다. 단일 칩 설계의 한계를 극복하기 위한 대안으로 활용된다.2. 특징항목설명영향다중 칩 통합여러 IC를 하나의 모듈로 구성성능 확장고속 인터커넥트칩 간 빠른 데이터 ..

Topic 2026.05.04

PolarQuant

개요PolarQuant는 AI와 고성능 컴퓨팅(HPC)을 기반으로 금융 및 데이터 분석 영역에서 초고속 정량 분석을 수행하기 위한 차세대 프레임워크 개념이다. 특히 대규모 데이터 처리와 복잡한 모델링이 필요한 환경에서 효율적인 의사결정을 지원하는 것이 핵심 목표이며, 머신러닝과 최적화 알고리즘을 결합한 것이 특징이다.1. 개념 및 정의PolarQuant는 정량 분석(Quantitative Analysis)에 AI 및 고성능 컴퓨팅 기술을 결합하여 대규모 데이터를 실시간으로 처리하고 최적의 의사결정을 도출하는 분석 플랫폼이다. 기존의 통계 기반 모델을 넘어 딥러닝과 강화학습을 활용하여 예측 정확도를 높이고 자동화된 분석 환경을 제공한다.2. 특징구분설명비교 요소AI 기반 분석딥러닝 및 ML 활용전통적 통계..

Topic 2026.04.20

HPL-MxP (High Performance Linpack - Mixed Precision)

개요HPL-MxP(High Performance Linpack for Mixed Precision)는 기존 HPL 벤치마크(HPL Classic)의 확장으로, AI 및 HPC 워크로드의 혼합 정밀도(Mixed Precision) 연산 성능을 평가하기 위한 벤치마크입니다. FLOP 수치를 기준으로 시스템의 실제 AI/ML 연산 처리 능력을 반영하기 위해 도입되었으며, TOP500, Green500 등의 슈퍼컴퓨터 순위 평가에서 중요한 지표로 사용됩니다.1. 개념 및 정의 항목 내용 비고 정의AI/ML 환경에서 혼합 정밀도 행렬 연산을 수행하는 Linpack 기반 벤치마크HPL-AI → HPL-MxP로 진화목적AI 정밀도(예: FP16)와 과학 계산용 정밀도(FP64)를 함께 고려한 실측 성능 측정Pea..

Topic 2026.01.07

GPUDirect RDMA

개요GPUDirect RDMA(Remote Direct Memory Access)는 NVIDIA가 개발한 GPU 메모리 직접 액세스 기술로, GPU와 네트워크 인터페이스 카드(NIC) 간 데이터 전송 시 CPU를 거치지 않고 직접 메모리 간 통신을 수행합니다. 이를 통해 지연(latency)을 최소화하고 데이터 전송 효율을 극대화하여 HPC(High Performance Computing), AI 트레이닝, 데이터센터 통신 등에 최적화된 성능을 제공합니다.1. 개념 및 정의 항목 내용 비고 정의GPU 메모리와 네트워크 인터페이스 간 직접 메모리 접근을 지원하는 기술NVIDIA GPUDirect API 기반목적CPU 개입 없이 데이터 전송 효율 향상지연 최소화 및 대역폭 최적화필요성AI·HPC 워크로드..

Topic 2025.12.17

DCQCN (Data Center Quantized Congestion Notification)

개요DCQCN(Data Center Quantized Congestion Notification)은 데이터센터 네트워크의 RoCEv2 (RDMA over Converged Ethernet) 환경에서 혼잡을 효율적으로 제어하기 위한 전송 프로토콜입니다. IEEE 802.1Qau QCN(Quantized Congestion Notification) 표준을 기반으로 하며, 저지연·고대역폭·무손실 네트워크(Zero Loss Network) 구현을 목표로 합니다.1. 개념 및 정의 항목 내용 비고 정의RoCEv2 네트워크에서 혼잡을 제어하기 위해 설계된 TCP-친화적 혼잡 제어 알고리즘Mellanox/NVIDIA 주도 개발목적혼잡 시 대역폭 효율적 사용과 패킷 손실 방지RDMA 트래픽 안정화필요성데이터센터 내..

Topic 2025.11.17

EDSFF E1.S / E3.S

개요EDSFF(Enterprise and Data Center SSD Form Factor)는 데이터센터와 엔터프라이즈 환경을 위해 설계된 SSD(솔리드 스테이트 드라이브) 폼팩터 표준이다. E1.S와 E3.S는 기존 U.2, M.2 폼팩터의 한계를 극복하고, 고성능·고밀도·발열 관리 최적화 측면에서 데이터센터 SSD의 새로운 표준으로 자리잡고 있다.1. 개념 및 정의 항목 내용 설명 정의EDSFF (Enterprise & Data Center SSD Form Factor)데이터센터 최적화 SSD 폼팩터 규격E1.S1U 서버용 고밀도 SSDM.2 대체, 발열 및 교체성 강화E3.S2U 이상 서버 및 스토리지용 SSDU.2 대체, 확장성과 호환성 최적화EDSFF는 대규모 클라우드, AI, HPC 워크로..

Topic 2025.10.06

PFC (Priority Flow Control)

개요PFC(Priority Flow Control)는 IEEE 802.1Qbb 표준으로 정의된 이더넷 흐름 제어 기술로, 데이터센터 네트워크에서 특정 트래픽 클래스(Class of Service)에 대해 손실 없는 전송을 보장한다. RDMA over Converged Ethernet(RoCE)과 같은 초저지연 애플리케이션 환경에서 필수적인 기술로, 네트워크 혼잡으로 인한 패킷 손실을 방지한다.1. 개념 및 정의 항목 내용 설명 정의PFC (Priority Flow Control)트래픽 클래스 단위 흐름 제어 기술목적손실 없는 데이터 전송 보장네트워크 혼잡 시 패킷 드롭 방지필요성HPC, AI/ML, 스토리지 네트워크무손실·저지연 통신 요구PFC는 전통적인 PAUSE 프레임을 확장하여, 전체 링크가 아..

Topic 2025.10.06

RoCEv2 (RDMA over Converged Ethernet v2)

개요RoCEv2(RDMA over Converged Ethernet version 2)는 데이터센터 네트워크에서 RDMA(Remote Direct Memory Access)를 이더넷 상에서 구현하기 위한 프로토콜이다. RoCE의 확장 버전으로, L2에 국한되었던 기존 RoCE를 넘어 L3 라우팅 환경에서도 RDMA를 지원하여 확장성과 유연성을 대폭 강화했다.1. 개념 및 정의 항목 내용 설명 정의RoCEv2L3 네트워크 기반 RDMA 프로토콜목적고성능 저지연 데이터 전송CPU 개입 최소화 및 성능 최적화필요성대규모 클라우드·AI 워크로드 증가초저지연·고대역폭 네트워크 필요RoCEv2는 데이터센터의 HPC(고성능 컴퓨팅), AI/ML, 클라우드 워크로드에서 핵심 네트워크 기술로 자리잡고 있다.2. 특징..

Topic 2025.10.06

Kueue

개요클라우드 네이티브 환경에서 AI/ML, HPC(고성능 컴퓨팅), 데이터 분석 등 배치 워크로드(batch workload) 실행 수요가 급격히 증가하고 있습니다. 하지만 기본 Kubernetes 스케줄러는 배치 처리에 특화되지 않아, 대규모 리소스 관리와 공정성(Fairness) 보장에 한계가 있습니다. 이를 해결하기 위해 CNCF 산하에서 개발된 프로젝트가 바로 Kueue입니다.1. 개념 및 정의Kueue는 Kubernetes 환경에서 배치 워크로드를 효율적으로 스케줄링하고 큐 관리 기능을 제공하는 오픈소스 프레임워크입니다.주요 목적은 리소스 활용 최적화, 공정한 배치 실행, 클라우드 네이티브 워크로드 자동화입니다.2. 특징 특징 기존 Kubernetes 스케줄러 Kueue 배치 처리제한적대규모..

Topic 2025.09.13

Fabric-Attached Memory (FAM)

개요Fabric-Attached Memory(FAM)는 CPU와 직접 연결되지 않고, 고속 패브릭(Fabric) 네트워크를 통해 여러 컴퓨팅 노드에서 공유/접근 가능한 메모리 아키텍처입니다. 이는 메모리와 컴퓨팅 리소스의 분리(disaggregation)를 가능하게 하여, 확장성과 유연성을 극대화하는 새로운 데이터 중심 컴퓨팅 모델을 실현합니다. FAM은 특히 고성능 컴퓨팅(HPC), 대규모 AI 분석, 데이터베이스, 인메모리 컴퓨팅 환경에서 각광받고 있습니다.1. 개념 및 정의Fabric-Attached Memory는 기존의 CPU 중심 메모리 구조와 달리, 메모리를 시스템 메모리가 아닌 네트워크를 통해 공유 자원처럼 사용하는 기술입니다. CPU, GPU, FPGA 등 다양한 연산 자원이 메모리 풀에 ..

Topic 2025.07.22

Cold-Plate Liquid Cooling-as-a-Service

개요AI 모델의 대형화, 고밀도 GPU 클러스터, HPC(High Performance Computing) 수요 증가에 따라 데이터센터는 기존 공냉 방식으로는 감당하기 어려운 고열밀도(Higher Heat Density) 문제에 직면하고 있습니다. 이에 대응하는 혁신 기술로 주목받는 것이 **Cold-Plate 기반 액침 냉각(Liquid Cooling)**입니다. 최근에는 이 기술이 **서비스 형태(aaS)**로 제공되는 Cold-Plate Liquid Cooling-as-a-Service(CPLaaS) 모델로 진화하고 있습니다. 이 글에서는 해당 기술의 개념, 구성, 도입 효과 및 전략적 의의에 대해 살펴봅니다.1. 개념 및 정의Cold-Plate Liquid Cooling은 금속 플레이트 내부를 흐..

Topic 2025.07.10

Glass-Core Substrate Packaging

개요반도체 소자의 고성능화와 집적도가 급격히 증가함에 따라, 칩 패키징 기술의 중요성이 날로 커지고 있습니다. 그중에서도 Glass-Core Substrate Packaging(글래스 코어 기판 패키징)은 고집적, 저전력, 고신뢰성 요구를 충족하는 차세대 패키징 솔루션으로 주목받고 있습니다. 유리(glass)를 코어로 사용하는 이 방식은 기존 유기물(Organic) 기반이나 세라믹 기반 패키징 대비 우수한 전기적·기계적 특성을 제공합니다.1. 개념 및 정의Glass-Core Substrate Packaging은 반도체 패키지의 중심 기판(core substrate)을 유리(glass) 재질로 대체한 고밀도 인터커넥트 패키징 기술입니다. 전통적으로는 BT(비스말레이드 트리아진)와 같은 유기기판이 사용되어 ..

Topic 2025.05.23

Compute Express Link (CXL)

개요**Compute Express Link(CXL)**는 고속, 저지연, 효율적인 CPU-가속기/메모리 간 상호 연결을 위한 개방형 인터페이스 표준으로, 인텔(Intel)을 중심으로 주요 반도체 기업들이 주도하고 있는 차세대 I/O 기술입니다. CXL은 PCIe 5.0 기반으로 설계되어 메모리 공유, 캐시 일관성 유지, 연산 자원의 유연한 확장을 가능하게 하며, AI/ML, HPC, 클라우드 환경에서 핵심 기술로 각광받고 있습니다.1. 개념 및 정의CXL은 CPU와 디바이스(메모리 확장 장치, GPU, SmartNIC 등) 간의 고속 데이터 전송 및 메모리 일관성 유지를 목표로 설계된 인터커넥트입니다. CXL은 세 가지 프로토콜을 하나의 물리적 인터페이스에서 지원합니다:CXL.io: PCIe와 동일한 ..

Topic 2025.05.17

HBM3(High Bandwidth Memory 3)

개요HBM3(High Bandwidth Memory 3)는 기존 DRAM 기술을 뛰어넘는 초고속, 고대역폭, 저전력 메모리 기술로서, AI, 고성능 컴퓨팅(HPC), 그래픽 처리, 데이터센터 분야의 차세대 워크로드를 위한 핵심 메모리로 부상하고 있습니다. HBM3는 JEDEC 표준 기반으로, HBM2E 대비 대역폭과 용량이 획기적으로 향상되었으며, GPU 및 DPU, AI 가속기에 통합되어 높은 연산 성능을 실현합니다.1. 개념 및 정의HBM3는 다층 3D TSV(Through-Silicon Via) 스택 구조를 기반으로 하는 고성능 DRAM 인터페이스 기술입니다. 메모리 다이를 수직으로 적층하고, 초고속 인터페이스를 통해 프로세서에 밀착 배치함으로써 기존 DDR 기반 메모리보다 수배 높은 대역폭을 제공..

Topic 2025.05.06

메모리 공유 방식 분류(Memory Architecture Classification)

개요메모리 공유 방식 분류는 다중 프로세서 또는 코어가 메모리 자원을 어떻게 접근하고 관리하는지에 따라 병렬 컴퓨팅 구조를 분류하는 체계입니다. 이는 병렬 시스템의 성능, 확장성, 프로그래밍 모델에 큰 영향을 미치며, 컴퓨터 아키텍처 설계 및 고성능 컴퓨팅(HPC) 구현 시 중요한 고려 요소로 작용합니다.1. 개념 및 정의메모리 공유 방식은 여러 처리 장치가 메모리를 공유하는 구조인지, 또는 각자 독립적인 메모리를 가지며 메시지를 통해 통신하는지에 따라 크게 **공유 메모리 모델(Shared Memory Model)**과 **분산 메모리 모델(Distributed Memory Model)**로 나뉘며, 최근에는 **하이브리드 모델(Hybrid Memory Model)**이 널리 사용되고 있습니다.2. 분..

Topic 2025.04.17

병렬처리 컴퓨팅(Parallel Computing)

개요병렬처리 컴퓨팅(Parallel Computing)은 대규모 연산 작업을 여러 개의 프로세서 또는 코어에 동시에 분산 처리하여 성능을 향상시키는 컴퓨팅 방식입니다. 과학 기술 계산, 인공지능, 그래픽 렌더링, 시뮬레이션 등 막대한 처리량이 요구되는 분야에서 핵심 기술로 자리 잡고 있으며, CPU와 GPU, 클러스터 및 클라우드 인프라까지 다양한 환경에서 적용되고 있습니다.1. 개념 및 정의병렬 컴퓨팅은 단일 작업을 여러 개의 작은 작업으로 나누어 동시에 실행하는 방식으로, 처리 시간을 줄이고 자원을 효율적으로 활용하는 것이 목적입니다. 이는 하드웨어 아키텍처와 소프트웨어 알고리즘이 유기적으로 작동해야 하며, 동기화 및 통신 비용도 함께 고려되어야 합니다.2. 특징 특징 설명 비고 다중 처리여러 프..

Topic 2025.04.17

HPC & 엑사스케일 컴퓨팅(High-Performance Computing & Exascale)

개요HPC(High-Performance Computing, 고성능 컴퓨팅)는 대규모 병렬 처리 시스템을 통해 복잡하고 방대한 계산을 신속히 수행하는 컴퓨팅 기술입니다. 과학 시뮬레이션, 기후 모델링, 인공지능, 생명공학 등 데이터 집약적 분야에 필수적이며, 그 정점에 있는 것이 바로 **엑사스케일 컴퓨팅(Exascale Computing)**입니다. 엑사스케일은 초당 10^18번의 연산(ExaFLOPS)을 처리할 수 있는 컴퓨팅 성능으로, 기존 페타스케일(10^15 FLOPS)을 넘어서는 차세대 슈퍼컴퓨터의 기준입니다.1. 개념 및 정의 용어 정의 HPC고성능 서버, 슈퍼컴퓨터, 클러스터를 활용해 대규모 병렬 처리를 수행하는 컴퓨팅 기술Exascale Computing초당 1엑사플롭스(10^18 FL..

Topic 2025.03.27

High Bandwidth Memory(HBM)

개요High Bandwidth Memory(HBM)는 기존 DRAM보다 높은 대역폭과 낮은 전력 소비를 제공하는 고성능 메모리 기술입니다. HBM은 3D TSV(Through-Silicon Via) 기술을 이용하여 여러 개의 DRAM 다이를 수직으로 적층(stack)하여 높은 메모리 대역폭을 제공하며, GPU, AI/ML 가속기, 데이터센터, 고성능 컴퓨팅(HPC) 분야에서 널리 사용됩니다. 본 글에서는 HBM의 개념과 특징, 기존 메모리와의 비교, 주요 활용 사례 및 최신 트렌드를 살펴봅니다. 1. High Bandwidth Memory(HBM)란?HBM은 기존 DDR 및 GDDR 메모리의 대역폭 한계를 극복하기 위해 개발된 고속 메모리 기술입니다. HBM은 여러 개의 DRAM 다이를 적층하여 TSV ..

Topic 2025.03.14
728x90
반응형