728x90
반응형

병렬처리 9

NVLink

개요NVLink는 NVIDIA가 개발한 고속 GPU 인터커넥트 기술로, GPU 간 및 GPU-CPU 간 대역폭과 효율성을 획기적으로 향상시키는 것을 목표로 합니다. 기존의 PCIe 인터페이스의 한계를 극복하고, 대규모 병렬 컴퓨팅 환경에서 탁월한 성능을 발휘하며, AI, HPC(High Performance Computing), 데이터센터 환경에서 핵심적인 역할을 합니다.1. 개념 및 정의NVLink는 NVIDIA GPU 및 CPU 간의 고대역폭, 저지연의 직렬 인터커넥트 기술입니다. 멀티 GPU 환경에서 더 빠른 메모리 공유와 동기화가 가능하도록 설계되어, 데이터 병목을 최소화하고 GPU 간 협업 처리를 원활하게 해줍니다.목적: PCIe 대비 높은 대역폭을 제공하여 GPU 간 병렬 작업 최적화필요성: ..

Topic 2025.05.06

상호연결망(Interconnection Network)

개요상호연결망(Interconnection Network)은 병렬 컴퓨팅 또는 멀티프로세서 시스템에서 프로세서와 메모리, 또는 프로세서 간의 데이터를 연결하고 교환하는 통신 구조를 의미합니다. 클러스터, 슈퍼컴퓨터, GPU 네트워크, AI 연산 플랫폼 등에서 노드 간 빠르고 안정적인 데이터 전송을 위해 필수적인 구성 요소입니다.1. 개념 및 정의상호연결망은 병렬 처리 시스템 내 여러 처리 장치(노드)가 데이터를 주고받는 데 사용하는 물리적 및 논리적 통신 경로의 집합입니다. 이는 단순한 케이블 연결을 넘어서, **토폴로지(Topology), 라우팅(Routing), 스위칭(Switching)**과 같은 요소들이 복합적으로 작용하여 시스템 전체 성능에 큰 영향을 미칩니다.2. 특징 특징 설명 비고 구조..

Topic 2025.04.17

Feng의 분류(Feng’s Classification)

개요Feng의 분류(Feng’s Classification)는 컴퓨터 시스템을 명령어 실행의 시간적·공간적 병렬성 기준에 따라 구분한 컴퓨터 구조 분류 체계입니다. 1972년 Tien-Pei Feng 교수가 제안한 이 모델은 Flynn의 분류가 데이터와 명령어 스트림의 수에 따른 구조 구분에 초점을 둔 반면, 하드웨어 단위의 병렬성 수준을 정량적으로 표현할 수 있다는 점에서 차별화됩니다.1. 개념 및 정의Feng의 분류는 컴퓨터 구조를 "연산 단위(Arithmetic Units)"와 "명령어 실행 타임슬롯" 기준으로 공간-시간적 명령어 흐름 패턴에 따라 4가지로 구분합니다. 이를 통해 컴퓨터가 주어진 시간과 자원에서 얼마나 병렬적으로 명령어를 실행할 수 있는지 측정할 수 있으며, **기계 명령어 실행율(..

Topic 2025.04.17

Flynn의 분류(Flynn’s Taxonomy)

개요Flynn의 분류(Flynn’s Taxonomy)는 컴퓨터 아키텍처를 **명령어 스트림(Instruction Stream)**과 **데이터 스트림(Data Stream)**의 처리 방식에 따라 네 가지 유형으로 나누는 분류 체계입니다. 1966년 Michael J. Flynn이 제안한 이 분류는 컴퓨터 시스템의 병렬성(parallelism) 구조를 이해하고 설계 방향을 구분하는 데 중요한 기준으로 활용됩니다.1. 개념 및 정의Flynn의 분류는 하나 또는 다수의 명령어와 데이터 스트림을 처리하는 시스템을 다음 네 가지 유형으로 구분합니다:SISD (Single Instruction, Single Data)SIMD (Single Instruction, Multiple Data)MISD (Multiple..

Topic 2025.04.17

병렬처리 컴퓨팅(Parallel Computing)

개요병렬처리 컴퓨팅(Parallel Computing)은 대규모 연산 작업을 여러 개의 프로세서 또는 코어에 동시에 분산 처리하여 성능을 향상시키는 컴퓨팅 방식입니다. 과학 기술 계산, 인공지능, 그래픽 렌더링, 시뮬레이션 등 막대한 처리량이 요구되는 분야에서 핵심 기술로 자리 잡고 있으며, CPU와 GPU, 클러스터 및 클라우드 인프라까지 다양한 환경에서 적용되고 있습니다.1. 개념 및 정의병렬 컴퓨팅은 단일 작업을 여러 개의 작은 작업으로 나누어 동시에 실행하는 방식으로, 처리 시간을 줄이고 자원을 효율적으로 활용하는 것이 목적입니다. 이는 하드웨어 아키텍처와 소프트웨어 알고리즘이 유기적으로 작동해야 하며, 동기화 및 통신 비용도 함께 고려되어야 합니다.2. 특징 특징 설명 비고 다중 처리여러 프..

Topic 2025.04.17

SMP vs MPP (Shared Memory vs Massively Parallel Processing)

개요SMP(Shared Memory Processing)와 MPP(Massively Parallel Processing)는 고성능 컴퓨팅 시스템의 대표적인 병렬 아키텍처 모델입니다. 둘 다 병렬 처리 성능을 극대화하기 위한 구조지만, 메모리 접근 방식, 확장성, 처리 효율성 등에서 큰 차이를 보이며, 각각의 특성에 따라 적합한 사용 사례가 달라집니다. 본 글에서는 SMP와 MPP의 개념, 구성, 차이점 및 실제 활용 분야를 비교 분석합니다.1. 개념 및 정의SMP (Shared Memory Processing): 여러 CPU가 하나의 공유 메모리 공간을 이용하여 데이터를 동시에 접근하고 처리하는 방식MPP (Massively Parallel Processing): 각 프로세서가 독립된 메모리를 가지며, ..

Topic 2025.04.11

NUMA (Non-Uniform Memory Access)

개요NUMA(Non-Uniform Memory Access)는 다중 프로세서 시스템에서 각 CPU가 로컬 메모리에 빠르게 접근하고, 다른 CPU의 메모리에 상대적으로 느리게 접근하는 메모리 구조입니다. 고성능 컴퓨팅, 대형 서버, 클라우드 시스템에서 처리 성능과 확장성을 높이기 위해 필수적인 아키텍처입니다.1. 개념 및 정의NUMA는 SMP(Symmetric Multi-Processing)의 확장된 형태로, CPU마다 고유의 메모리 영역(Node)을 갖고 있습니다. 각 CPU는 자신의 로컬 메모리에는 빠르게 접근할 수 있지만, 다른 CPU의 메모리(Node)에 접근할 경우 상대적으로 긴 지연 시간(latency)이 발생합니다. 이는 메모리 접근 속도의 '비균일성(Non-Uniform)'에서 유래한 용어입..

Topic 2025.04.05

HPC & 엑사스케일 컴퓨팅(High-Performance Computing & Exascale)

개요HPC(High-Performance Computing, 고성능 컴퓨팅)는 대규모 병렬 처리 시스템을 통해 복잡하고 방대한 계산을 신속히 수행하는 컴퓨팅 기술입니다. 과학 시뮬레이션, 기후 모델링, 인공지능, 생명공학 등 데이터 집약적 분야에 필수적이며, 그 정점에 있는 것이 바로 **엑사스케일 컴퓨팅(Exascale Computing)**입니다. 엑사스케일은 초당 10^18번의 연산(ExaFLOPS)을 처리할 수 있는 컴퓨팅 성능으로, 기존 페타스케일(10^15 FLOPS)을 넘어서는 차세대 슈퍼컴퓨터의 기준입니다.1. 개념 및 정의 용어 정의 HPC고성능 서버, 슈퍼컴퓨터, 클러스터를 활용해 대규모 병렬 처리를 수행하는 컴퓨팅 기술Exascale Computing초당 1엑사플롭스(10^18 FL..

Topic 2025.03.27

OS 스케줄링 알고리즘

개요운영체제(OS)에서 프로세스를 효율적으로 실행하기 위해 CPU 스케줄링 알고리즘이 사용됩니다. 스케줄링 알고리즘은 시스템의 성능을 최적화하고, 응답 시간(Response Time), 대기 시간(Waiting Time), 처리량(Throughput)을 조절하여 멀티태스킹 환경에서의 효율적인 자원 배분을 가능하게 합니다. 본 글에서는 대표적인 스케줄링 기법 중 RM(Rate Monotonic), MLQ(Multi-Level Queue), SQMS(Single Queue Multi-Server), MQMS(Multi-Queue Multi-Server) 알고리즘의 개념과 동작 방식, 장단점 및 활용 사례를 살펴봅니다.1. OS 스케줄링이란?CPU 스케줄링은 다중 프로세스가 실행될 때 CPU를 적절히 분배하는..

Topic 2025.03.14
728x90
반응형