Topic

Apache Pulsar

JackerLab 2025. 10. 18. 00:37
728x90
반응형

개요

Apache Pulsar는 대규모 분산 환경에서 메시징과 스트리밍을 동시에 지원하는 클라우드 네이티브 플랫폼입니다. 멀티 테넌시, 지리적 복제, 무제한 확장성을 제공하며, Kafka의 대안으로 주목받고 있습니다.


1. 개념 및 정의

항목 설명 비고
정의 메시징 및 스트리밍을 통합 제공하는 분산 플랫폼 Apache Software Foundation 프로젝트
목적 고성능, 확장성, 멀티테넌시 지원 실시간 데이터 파이프라인 최적화
필요성 Kafka의 한계(확장성, 멀티 리전 지원)를 극복 클라우드 네이티브 아키텍처

스트리밍과 메시징을 하나의 플랫폼에서 통합 제공합니다.


2. 특징

특징 설명 비교
멀티 테넌시 단일 클러스터에서 다중 사용자/워크로드 지원 Kafka는 멀티 테넌시 제한적
무제한 확장성 스토리지와 컴퓨팅 분리 아키텍처 Kafka는 브로커 기반 확장
지리적 복제 글로벌 분산 환경에서 데이터 동기화 다중 리전 서비스 최적화

Kafka 대비 유연성과 확장성이 강화되었습니다.


3. 구성 요소

구성 요소 설명 예시
Broker 메시지 라우팅 및 클라이언트 요청 처리 Pub/Sub 모델 지원
BookKeeper 메시지 영구 저장을 담당하는 스토리지 계층 Apache BookKeeper 기반
Zookeeper 메타데이터 및 클러스터 조정 메타데이터 관리
Topic/Subscription 메시징 단위 및 소비자 관리 구조 Exclusive, Shared, Failover

스토리지와 컴퓨팅을 분리한 독창적 구조를 채택했습니다.


4. 기술 요소

기술 요소 설명 관련 기술
Pub/Sub 모델 메시징 기반 데이터 분산 처리 이벤트 기반 아키텍처
Tiered Storage 장기 데이터 저장 지원 클라우드 오브젝트 스토리지 연계
Pulsar Functions 경량 서버리스 컴퓨팅 기능 데이터 스트림 내 실시간 처리
SQL 지원 스트리밍 SQL 기반 데이터 분석 Presto, Flink 연동

실시간성과 장기 데이터 관리 기능을 동시에 제공합니다.


5. 장점 및 이점

장점 설명 효과
무제한 확장성 스토리지·컴퓨팅 분리 아키텍처 클라우드 네이티브 환경 최적화
글로벌 지원 지리적 복제 및 멀티 리전 지원 글로벌 서비스 운영 용이
메시징+스트리밍 통합 단일 플랫폼에서 두 가지 기능 제공 운영 복잡성 감소

운영 효율성과 확장성을 동시에 제공합니다.


6. 주요 활용 사례 및 고려사항

활용 사례 설명 고려사항
금융 거래 스트리밍 실시간 이벤트 및 트랜잭션 분석 낮은 지연(latency) 필요
IoT 데이터 처리 센서 데이터 수집 및 스트리밍 분석 대규모 확장성 고려
글로벌 SaaS 다중 리전 서비스 및 데이터 동기화 지리적 복제 구성 필수

Kafka 대비 새로운 운영 모델 학습이 필요합니다.


7. 결론

Apache Pulsar는 클라우드 네이티브 아키텍처 기반의 메시징 및 스트리밍 통합 플랫폼으로, 글로벌 확장성과 유연성을 제공합니다. Kafka의 대안으로 부상하며, 금융, IoT, SaaS 환경에서 중요한 역할을 수행하고 있습니다.

728x90
반응형

'Topic' 카테고리의 다른 글

BPE (Byte-Pair Encoding)  (0) 2025.10.18
SentencePiece  (1) 2025.10.18
Apache Beam  (0) 2025.10.17
Apache Flink  (0) 2025.10.17
TimescaleDB  (0) 2025.10.17