728x90
반응형

2025/11/12 2

Apache SeaTunnel

개요Apache SeaTunnel(이전명 Waterdrop)은 대규모 데이터 통합(Data Integration) 및 실시간 스트리밍 처리를 위한 오픈소스 플랫폼입니다. 다양한 데이터 소스와 싱크(Sink)를 연결하여 배치 및 스트리밍 데이터를 효율적으로 처리하며, Spark, Flink 등 분산 처리 엔진 위에서 동작합니다. 단순한 설정 기반으로 복잡한 ETL(Extract, Transform, Load) 파이프라인을 구성할 수 있어 클라우드 및 데이터레이크 환경에서 폭넓게 활용됩니다.1. 개념 및 정의 항목 내용 비고 정의실시간 및 배치 데이터 통합을 위한 오픈소스 데이터 파이프라인 플랫폼Apache Software Foundation 프로젝트목적다양한 데이터 소스를 연결하여 효율적인 데이터 전송 및..

Topic 2025.11.12

Kafka Streams

개요Kafka Streams는 Apache Kafka에서 제공하는 스트림 프로세싱 라이브러리로, 실시간 데이터 파이프라인 및 이벤트 기반 애플리케이션을 개발하기 위해 설계되었다. 분산 스트림 프로세싱 프레임워크를 직접 구축할 필요 없이, 단일 애플리케이션 수준에서 고성능의 데이터 변환, 집계, 윈도우 연산 등을 수행할 수 있다.1. 개념 및 정의 항목 내용 비교 개념Kafka 토픽에서 데이터를 읽고, 실시간으로 처리 후 다시 토픽으로 내보내는 라이브러리Apache Flink, Spark Streaming 대비 경량목적실시간 데이터 변환 및 이벤트 처리마이크로서비스 통합 용이필요성대규모 스트리밍 데이터의 저지연 처리로그, IoT, 금융 트랜잭션 등2. 특징특징설명비교경량 구조Kafka 클라이언트 라이브..

Topic 2025.11.12
728x90
반응형