728x90
반응형

Flink 3

One Table (Lakehouse Multi-Engine Table Spec)

개요One Table은 Lakehouse 아키텍처에서 다양한 데이터 처리 엔진과 분석 플랫폼이 하나의 테이블 형식으로 읽고 쓸 수 있도록 지원하는 다중 엔진 호환 테이블 사양(Multi-Engine Table Spec)이다. Apache Iceberg와 Delta Lake 포맷을 상호 운용 가능하게 만드는 사양으로, 개방성과 호환성, 확장성 측면에서 데이터 생태계에 중요한 전환점을 제공한다.1. 개념 및 정의One Table은 데이터가 저장된 단일 테이블을 Iceberg, Delta Lake, Apache Spark, Trino, Flink, Hive, Dremio, Snowflake 등 다양한 엔진이 동일한 규격으로 읽고 쓸 수 있도록 중재하는 메타데이터 구조 및 포맷 인터페이스다. 구성 요소 설명 ..

Topic 2025.06.24

Streaming DB

개요Streaming DB는 정적 데이터를 대상으로 하는 전통적인 RDBMS와 달리, 연속적으로 발생하는 실시간 데이터를 처리·분석·저장하는 데이터베이스 시스템입니다. IoT 센서, 실시간 사용자 이벤트, 금융 거래, 로그 스트림 등 고속·고빈도 데이터에 적합하며, Kafka, Pulsar 등의 메시지 브로커와 통합되어, 지연 없이 SQL 기반 실시간 질의 처리를 수행합니다. Flink, Materialize, RisingWave, ksqlDB 등이 대표적입니다.1. 개념 및 정의 항목 설명 정의Streaming DB는 스트림 형태의 데이터에 대해 SQL 또는 DSL 기반 연속 질의를 수행하며, 결과를 실시간으로 갱신하는 데이터베이스입니다.목적이벤트가 발생하는 즉시 분석과 반응을 가능하게 하여, 의사결..

Topic 2025.05.16

패스트데이터(Fast Data)

개요패스트데이터(Fast Data)는 빅데이터의 ‘크기’ 중심 패러다임에서 ‘속도’ 중심으로 진화한 개념입니다. 즉, 대용량 데이터를 쌓아 분석하는 것이 아니라, 데이터가 생성되자마자 바로 처리하고 활용하는 실시간 분석 기술 및 전략을 말합니다. 실시간 모니터링, 즉시 대응, 스트리밍 분석이 요구되는 산업 전반에서 패스트데이터는 핵심 경쟁력으로 부상하고 있습니다.1. 패스트데이터란? 항목 설명 정의데이터가 생성되자마자 저장 전에 실시간으로 처리·분석하는 데이터 흐름 처리 방식특징초저지연성, 이벤트 기반, 실시간 스트리밍, 짧은 수명 데이터 중심관련 기술Kafka, Flink, Spark Streaming, Apache Pulsar, Apache Beam, Redis Streams패스트데이터는 ‘데이터 ..

Topic 2025.04.21
728x90
반응형