728x90
반응형

데이터 가상화 3

Apache Calcite

개요Apache Calcite는 다양한 데이터 소스에 대한 쿼리 최적화, SQL 파싱, 관계형 연산 변환 등을 지원하는 오픈소스 미들웨어 프레임워크이다. 스토리지를 포함하지 않으며, DBMS, 데이터 처리 엔진, BI 툴 등에서 SQL 처리를 위한 핵심 컴포넌트로 활용된다. 주로 Apache Flink, Hive, Drill 등 다양한 빅데이터 시스템의 SQL 레이어를 구성하는 데 사용된다.1. 개념 및 정의 항목 설명 정의SQL 구문 분석, 논리/물리 계획 변환, 최적화를 수행하는 미들웨어 라이브러리목적다양한 데이터 소스에 대해 일관된 SQL 인터페이스 제공필요성데이터 이질성, 복잡한 쿼리 플랜 최적화 문제 해결Calcite는 “저장소 없는 데이터베이스”로 불리며 SQL 처리 로직만 제공하는 경량화된..

Topic 2025.12.31

Feature Store Virtualization

개요머신러닝 모델 개발에서 'Feature Store'는 학습에 필요한 피처(특징)를 저장, 관리, 제공하는 핵심 시스템입니다. 최근에는 데이터 복제 없이 다양한 소스에서 피처를 가상화하여 제공하는 Feature Store Virtualization 개념이 부상하고 있습니다. 이는 데이터 사일로를 줄이고 실시간 데이터에 기반한 ML 시스템을 보다 효율적으로 구현할 수 있는 새로운 접근입니다. 본 글에서는 Feature Store Virtualization의 개념, 아키텍처, 기술 요소 및 실제 사례를 심층 분석합니다.1. 개념 및 정의Feature Store Virtualization은 물리적인 데이터 복사 없이, 다양한 데이터 소스에서 피처를 통합하고 가상으로 제공하는 방식의 Feature Store ..

Topic 2025.07.15

Zero-Copy ETL

개요Zero-Copy ETL은 데이터 복제(Copy)를 최소화하거나 제거하고, 원본 데이터 소스에 직접 연결하여 실시간 또는 거의 실시간으로 변환(Transform) 및 로딩(Load)을 수행하는 ETL(Extract-Transform-Load) 전략입니다. 전통적 ETL이 대규모 데이터 복제와 이관을 전제로 하는 반면, Zero-Copy ETL은 성능, 비용, 데이터 거버넌스 측면에서 혁신적 이점을 제공합니다.1. 개념 및 정의 항목 내용 정의데이터 소스를 복제하지 않고, 원본 데이터에 직접 접근하여 변환 및 로딩을 수행하는 데이터 통합 접근 방식목적스토리지 비용 절감, 데이터 최신성 유지, 거버넌스 리스크 감소필요성데이터 폭증, 복제 비용 증가, 데이터 일관성 및 신뢰성 확보 요구 대응Zero-Co..

Topic 2025.05.05
728x90
반응형