728x90
반응형

데이터 엔지니어링 2

Declarative DAG

개요Declarative DAG(선언형 비순환 그래프)는 데이터 파이프라인을 구성할 때, ‘무엇을 실행할 것인가’를 정의함으로써 시스템이 ‘어떻게 실행할 것인가’를 자동으로 결정하도록 하는 워크플로우 설계 방식이다. Airflow, Dagster, Prefect 등 최신 데이터 오케스트레이션 도구들이 선언형 접근을 채택하면서 생산성, 재현성, 테스트 가능성을 높이고 있다.1. 개념 및 정의Declarative DAG는 워크플로우 구성 요소(태스크, 데이터 흐름 등)를 명령형 코드 대신 구성 정보나 선언적 정의로 기술하여, 엔진이 내부적으로 실행 계획(DAG)을 자동 구성하는 방식이다.목적: 실행 방식보다 결과 중심 정의로 복잡도 감소 및 유지보수 용이성 확보핵심 원리: 시스템이 의존성과 실행 순서를 자동..

Topic 2025.07.12

SQLMesh

개요SQLMesh는 SQL 기반의 데이터 워크플로우를 보다 체계적이고 안정적으로 관리하기 위한 오픈소스 데이터 오케스트레이션 프레임워크이다. 모델 버전 관리, 테스트, 캐싱, 재현성 확보 등 데이터 엔지니어링의 복잡성을 획기적으로 줄이기 위해 설계되었다. dbt의 대안 또는 보완재로 주목받으며, 프로덕션 수준의 데이터 파이프라인 구현을 단순화한다.1. 개념 및 정의SQLMesh는 Python 없이도 SQL만으로 데이터 파이프라인의 정의, 테스트, 실행, 변경 관리까지 가능한 플랫폼으로, 특히 데이터 모델의 변경 사항을 추적하고 안전하게 배포하는 기능에 초점을 맞추고 있다.목적: SQL로 데이터 모델링과 파이프라인을 구성하며 데이터 품질과 유지관리성을 확보기반 원리: SQL-centric 접근으로 DevO..

Topic 2025.07.12
728x90
반응형