728x90
반응형

데이터워크플로우 2

Dagster

개요Dagster는 데이터 파이프라인을 선언적으로 정의하고, 재사용 가능하며, 디버깅과 테스트가 쉬운 방식으로 관리할 수 있도록 설계된 모던 데이터 오케스트레이션 플랫폼입니다. Airflow, Prefect 등 기존 워크플로우 툴의 단점을 보완하면서 데이터 중심 개발자 경험, 타입 안전성, 실시간 관찰성을 제공하는 것이 특징입니다.1. 개념 및 정의Dagster는 데이터 파이프라인을 코드로 정의하고, 파이프라인 실행 및 스케줄링, 모니터링, 상태 추적을 지원하는 Python 기반 오픈소스 오케스트레이터입니다.목적: 신뢰성 있는 데이터 파이프라인 구축과 운영을 단순화개념 모델: 작업(Task)이 아닌 데이터 흐름 중심의 “Asset” 기반비교 대상: Apache Airflow, Prefect, Luigi ..

Topic 2025.06.17

dbt (Data Build Tool)

개요dbt(Data Build Tool)는 분석 엔지니어가 SQL을 이용해 데이터 웨어하우스 상에서 데이터 모델을 정의하고 변환하며 문서화 및 테스트까지 수행할 수 있도록 돕는 오픈소스 프레임워크입니다. dbt는 ELT 구조 중 ‘T(Transform)’ 단계에 최적화된 도구로, 데이터 분석의 생산성과 일관성을 높여주는 핵심 컴포넌트로 각광받고 있습니다.1. 개념 및 정의dbt는 SQL 기반의 선언적 방식으로 모델링, 문서화, 테스트, 배포 자동화를 지원하는 데이터 트랜스포메이션 도구입니다. 전통적인 ETL 방식과 달리, 원시 데이터는 데이터 웨어하우스로 적재되고(db/EL), dbt는 그 위에서 변환 작업을 수행합니다.사용자는 SQL과 Jinja 템플릿을 활용하여 데이터 모델을 생성하고, 이를 DAG(..

Topic 2025.04.28
728x90
반응형