개요Marquez는 데이터 파이프라인 전반의 메타데이터를 수집하고, 데이터 계보(Data Lineage)를 시각화 및 추적할 수 있도록 지원하는 오픈소스 플랫폼입니다. 주로 Apache Airflow, dbt, Spark 등과 통합되어 사용되며, 데이터의 생산부터 소비까지 전체 흐름을 추적하여 품질 관리, 데이터 거버넌스, 문제 진단을 가능하게 합니다.1. 개념 및 정의 항목 내용 비고 정의데이터 파이프라인 내 작업(Job)과 데이터셋 간 관계를 추적하는 메타데이터 서비스LF AI & Data 프로젝트목적데이터 흐름 시각화 및 영향도 분석, 거버넌스 대응ETL/ELT 관리 효율화적용 분야데이터 엔지니어링, 데이터 거버넌스, 감사(Audit)데이터 플랫폼 전반2. 특징항목설명비고OpenLineage 기..