
개요데이터 분석, 머신러닝, 리포팅 등 데이터 기반 업무가 고도화되면서, 데이터가 **어디서 왔고, 어떻게 변형되었는지 추적하는 계보(lineage)**에 대한 중요성이 증가하고 있습니다. 특히 컬럼 단위까지 추적 가능한 **Column-Level Lineage(CLL)**는 데이터 품질, 규제 대응, 디버깅, 거버넌스에 필수 요소로 부상하고 있습니다. 이에 대한 오픈소스 표준으로 OpenLineage의 CLL 확장 기능이 주목받고 있으며, 본 글에서는 그 개념, 아키텍처, 구현 방식, 도입 효과를 심층 분석합니다.1. 개념 및 정의OpenLineage는 데이터 계보를 자동 수집하고 표준화된 메타데이터로 기록·공유할 수 있도록 설계된 오픈소스 메타데이터 표준 및 API 규격입니다.**Column-Leve..