728x90
반응형

데이터신뢰 2

OpenLineage Column-Level Lineage (CLL)

개요데이터 분석, 머신러닝, 리포팅 등 데이터 기반 업무가 고도화되면서, 데이터가 **어디서 왔고, 어떻게 변형되었는지 추적하는 계보(lineage)**에 대한 중요성이 증가하고 있습니다. 특히 컬럼 단위까지 추적 가능한 **Column-Level Lineage(CLL)**는 데이터 품질, 규제 대응, 디버깅, 거버넌스에 필수 요소로 부상하고 있습니다. 이에 대한 오픈소스 표준으로 OpenLineage의 CLL 확장 기능이 주목받고 있으며, 본 글에서는 그 개념, 아키텍처, 구현 방식, 도입 효과를 심층 분석합니다.1. 개념 및 정의OpenLineage는 데이터 계보를 자동 수집하고 표준화된 메타데이터로 기록·공유할 수 있도록 설계된 오픈소스 메타데이터 표준 및 API 규격입니다.**Column-Leve..

Topic 2025.08.24

Data Quality Contract (DQC)

개요데이터 중심 의사결정이 보편화되면서, 데이터 품질 문제는 조직의 신뢰성과 경쟁력에 직접적인 영향을 미치고 있습니다. 특히 데이터 파이프라인이 복잡해지고 다양한 팀이 협업하는 환경에서는 데이터 품질 보증에 대한 명확한 기준과 책임 범위 정의가 필요합니다. 이를 해결하기 위한 구조화된 접근 방식이 바로 **Data Quality Contract(DQC)**입니다. 본 글에서는 DQC의 개념, 구성, 기술 적용 전략, 도입 효과를 실무 관점에서 정리합니다.1. 개념 및 정의**Data Quality Contract(DQC)**는 데이터 제공자와 소비자 간에 데이터 품질 기준, 책임, 검증 방식 등을 명시적으로 정의한 계약형 메타데이터 문서입니다.이는 단순한 데이터 스키마 정의를 넘어서 정합성, 완전성, 최..

Topic 2025.08.23
728x90
반응형