728x90
반응형

데이터공유 3

One Table (Lakehouse Multi-Engine Table Spec)

개요One Table은 Lakehouse 아키텍처에서 다양한 데이터 처리 엔진과 분석 플랫폼이 하나의 테이블 형식으로 읽고 쓸 수 있도록 지원하는 다중 엔진 호환 테이블 사양(Multi-Engine Table Spec)이다. Apache Iceberg와 Delta Lake 포맷을 상호 운용 가능하게 만드는 사양으로, 개방성과 호환성, 확장성 측면에서 데이터 생태계에 중요한 전환점을 제공한다.1. 개념 및 정의One Table은 데이터가 저장된 단일 테이블을 Iceberg, Delta Lake, Apache Spark, Trino, Flink, Hive, Dremio, Snowflake 등 다양한 엔진이 동일한 규격으로 읽고 쓸 수 있도록 중재하는 메타데이터 구조 및 포맷 인터페이스다. 구성 요소 설명 ..

Topic 2025.06.24

Unity Catalog

개요Unity Catalog는 Databricks에서 제공하는 통합 데이터 거버넌스 솔루션으로, 조직의 모든 데이터 자산에 대한 중앙 집중적 카탈로그, 권한 관리, 감사 추적, 계보(라인리지) 정보를 제공하는 메타데이터 관리 플랫폼이다. Lakehouse 아키텍처에 최적화되어 있으며, 데이터 엔지니어, 분석가, 보안 관리자 모두를 위한 단일 관리 체계를 실현한다.1. 개념 및 정의 항목 설명 정의Databricks 내의 테이블, 뷰, 파일, ML 모델 등에 대한 메타데이터, 권한, 라인리지 등을 중앙 관리하는 플랫폼역할데이터 거버넌스, 카탈로그 관리, 접근 제어, 감사 로깅 제공대상 환경Databricks Lakehouse, Delta Lake 기반 워크스페이스 전반Unity Catalog는 Azure..

Topic 2025.06.21

데이터 공유 기술(Data Sharing Technologies)

개요데이터는 이제 ‘소유’보다 ‘공유’를 통해 더 큰 가치를 창출하는 자산이 되었습니다. 다양한 조직 간, 부서 간, 시스템 간의 데이터 연계와 협업이 중요해지며, 이를 가능하게 하는 데이터 공유 기술의 발전이 주목받고 있습니다. 본 글에서는 데이터 공유의 개념, 주요 기술 방식, 활용 모델, 플랫폼 예시 및 보안 고려사항까지 포괄적으로 정리합니다.1. 데이터 공유란? 항목 설명 정의데이터 제공자와 활용자 간 데이터 파일, API, 플랫폼 등을 통해 정보를 교환하거나 연계하는 기술적·정책적 행위목적데이터 활용 극대화, 중복 제거, 협업 기반 인사이트 확보공유 유형내부 공유(부서 간), 외부 공유(기관/기업 간), 개방형 공유(공공/민간 데이터셋)데이터 공유는 ‘데이터의 유통망’이며, 거버넌스와 기술이 ..

Topic 2025.04.21
728x90
반응형