728x90
반응형

ml파이프라인 2

TFX (TensorFlow Extended)

개요TFX(TensorFlow Extended)는 TensorFlow 기반의 엔드투엔드 머신러닝(ML) 파이프라인 플랫폼으로, 데이터 준비부터 모델 배포까지 전체 ML 워크플로우를 자동화하고 관리합니다. 대규모 프로덕션 환경에서 안정적이고 반복 가능한 ML 운영(MLOps)을 지원합니다.1. 개념 및 정의 항목 설명 비고 정의TensorFlow 기반의 프로덕션 ML 파이프라인 플랫폼구글 개발목적데이터 처리, 학습, 검증, 배포까지 자동화엔드투엔드 지원필요성ML 모델의 프로덕션 운영 효율성 확보MLOps 핵심 구성요소산업 현장에서 재현성과 확장성을 보장하는 플랫폼입니다.2. 특징특징설명비교엔드투엔드 지원데이터 준비~모델 배포까지 지원Airflow, Kubeflow 등과 통합 가능표준화재현성과 일관된 파..

Topic 2025.10.19

DVC (Data Version Control)

개요DVC(Data Version Control)는 Git과 통합되어 작동하는 오픈소스 데이터 버전 관리 툴로, 머신러닝 및 데이터 사이언스 프로젝트의 데이터, 모델, 파이프라인을 체계적으로 버전 관리할 수 있게 합니다. 코드뿐 아니라 대규모 데이터와 실험 결과까지 추적할 수 있어, ML reproducibility와 협업을 크게 향상시킵니다.1. 개념 및 정의 항목 설명 정의Git과 유사한 방식으로 대용량 데이터 및 모델 파일을 버전 관리할 수 있는 CLI 기반 도구목적데이터 및 ML 파이프라인 재현성 확보 및 협업 지원연동 시스템Git, S3, GCS, Azure, SSH, HTTP 등 다양한 리모트 저장소DVC는 데이터가 Git에 직접 저장되지 않고, Git은 메타데이터만 추적하는 구조입니다.2...

Topic 2025.05.27
728x90
반응형