개요Cleanlab은 머신러닝 모델 학습에 사용되는 데이터셋의 품질을 진단하고, 라벨 오류(Label Error)를 자동으로 탐지하고 보정하는 오픈소스 프레임워크입니다. 모델 예측 결과를 활용해 라벨의 신뢰도를 통계적으로 평가함으로써, 라벨링 오류, 혼동 클래스, 이상값 등을 체계적으로 식별할 수 있도록 돕습니다.1. 개념 및 정의 항목 설명 정의학습 데이터의 라벨 품질을 자동으로 분석하고 오류를 탐지하는 Python 기반 프레임워크목적모델 성능 향상을 위한 데이터 정제 자동화필요성수작업 라벨링 오류로 인한 성능 저하 및 불안정성 개선Cleanlab은 신뢰도 기반 필터링과 클래스 혼동 행렬 기반 진단 기능을 제공함2. 특징특징설명비교모델 예측 기반사전 학습된 모델의 softmax 출력 활용예측 확률로 ..