개요Snorkel은 수작업 라벨링 없이 라벨링 함수(Labeling Function)를 통해 대규모 학습 데이터를 생성하고, 노이즈를 제거하여 고품질의 데이터셋을 만들어내는 약지도 학습 프레임워크입니다. Stanford 대학에서 개발되었으며, 자연어 처리(NLP), 문서 분류, 의료 AI 등 다양한 분야에서 활용됩니다.1. 개념 및 정의 항목 설명 정의라벨링 함수로 생성된 노이즈 라벨을 통합·보정해 학습용 데이터셋을 생성하는 프레임워크목적대규모 수작업 라벨링 비용 절감 및 빠른 모델 개발필요성수동 라벨링은 비용·시간·일관성 측면에서 한계 존재Snorkel은 수많은 약한 라벨을 결합하여 강한 학습 데이터셋을 생성함2. 특징특징설명비교라벨링 함수 기반전문가 지식으로 작성한 규칙 활용전통적 수작업 라벨링 대..