728x90
반응형

데이터마이닝 3

지지도(Support), 신뢰도(Confidence), 향상도(Lift)

개요연관분석에서 핵심이 되는 세 가지 지표, 지지도(Support), 신뢰도(Confidence), 향상도(Lift)는 의미 있는 연관 규칙을 선별하고 해석하는 데 필수적인 역할을 합니다. 이 포스트에서는 각 지표의 정의, 수식, 해석법, 예시를 중심으로 연관분석의 실무 적용력을 높이기 위한 가이드를 제공합니다.1. 개념 및 정의지지도, 신뢰도, 향상도는 연관 규칙의 유의미성을 정량적으로 평가하는 기준입니다.지지도(Support): 전체 거래 중 특정 항목 집합이 등장한 비율신뢰도(Confidence): A 항목이 포함된 거래 중 B 항목도 함께 등장한 비율향상도(Lift): A와 B가 독립일 때 대비 실제 함께 등장할 확률의 증가율이들 지표는 마이닝 결과 중 노이즈를 제거하고, 인사이트 있는 규칙을 도..

Topic 2025.04.20

연관분석(Association Analysis)

개요연관분석(Association Analysis)은 데이터셋 내 항목 간의 유의미한 관계를 파악하기 위한 데이터 마이닝 기법입니다. 주로 장바구니 분석(Market Basket Analysis)에서 고객 행동을 예측하거나, 추천 시스템을 강화하는 데 활용됩니다. 본 포스트에서는 연관분석의 개념, 핵심 요소, 알고리즘, 실제 사례 등을 체계적으로 정리합니다.1. 개념 및 정의연관분석은 데이터 안에 숨겨진 항목 간의 상호 연관성을 규칙 형태로 도출하는 기법입니다. 예를 들어, "우유를 산 고객은 빵도 자주 구매한다"는 규칙을 찾는 방식입니다.주요 목적: 항목 간의 패턴 탐색 및 규칙 생성응용 분야: 유통, 전자상거래, 의료, 보안, 금융 등대표 알고리즘: Apriori, Eclat, FP-Growth2. ..

Topic 2025.04.20

Apriori Algorithm

개요Apriori 알고리즘은 데이터 마이닝에서 자주 등장하는 연관 규칙 학습(Association Rule Learning)의 대표적인 알고리즘입니다. 대형 거래 데이터로부터 상품 간의 연관 관계를 찾아내어 마케팅, 추천 시스템, 재고 관리 등 다양한 분야에 활용됩니다. 본 포스트에서는 Apriori 알고리즘의 개념부터 실제 활용 사례까지 전문가 수준으로 상세히 다루어봅니다.1. 개념 및 정의Apriori 알고리즘은 대규모 데이터베이스에서 자주 함께 등장하는 항목 집합(Frequent Itemsets)을 찾아내고, 이를 기반으로 연관 규칙(Association Rules)을 생성하는 알고리즘입니다. "항목 A를 구매한 고객은 항목 B도 구매할 확률이 높다"는 식의 규칙을 찾아내는 것이 주요 목적입니다.배..

Topic 2025.04.20
728x90
반응형