728x90
반응형

분류알고리즘 3

Random Forest

개요Random Forest는 여러 개의 결정트리(Decision Tree)를 생성하고 이를 결합하여 더 정확하고 안정적인 예측을 수행하는 앙상블(Ensemble) 머신러닝 알고리즘이다. 개별 트리의 과적합(Overfitting) 문제를 줄이고, 다양한 데이터 패턴을 반영할 수 있어 분류(Classification)와 회귀(Regression) 문제 모두에서 널리 활용된다. 특히 금융, 의료, 추천 시스템 등 다양한 산업 분야에서 강력한 성능을 보여준다.1. 개념 및 정의Random Forest는 여러 개의 랜덤하게 생성된 결정트리를 학습시킨 후, 각 트리의 예측 결과를 종합하여 최종 결과를 도출하는 앙상블 학습 기법이다.2. 특징구분설명비교/차별점앙상블 방식여러 트리 결합단일 모델 대비 성능 향상랜덤성..

Topic 2026.06.02

KNN (K-Nearest Neighbors)

개요KNN(K-Nearest Neighbors)은 데이터 간의 ‘거리’를 기반으로 가장 가까운 이웃(K개)을 참고하여 분류 또는 회귀를 수행하는 머신러닝 알고리즘이다. 모델 학습 과정이 거의 없고, 새로운 데이터가 들어올 때마다 기존 데이터와의 유사도를 계산하여 결과를 도출하는 Lazy Learning 방식이 특징이다. 단순하면서도 직관적인 구조로 인해 입문용 알고리즘이자 실무에서도 여전히 활용되는 대표적인 기법이다.1. 개념 및 정의KNN은 새로운 데이터 포인트가 주어졌을 때, 기존 데이터 중 가장 가까운 K개의 데이터를 기준으로 다수결 또는 평균을 통해 결과를 예측하는 알고리즘이다.2. 특징구분설명비교/차별점거리 기반데이터 간 유사도 계산모델 기반 알고리즘 대비 직관적Lazy Learning사전 학습..

Topic 2026.06.01

Naive Bayes

개요Naive Bayes(나이브 베이즈)는 베이즈 정리를 기반으로 한 확률적 분류 알고리즘으로, 각 특징(feature)이 서로 독립이라는 ‘나이브(naive)’ 가정을 전제로 한다. 이 단순한 가정에도 불구하고 텍스트 분류, 스팸 필터링, 감정 분석 등 다양한 분야에서 높은 성능과 빠른 처리 속도를 제공하여 널리 활용되고 있다. 특히 데이터가 적거나 실시간 처리가 필요한 환경에서 강력한 장점을 가진다.1. 개념 및 정의Naive Bayes는 입력 데이터의 특징들이 서로 독립이라고 가정하고, 각 클래스에 속할 확률을 계산하여 가장 높은 확률을 가진 클래스로 분류하는 알고리즘이다.2. 특징구분설명비교/차별점확률 기반베이즈 정리 활용규칙 기반 대비 유연성 높음독립 가정특징 간 독립성 가정실제 데이터와 차이 ..

Topic 2026.05.31
728x90
반응형