728x90
반응형

2026/04/25 2

Overfitting/Underfitting

개요과적합(Overfitting)과 과소적합(Underfitting)은 머신러닝 및 딥러닝 모델의 성능을 좌우하는 핵심 개념이다. 모델이 학습 데이터에 지나치게 맞춰지거나 반대로 충분히 학습하지 못하는 문제로, 실제 서비스 환경에서 예측 성능 저하의 주요 원인이 된다. 본 글에서는 두 개념의 정의부터 기술적 원인, 해결 방법까지 체계적으로 정리한다.1. 개념 및 정의과적합은 모델이 학습 데이터의 노이즈까지 과도하게 학습하여 새로운 데이터에 대한 일반화 성능이 떨어지는 현상이다. 반면 과소적합은 모델이 데이터의 패턴을 충분히 학습하지 못해 학습 데이터와 테스트 데이터 모두에서 성능이 낮은 상태를 의미한다.2. 특징구분과적합 (Overfitting)과소적합 (Underfitting)학습 데이터 성능매우 높음..

Topic 12:36:31

Word Embedding

개요Word Embedding은 단어를 고차원 희소 벡터가 아닌 저차원 밀집 벡터(Dense Vector)로 표현하는 자연어 처리(NLP) 기술이다. 단어 간 의미적 유사성과 문맥적 관계를 수치적으로 학습할 수 있게 해 주며, 검색, 추천, 번역, 질의응답, 생성형 AI 등 다양한 언어 처리 시스템의 기반이 된다.1. 개념 및 정의Word Embedding은 단어의 의미를 벡터 공간에 매핑하는 표현 학습 기법이다. 같은 문맥에서 자주 등장하는 단어는 비슷한 벡터에 위치하도록 학습되며, 이를 통해 단어 간 관계를 계산할 수 있다. 즉, 단어를 단순한 문자열이 아니라 의미를 가진 수치 표현으로 바꾸는 기술이라고 볼 수 있다.2. 특징구분설명비교 요소밀집 표현단어를 저차원 벡터로 표현One-hot 대비 메모리..

Topic 06:34:32
728x90
반응형