개요TF-IDF(Term Frequency - Inverse Document Frequency)는 문서에서 특정 단어의 중요도를 평가하는 대표적인 자연어 처리(NLP) 기법입니다. 검색 엔진, 문서 분류, 키워드 추출 등의 다양한 분야에서 활용되며, 특정 단어가 문서에서 얼마나 중요한지를 정량적으로 측정할 수 있도록 합니다. 본 글에서는 TF-IDF의 개념, 수식, 활용 사례 및 최신 동향을 살펴봅니다.1. TF-IDF란?TF-IDF는 문서에서 단어의 출현 빈도를 기반으로 해당 단어의 상대적인 중요도를 평가하는 방법입니다. 이는 두 가지 요소로 구성됩니다. 구성 요소 설명 TF (Term Frequency, 단어 빈도)특정 단어가 한 문서에서 얼마나 자주 등장하는지 측정IDF (Inverse Docum..