728x90
반응형

이미지 분류 2

Vision Transformer(ViT)

개요Vision Transformer(ViT)는 자연어 처리에서 뛰어난 성능을 보인 트랜스포머(Transformer) 구조를 이미지 처리에 도입한 혁신적인 딥러닝 모델입니다. 기존 CNN 기반 모델들과 달리, 이미지를 패치 단위로 분할하고 이를 토큰으로 처리하여, 시각적 정보를 글로벌 컨텍스트 기반으로 학습합니다.1. 개념 및 정의**ViT(Vision Transformer)**는 이미지를 고정된 크기의 패치로 나눈 후, 각 패치를 임베딩하여 순서가 있는 토큰 시퀀스로 변환한 뒤 트랜스포머 인코더에 입력하는 방식의 이미지 분류 아키텍처입니다.기반 기술: Transformer Encoder (Self-Attention 기반)등장 배경: CNN의 지역적 특성과 한계를 극복, 글로벌 관계 학습주요 논문: Do..

Topic 2025.05.06

Support Vector Machine (SVM)

개요Support Vector Machine(SVM)은 지도학습(Supervised Learning) 기반의 강력한 머신러닝 알고리즘으로, 분류(Classification) 및 회귀(Regression) 문제 해결에 널리 사용됩니다. 특히 고차원 데이터에서 뛰어난 성능을 보이며, 최적의 초평면(Hyperplane)을 찾아 데이터 포인트를 분류하는 것이 핵심 원리입니다. 본 글에서는 SVM의 개념, 작동 원리, 주요 활용 사례 및 장단점을 살펴봅니다.1. SVM이란?SVM은 데이터를 가장 잘 분리하는 초평면을 찾아내어 분류하거나 회귀 분석을 수행하는 알고리즘입니다. 주어진 데이터 포인트를 분류하는 경계(Decision Boundary)를 최대한 넓히는 방식으로 최적의 분류 모델을 구축합니다.1.1 SVM의..

Topic 2025.03.08
728x90
반응형