개요DiT(Diffusion Transformer)는 이미지 생성을 위한 딥러닝 아키텍처로, 기존 CNN 기반의 디퓨전 모델 대신 트랜스포머(Transformer) 구조를 사용하여 고해상도 이미지를 효율적으로 생성합니다. OpenAI의 DALLE이나 Stable Diffusion과 유사한 방식의 생성 메커니즘에 Transformer의 장점을 결합한 새로운 접근입니다.1. 개념 및 정의 항목 내용 정의트랜스포머 아키텍처를 디퓨전 모델의 노이즈 예측에 활용한 이미지 생성 모델목적고성능 이미지 생성을 위한 트랜스포머 기반 구조 설계필요성CNN의 표현력 한계를 넘어 더 정교한 패턴 학습과 확장성 확보를 위함2. 주요 특징특징설명효과트랜스포머 구조비전 트랜스포머(ViT) 기반 아키텍처장거리 의존 관계 학습에 유..