개요DiT(Diffusion Transformer)는 이미지 생성 디퓨전 모델에서 기존 U-Net 구조를 Transformer로 대체하여 성능과 확장성을 개선한 새로운 구조입니다. 특히, Transformer의 표현력과 스케일업 가능성을 활용해 고해상도 이미지 생성, 안정적 학습 등에서 차별화된 성능을 보여주며, DALL·E 3 및 Stable Diffusion 3와 같은 최신 생성형 AI 시스템에 영향을 주고 있습니다.1. 개념 및 정의 항목 내용 정의디퓨전 노이즈 제거 네트워크에 Transformer를 적용한 모델목표기존 CNN 기반 U-Net 대비 더 강력한 표현력 확보특징Latent 디퓨전 과정에서 Transformer가 노이즈 예측을 수행DiT는 Diffusion 과정에서 일정 단계(times..