728x90
반응형

DIT 2

DiT-XL

개요DiT-XL은 Diffusion Transformer(DiT) 아키텍처를 기반으로 고해상도 이미지 생성 성능을 극대화한 초대형 모델입니다. 기존 CNN 기반의 생성 모델 대비 세밀한 구조 이해와 표현력에서 뛰어난 성능을 보이며, 특히 텍스트 조건 기반 이미지 생성(text-to-image) 및 창작 콘텐츠 분야에서 활발히 활용되고 있습니다. Stability AI의 Stable Diffusion XL(SDXL) 등 상용 모델에도 적용되며, 생성 AI 진화의 척도를 보여주는 사례로 주목받고 있습니다.1. 개념 및 정의DiT: Transformer 아키텍처를 이미지 패치 기반으로 적용한 생성형 Diffusion 모델DiT-XL: 더 많은 레이어와 파라미터 수를 갖춘 확장형 DiT 모델로, 고정밀 생성 능..

Topic 2025.07.05

DiT (Diffusion Transformer)

개요DiT(Diffusion Transformer)는 이미지 생성 디퓨전 모델에서 기존 U-Net 구조를 Transformer로 대체하여 성능과 확장성을 개선한 새로운 구조입니다. 특히, Transformer의 표현력과 스케일업 가능성을 활용해 고해상도 이미지 생성, 안정적 학습 등에서 차별화된 성능을 보여주며, DALL·E 3 및 Stable Diffusion 3와 같은 최신 생성형 AI 시스템에 영향을 주고 있습니다.1. 개념 및 정의 항목 내용 정의디퓨전 노이즈 제거 네트워크에 Transformer를 적용한 모델목표기존 CNN 기반 U-Net 대비 더 강력한 표현력 확보특징Latent 디퓨전 과정에서 Transformer가 노이즈 예측을 수행DiT는 Diffusion 과정에서 일정 단계(times..

Topic 2025.05.26
728x90
반응형