728x90
반응형

디퓨전모델 2

DiT (Diffusion Transformer)

개요DiT(Diffusion Transformer)는 이미지 생성 디퓨전 모델에서 기존 U-Net 구조를 Transformer로 대체하여 성능과 확장성을 개선한 새로운 구조입니다. 특히, Transformer의 표현력과 스케일업 가능성을 활용해 고해상도 이미지 생성, 안정적 학습 등에서 차별화된 성능을 보여주며, DALL·E 3 및 Stable Diffusion 3와 같은 최신 생성형 AI 시스템에 영향을 주고 있습니다.1. 개념 및 정의 항목 내용 정의디퓨전 노이즈 제거 네트워크에 Transformer를 적용한 모델목표기존 CNN 기반 U-Net 대비 더 강력한 표현력 확보특징Latent 디퓨전 과정에서 Transformer가 노이즈 예측을 수행DiT는 Diffusion 과정에서 일정 단계(times..

Topic 2025.05.26

Video-Diffusion Gen-AI

개요Video-Diffusion Gen-AI는 텍스트, 이미지 등 다양한 입력으로부터 자연스럽고 고해상도의 동영상을 생성해내는 최신 생성형 AI 기술입니다. 이는 Stable Diffusion, Imagen, Sora 등에서 사용되는 확산 모델(Diffusion Model)을 기반으로, 정적 이미지가 아닌 시간 축을 고려한 프레임 간 일관성 유지와 동적 요소 표현을 가능케 합니다. 최근 텍스트-투-비디오(Text-to-Video) 생성이 AI 콘텐츠 제작, 시각예술, 광고, 시뮬레이션 분야에서 빠르게 도입되고 있으며, 생성 품질과 길이 모두 진화하고 있습니다.1. 개념 및 정의 구분 내용 정의확산 기반 생성 모델을 통해 텍스트, 이미지 입력으로부터 일관된 동영상을 자동 생성하는 AI 기술목적인간의 언어..

Topic 2025.05.20
728x90
반응형