728x90
반응형

생성모델 3

DiT-XL

개요DiT-XL은 Diffusion Transformer(DiT) 아키텍처를 기반으로 고해상도 이미지 생성 성능을 극대화한 초대형 모델입니다. 기존 CNN 기반의 생성 모델 대비 세밀한 구조 이해와 표현력에서 뛰어난 성능을 보이며, 특히 텍스트 조건 기반 이미지 생성(text-to-image) 및 창작 콘텐츠 분야에서 활발히 활용되고 있습니다. Stability AI의 Stable Diffusion XL(SDXL) 등 상용 모델에도 적용되며, 생성 AI 진화의 척도를 보여주는 사례로 주목받고 있습니다.1. 개념 및 정의DiT: Transformer 아키텍처를 이미지 패치 기반으로 적용한 생성형 Diffusion 모델DiT-XL: 더 많은 레이어와 파라미터 수를 갖춘 확장형 DiT 모델로, 고정밀 생성 능..

Topic 2025.07.05

Diffusion Transformers

개요Diffusion Transformers는 확률적 생성 모델인 Diffusion Model과 자연어 처리·시계열 예측 등에서 성능을 입증한 Transformer 구조를 결합한 하이브리드 생성 AI 아키텍처입니다. 기존의 GAN이나 VAE 기반 모델의 한계를 극복하며, 특히 이미지 생성, 텍스트-이미지 변환, 오디오 생성 등에서 높은 정밀도와 안정성을 제공하는 최신 기술로 각광받고 있습니다.1. 개념 및 정의Diffusion Model: 데이터를 점진적으로 노이즈화하고 역으로 원복하여 샘플을 생성하는 확률 기반 모델Transformer: 자기 주의(attention) 기반의 딥러닝 모델로, 시퀀스 정보를 효과적으로 처리함Diffusion Transformer: Transformer를 노이즈 제거 및 타..

Topic 2025.07.05

DreamBooth

개요DreamBooth는 소수의 사용자 이미지(3~5장)만으로도, 특정 인물이나 스타일을 기존 텍스트-이미지 확산 모델(Stable Diffusion 등)에 맞춤 학습시켜 개인화된 이미지 생성을 가능하게 하는 파인튜닝 기법입니다. 2022년 Google Research와 Boston University 연구팀이 발표한 이 기술은 사용자 고유의 특성을 보존하면서도 원하는 문맥에 맞는 이미지 생성을 가능하게 하며, 팬아트, 게임 캐릭터, 패션, 브랜딩 등 다양한 분야에서 각광받고 있습니다.1. 개념 및 정의DreamBooth는 **사전 학습된 텍스트-이미지 생성 모델을 특정 개체(object, identity)에 대해 미세조정(fine-tune)**하여, 해당 개체가 다양한 문맥에 등장하는 이미지를 생성할 ..

Topic 2025.05.09
728x90
반응형