728x90
반응형

crossattention 2

Diffusion Transformers

개요Diffusion Transformers는 확률적 생성 모델인 Diffusion Model과 자연어 처리·시계열 예측 등에서 성능을 입증한 Transformer 구조를 결합한 하이브리드 생성 AI 아키텍처입니다. 기존의 GAN이나 VAE 기반 모델의 한계를 극복하며, 특히 이미지 생성, 텍스트-이미지 변환, 오디오 생성 등에서 높은 정밀도와 안정성을 제공하는 최신 기술로 각광받고 있습니다.1. 개념 및 정의Diffusion Model: 데이터를 점진적으로 노이즈화하고 역으로 원복하여 샘플을 생성하는 확률 기반 모델Transformer: 자기 주의(attention) 기반의 딥러닝 모델로, 시퀀스 정보를 효과적으로 처리함Diffusion Transformer: Transformer를 노이즈 제거 및 타..

Topic 2025.07.05

Perceiver IO

개요Perceiver IO는 다양한 형태의 입력 데이터를 효율적으로 처리하고 복잡한 출력까지 유연하게 생성할 수 있는 범용 딥러닝 아키텍처입니다. DeepMind가 2021년에 발표한 이 모델은 Transformer의 한계를 극복하고, 고차원 비정형 데이터(예: 이미지, 텍스트, 비디오, 포인트 클라우드 등)를 처리하는 데 강력한 성능을 보이며, AI 모델의 범용성과 확장성을 크게 향상시켰습니다.1. 개념 및 정의 항목 설명 비고 정의다양한 입력-출력 쌍을 유연하게 다루는 Transformer 기반 딥러닝 아키텍처Perceiver의 확장 버전목적입력 길이 제한 극복 및 다양한 입력 처리NLP 외 다양한 도메인 지원핵심 구조Cross-Attention 기반 입출력 디커플링 구조처리 효율성 강화Trans..

Topic 2025.06.08
728x90
반응형