728x90
반응형

2025/12/06 2

Multimodal RAG (Retrieval-Augmented Generation)

개요Multimodal RAG(Retrieval-Augmented Generation)는 텍스트(Text), 이미지(Image), 비디오(Video) 등 다양한 모달리티 데이터를 동시에 이해하고 생성할 수 있는 차세대 생성형 AI 아키텍처이다. 기존의 RAG가 텍스트 기반 검색과 생성에 초점을 맞췄다면, Multimodal RAG는 비정형 데이터까지 확장하여 **지식 기반 멀티모달 추론(Multimodal Reasoning)**을 가능하게 한다.1. 개념 및 정의Multimodal RAG는 기본적으로 두 단계로 구성된다.Retrieval (검색) – 외부 지식베이스(예: 이미지, 문서, 비디오 프레임)에서 관련 정보를 검색.Generation (생성) – 검색된 정보를 Transformer 기반 멀티모달..

Topic 2025.12.06

ColPali (Collaborative Parallel Learning)

개요ColPali(Collaborative Parallel Learning)는 최신 인공지능 학습 구조 중 하나로, **대규모 모델의 병렬 학습과 협업 학습(Collaborative Learning)**을 결합하여 효율적인 분산 트레이닝을 구현하는 기법이다. 이 방식은 여러 GPU/노드가 독립적으로 학습하면서도 상호 정보를 공유해, 성능과 학습 안정성을 동시에 확보할 수 있다.ColPali는 기존의 Data Parallelism 및 Model Parallelism 한계를 극복하고, 각 학습 노드 간 협업적 업데이트를 통해 더 빠르고 효율적인 학습을 지원한다.1. 개념 및 정의ColPali는 이름 그대로 Collaborative(협업적) + Parallel(병렬적) 학습 개념을 결합한 프레임워크다. 각 노..

Topic 2025.12.06
728x90
반응형