728x90
반응형

openAI 2

CLIP(Contrastive Language-Image Pretraining)

개요CLIP(Contrastive Language-Image Pretraining)은 OpenAI가 개발한 멀티모달 AI 모델로, 이미지와 텍스트를 동일한 임베딩 공간에서 비교할 수 있도록 학습된 모델이다. 이는 사전학습(pretraining) 방식으로 대규모 이미지-텍스트 쌍을 이용해 학습되어, 다양한 시각적 분류, 검색, 설명 등의 작업에서 탁월한 성능을 보인다.1. 개념 및 정의CLIP은 이미지를 설명하는 텍스트(캡션)와 함께 학습되어, 이미지와 텍스트가 의미적으로 가까운 경우 서로의 임베딩 벡터가 가까워지도록 학습하는 대조 학습(contrastive learning) 기반의 멀티모달 모델이다.목적: 이미지와 텍스트 간 의미적 정렬 학습필요성: 인간처럼 시각과 언어를 연결하는 직관적인 AI 개발2...

Topic 2025.05.11

Proximal Policy Optimization (PPO)

개요Proximal Policy Optimization(PPO)은 OpenAI에서 개발한 강화학습(RL) 알고리즘으로, 정책 기반(policy-based) 방법 중 가장 널리 쓰이는 대표 모델입니다. PPO는 기존 정책과 새로운 정책 사이의 급격한 변화(Policy Shift)를 억제하여 학습 안정성을 높이고, 샘플 효율성까지 확보하는 점에서 DDPG, TRPO, A2C 등과 비교해 높은 실용성과 범용성을 자랑합니다.게임 AI, 로봇 제어, 시뮬레이션 환경, 자연어 기반 에이전트 학습까지 PPO는 다양한 분야에서 표준으로 채택되고 있습니다.1. 개념 및 정의PPO는 정책 경사 방법(policy gradient method) 에 속하는 알고리즘으로, 에이전트가 직접 정책 함수를 학습합니다. 기존 정책에서 ..

Topic 2025.04.06
728x90
반응형