'모델 서빙' 태그의 글 목록

Ray Serve

개요Ray Serve는 분산 컴퓨팅 프레임워크 Ray 위에서 동작하는 머신러닝 모델 서빙 플랫폼으로, 대규모 트래픽 처리와 실시간 추론을 지원하는 확장성 높은 MLOps 도구입니다. 다양한 ML/DL 프레임워크와 통합되어, 단일 노트북 프로토타입에서 대규모 클러스터 환경까지 유연하게 확장할 수 있습니다.1. 개념 및 정의 구분 내용 정의Ray Serve는 Ray 분산 프레임워크 기반의 고성능 모델 서빙 플랫폼으로, REST/gRPC API 형태로 추론 서비스를 제공합니다.목적대규모 트래픽 처리, 멀티모델 서빙, 실시간 ML 추론 지원필요성기존 모델 서빙 도구는 확장성 한계가 있으며, 분산 환경에 최적화된 솔루션 필요Ray Serve는 AI/ML 모델 서빙의 표준으로 자리잡고 있으며, Python 생태계..

Topic 2025.09.18

« 2026/02 »

일

월

화

수

목

금

토

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

ITPE * JackerLab

모델 서빙 2

티스토리툴바