728x90
반응형

FastAPI 2

SGLang

개요SGLang은 고성능 LLM(Large Language Model) 애플리케이션을 쉽고 빠르게 개발할 수 있도록 지원하는 파이썬 기반 언어 프레임워크입니다. MLC-LLM 팀이 개발했으며, 템플릿 기반의 LLM 스크립팅과 병렬 처리, 캐시 최적화 등 실시간 상호작용 시스템을 구축하는 데 특화된 기능을 제공합니다. 특히 대화형 AI, 코파일럿, 에이전트 시스템 등에 적합한 프론트엔드 인터페이스를 제공합니다.1. 개념 및 정의 항목 설명 정의SGLang은 LLM 기반 앱 개발을 위한 스크립팅 언어 및 실행 프레임워크입니다.목적LLM 앱의 복잡한 흐름 제어 및 서버 최적화 구조 제공필요성프롬프트 구성, 캐시 활용, 비동기 처리가 중요한 LLM 애플리케이션을 빠르게 개발하기 위함간결한 문법과 병렬 실행 환..

Topic 2025.09.29

BentoML

개요BentoML은 머신러닝 모델을 손쉽게 배포하고 서빙할 수 있도록 지원하는 오픈소스 MLOps 프레임워크입니다. Python 기반으로 개발되었으며, 모델을 다양한 환경에 맞게 포장하고 REST/gRPC API 형태로 서빙할 수 있도록 설계되어 있습니다. 모델 배포에 필요한 DevOps 부담을 줄이고, 모델 서빙 및 관리의 효율성을 극대화합니다.1. 개념 및 정의 항목 설명 정의BentoML은 모델을 API로 패키징하고, 서빙 인프라로 배포할 수 있게 해주는 MLOps 프레임워크입니다.목적머신러닝 모델의 배포, 서빙, 모니터링 과정을 자동화 및 간소화필요성실험 수준의 모델을 안정적이고 확장 가능한 운영 서비스로 전환하기 위함데이터 사이언티스트와 엔지니어 간의 협업을 효율화하는 핵심 도구입니다.2. 특..

Topic 2025.09.29
728x90
반응형