728x90
반응형

gguf 2

GGUF (GPT-Generated Unified Format)

개요GGUF는 대규모 언어 모델(LLM)을 효율적으로 배포하고 실행하기 위한 경량화된 모델 파일 포맷입니다. Meta의 LLaMA 및 다양한 오픈소스 LLM 실행 엔진에서 사용되며, 기존 GGML 포맷을 개선한 차세대 표준으로 주목받고 있습니다.1. 개념 및 정의 항목 설명 비고 정의대규모 언어 모델을 효율적으로 저장·실행하기 위한 통합 포맷GGML의 후속 포맷목적다양한 하드웨어에서 경량 실행 지원CPU, GPU, 모바일 환경필요성모델 크기와 자원 소모 문제 해결온디바이스 AI 확산효율적 LLM 배포를 위한 핵심 포맷입니다.2. 특징특징설명비교범용성다양한 모델과 실행 엔진 지원GGML보다 확장성 강화경량성파일 크기 최적화 및 빠른 로딩기존 포맷 대비 성능 개선호환성Meta LLaMA 등 최신 모델 지..

Topic 2025.10.19

Phi-3-mini

개요Phi-3-mini는 Microsoft가 개발한 경량화 대규모 언어모델(Mini LLM)로, 모바일 및 엣지 환경에서도 고성능 자연어 이해와 생성이 가능하도록 최적화된 차세대 LLM이다. 상대적으로 작은 파라미터 수에도 불구하고 뛰어난 평가 성능을 자랑하며, 실제 활용 가능한 '작지만 강한' 모델로 주목받고 있다.1. 개념 및 정의Phi-3-mini는 Microsoft의 Phi 모델 시리즈 중 가장 최신 소형 모델로, 3.8B 파라미터 크기를 기반으로 모바일, IoT, 웹, 데스크톱 등 경량 디바이스에서도 LLM 기능을 제공할 수 있도록 설계되었다.모델 크기: 3.8B 파라미터출시일: 2024년 4월배포 형식: ONNX, PyTorch, GGUF, WebLLM 등 다양한 포맷 제공적용 플랫폼: And..

Topic 2025.07.14
728x90
반응형