728x90
반응형

오픈소스llm 3

QLoRA (Quantized Low-Rank Adapter)

개요QLoRA(Quantized Low-Rank Adapter)는 대형 언어 모델(LLM)의 파인튜닝을 메모리 효율적이면서도 성능을 유지한 채 수행할 수 있는 혁신적인 방법입니다. 이름에서 알 수 있듯이, 이 기법은 **양자화(Quantization)**와 **로우랭크 어댑터(Low-Rank Adapter, LoRA)**를 결합하여, 저사양 환경에서도 대형 모델을 효과적으로 커스터마이징할 수 있게 합니다. Hugging Face와 Tim Dettmers 연구진이 2023년 제안했으며, 수백억 파라미터 모델의 경제적 활용을 가능하게 만든 대표 기술입니다.1. 개념 및 정의QLoRA는 다음 세 가지 핵심 기술을 결합한 파인튜닝 프레임워크입니다:4비트 양자화: 모델의 파라미터를 4-bit precision으로..

Topic 2025.05.08

LangChain

개요LangChain은 대형 언어 모델(LLM)을 실제 애플리케이션 수준으로 확장 가능하도록 돕는 오픈소스 프레임워크입니다. 단순한 프롬프트 호출을 넘어서, 외부 데이터 연결, 도구 사용, 멀티스텝 추론, 메모리 유지, 에이전트 기반 설계를 가능하게 합니다. LLM 오케스트레이션 분야에서 가장 널리 사용되는 프레임워크로, AI 챗봇, 문서 검색, 자동화 업무 시스템 등에 폭넓게 활용됩니다.1. 개념 및 정의LangChain은 Python 및 JavaScript에서 사용할 수 있으며, LLM을 중심으로 다양한 컴포넌트(메모리, 툴, 에이전트 등)를 조합해 복잡한 워크플로우를 구성할 수 있도록 설계된 프레임워크입니다.프롬프트 템플릿, 체인(chain), 메모리, 툴, 에이전트 등 다양한 구성 요소를 통해 L..

Topic 2025.04.28

LLM 오케스트레이션

개요LLM 오케스트레이션(Orchestration)은 하나의 대형 언어 모델(Large Language Model)이 아닌 여러 LLM을 조율하여 복잡한 업무를 수행하거나, LLM과 외부 도구를 결합해 확장된 인공지능 서비스를 구축하는 기술 전략입니다. LangChain, Semantic Kernel, CrewAI 등의 프레임워크가 대표적으로 활용되며, AI 에이전트, 챗봇, 검색 강화 생성(RAG) 등 고도화된 애플리케이션 구현의 핵심입니다.1. 개념 및 정의LLM 오케스트레이션은 단일 LLM의 한계를 극복하고, 다양한 언어 모델과 도구, API, 데이터 소스들을 통합하여 복합적인 태스크를 수행할 수 있도록 하는 시스템 아키텍처입니다.기본적으로는 LLM의 입력/출력을 관리하고, 필요시 외부 메모리, 데..

Topic 2025.04.28
728x90
반응형