개요LLMLingua는 대형 언어 모델(LLM)의 입력 프롬프트를 압축하여 품질 손상 없이 토큰 수를 줄이는 최적화 프레임워크이다. 정보 밀도 기반의 프롬프트 압축 기법을 활용하여 LLM 호출 비용을 절감하고 응답 속도 향상에 기여한다. 특히 LLaMA, GPT, Claude 등 다양한 LLM과 호환되며, 대화형 시스템과 RAG에서 유용하게 사용된다.1. 개념 및 정의 항목 설명 정의정보 손실을 최소화하며 프롬프트 내 토큰 수를 줄이는 LLM 입력 최적화 프레임워크목적LLM 비용 절감 및 처리 속도 향상을 위한 압축 기반 프롬프트 최적화필요성토큰 제한, 응답 지연, 호출 비용 등 실무적 문제 해결을 위해LLMLingua는 "정보 밀도에 따라 덜 중요한 단어 제거" 전략을 채택한다.2. 특징특징설명비교압..