'Prompt engineering' 태그의 글 목록

LLMLingua

개요LLMLingua는 대형 언어 모델(LLM)의 입력 프롬프트를 압축하여 품질 손상 없이 토큰 수를 줄이는 최적화 프레임워크이다. 정보 밀도 기반의 프롬프트 압축 기법을 활용하여 LLM 호출 비용을 절감하고 응답 속도 향상에 기여한다. 특히 LLaMA, GPT, Claude 등 다양한 LLM과 호환되며, 대화형 시스템과 RAG에서 유용하게 사용된다.1. 개념 및 정의 항목 설명 정의정보 손실을 최소화하며 프롬프트 내 토큰 수를 줄이는 LLM 입력 최적화 프레임워크목적LLM 비용 절감 및 처리 속도 향상을 위한 압축 기반 프롬프트 최적화필요성토큰 제한, 응답 지연, 호출 비용 등 실무적 문제 해결을 위해LLMLingua는 "정보 밀도에 따라 덜 중요한 단어 제거" 전략을 채택한다.2. 특징특징설명비교압..

Topic 2026.01.13

GraphRAG

개요GraphRAG는 전통적인 RAG(Retrieval-Augmented Generation) 프레임워크에 그래프 데이터 구조를 결합하여, 문맥 간 관계성과 정보 연결성을 극대화한 차세대 생성형 AI 기술입니다. GraphDB(Graph Database) 또는 지식 그래프를 기반으로 하여, 복잡한 관계형 정보를 보다 정밀하게 검색하고 LLM이 활용할 수 있도록 설계되었습니다.이 글에서는 GraphRAG의 정의, 구조적 특징, 기술적 구성 요소, 실제 사용 사례 및 도입 시 고려사항 등을 상세히 설명하며, 고도화된 AI 정보 추론 시스템을 구축하고자 하는 조직에 실질적인 인사이트를 제공합니다.1. 개념 및 정의 항목 설명 정의GraphRAG는 검색 기반 생성(RAG)에 그래프 DB를 결합해 문서 간의 의..

Topic 2025.09.02

GEM Framework

개요GEM(Goal-Execution-Monitoring) Framework는 대형 언어 모델(LLM)을 기반으로 동작하는 AI 에이전트가 목표 달성을 위해 효과적으로 행동하도록 지원하는 구조적 실행 프레임워크다. 목표 중심 설계, 실행계획 생성, 작업 진행 상태 모니터링의 세 가지 계층으로 구성되며, 복잡한 멀티스텝 문제를 자율적으로 해결하는 에이전트의 지능을 체계화한다.1. 개념 및 정의GEM Framework는 LLM이 단순 응답 생성이 아닌 실제 작업 수행을 목표로 작동할 수 있도록 하는 아키텍처로, 명시적인 목표(goal), 자동 생성된 실행 계획(plan), 수행 후 상태 피드백(monitoring)을 기반으로 LLM의 인지적 처리 흐름을 관리한다.목적 및 필요성LLM 기반 에이전트의 일관된 ..

Topic 2025.07.08

Self-Consistency Prompt Voting

개요Self-Consistency Prompt Voting은 하나의 프롬프트에 대해 다수의 응답을 생성하고, 그 중 논리적으로 일관된 답변을 다수결 투표로 선택하여 최종 출력을 결정하는 방법입니다. 이는 특히 chain-of-thought prompting(COT)과 함께 사용될 때 효과적으로 모델의 추론 능력과 일관성을 향상시킵니다. 인간과 유사한 사고 체계를 모방하는 방식으로 복잡한 문제에 대해 더 정확하고 신뢰할 수 있는 결과를 도출합니다.1. 개념 및 정의 항목 설명 비고 정의언어 모델의 동일한 프롬프트에 대해 여러 출력을 생성하고, 가장 일관된 응답을 다수결 투표로 결정하는 전략Wang et al. (2022) 도입목적추론 정확도 향상 및 일관성 확보Chain-of-thought(COT)과 ..

Topic 2025.05.31

Token-Level Filtering

개요대규모 언어 모델(LLM)을 활용한 텍스트 생성에서는 응답의 정확성, 품질, 다양성, 안전성을 제어하는 다양한 기법이 존재합니다. 그중에서도 가장 낮은 수준에서 작동하는 핵심 기술이 바로 **Token-Level Filtering(토큰 단위 필터링)**입니다. 이 기법은 모델이 출력할 다음 토큰 후보군에 대해 사전 정의된 기준으로 필터링 및 재정렬하여, 결과물의 품질을 정밀하게 제어할 수 있도록 합니다.1. 개념 및 정의Token-Level Filtering은 LLM이 다음 토큰을 예측할 때 출력하는 확률 분포(logits 또는 softmax 확률)에서, 부적절하거나 품질이 낮은 토큰을 제거 또는 확률 재조정하는 과정입니다. 이 과정은 디코딩 단계에 직접 개입하여, 단어 수준의 편향 제어, 위험 응답..

Topic 2025.05.25

FIM (Fill-In-the-Middle) Pre-training

개요FIM(Fill-In-the-Middle) Pre-training은 기존의 왼쪽-오른쪽(LM-style) 언어 모델 학습 방식과 달리, 텍스트의 중간을 채우는 학습 방식으로, 자연스러운 문맥 삽입 능력을 향상시키기 위한 사전학습 기법입니다. 코드 자동완성, 문장 편집, 함수 보완 등에서 특히 효과적이며, GitHub Copilot과 같은 코드 생성 모델에서 그 유용성이 입증되었습니다. FIM은 텍스트 조각을 “prefix, middle, suffix”로 분리하여 모델이 middle을 예측하도록 훈련합니다.1. 개념 및 정의항목설명정의FIM은 텍스트 시퀀스를 중간 삽입 방식으로 학습하여, Prefix와 Suffix 사이에 적절한 Middle을 생성하도록 모델을 훈련하는 사전학습 기법입니다.목적중간 문장..

Topic 2025.05.16

ReAct (Reasoning and Acting)

개요ReAct(Reasoning and Acting)는 대규모 언어모델(LLM)이 사고(Reasoning)와 외부 환경에 대한 행위(Action)를 번갈아 수행하도록 유도하는 프롬프트 설계 기법입니다. ReAct는 LLM이 단순히 응답을 생성하는 데 그치지 않고, 생각하고 → 도구를 호출하고 → 다시 생각하고 → 결론을 도출하는 방식으로 능동적이고 인터랙티브한 에이전트 추론 체계를 구현합니다. 이는 검색 기반 QA, 툴 기반 작업 자동화, 다단계 추론형 AI 어시스턴트 등에서 핵심 전략으로 활용됩니다.1. 개념 및 정의ReAct는 하나의 프롬프트 흐름 내에서 다음을 반복합니다:Thought: 문제를 해결하기 위한 사고 과정 (CoT 기반)Action: 외부 API, 계산기, 검색 도구 등을 호출Obser..

Topic 2025.04.07

Self-consistency Prompting

개요Self-consistency는 Chain-of-Thought(CoT) Prompting의 확장 기법으로, LLM이 생성한 다수의 응답 중에서 가장 일관되고 빈도 높은 정답을 선택하여 추론 정확도와 안정성을 높이는 전략입니다. 단일 응답에 의존하지 않고, 여러 번 추론을 수행한 뒤 그 중 가장 빈도 높은 결과(majority vote)를 최종 응답으로 채택함으로써, 특히 수학, 논리, 추론 등 고난도 문제에서 효과적인 성능을 보입니다.1. 개념 및 정의Self-consistency는 다음과 같은 과정으로 이루어집니다:Chain-of-Thought 방식으로 다양한 응답 샘플 생성 (sampling or temperature variation)각 응답의 최종 정답만 추출 (step-by-step reas..

Topic 2025.04.07

Few-shot Prompting

개요Few-shot Prompting은 대규모 언어모델(LLM)에게 작업 예시(few examples)를 함께 제공하여 모델이 문맥(Context)만으로 태스크를 학습하도록 유도하는 프롬프트 전략입니다. 이는 LLM의 사전학습된 능력을 활용해 별도 파인튜닝 없이 다양한 태스크에서 높은 성능을 낼 수 있게 하며, 특히 GPT-3 이후 널리 사용되는 대표적인 프롬프트 방식입니다.1. 개념 및 정의Few-shot Prompting은 다음과 같은 구조를 갖습니다:예시 포함: 입력 프롬프트에 몇 개의 문제-답 예시 포함문맥 기반 학습: 예시를 통해 모델이 태스크 구조를 이해함추론 일반화: 예시 패턴을 바탕으로 새로운 입력에 대해 응답 생성예시:Translate English to Korean:English: ap..

Topic 2025.04.07

Prompt Engineering 기법

개요Prompt Engineering(프롬프트 엔지니어링)은 대규모 언어모델(LLM)의 성능을 최대한 이끌어내기 위해 입력 프롬프트를 설계, 구성, 조정하는 기술입니다. GPT-4, Claude, LLaMA, PaLM 등 현대 LLM은 같은 모델이라도 프롬프트 구조에 따라 응답 품질이 크게 달라지기 때문에, 효과적인 프롬프트 설계가 매우 중요합니다. 최근에는 Chain-of-Thought(CoT), Zero-shot, Few-shot, Role prompting, Instruction tuning 등 다양한 기법이 활용되며, 프롬프트 자체가 모델 성능의 핵심 변수로 작용합니다.1. 개념 및 정의Prompt Engineering이란 모델에게 문제 해결을 요청할 때 사용하는 입력 문장을 명시적, 구조화된 방..

Topic 2025.04.06

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

ITPE * JackerLab

Prompt engineering 10

티스토리툴바