'Prompt engineering' 태그의 글 목록

GEM Framework

개요GEM(Goal-Execution-Monitoring) Framework는 대형 언어 모델(LLM)을 기반으로 동작하는 AI 에이전트가 목표 달성을 위해 효과적으로 행동하도록 지원하는 구조적 실행 프레임워크다. 목표 중심 설계, 실행계획 생성, 작업 진행 상태 모니터링의 세 가지 계층으로 구성되며, 복잡한 멀티스텝 문제를 자율적으로 해결하는 에이전트의 지능을 체계화한다.1. 개념 및 정의GEM Framework는 LLM이 단순 응답 생성이 아닌 실제 작업 수행을 목표로 작동할 수 있도록 하는 아키텍처로, 명시적인 목표(goal), 자동 생성된 실행 계획(plan), 수행 후 상태 피드백(monitoring)을 기반으로 LLM의 인지적 처리 흐름을 관리한다.목적 및 필요성LLM 기반 에이전트의 일관된 ..

Topic 2025.07.08

Self-Consistency Prompt Voting

개요Self-Consistency Prompt Voting은 하나의 프롬프트에 대해 다수의 응답을 생성하고, 그 중 논리적으로 일관된 답변을 다수결 투표로 선택하여 최종 출력을 결정하는 방법입니다. 이는 특히 chain-of-thought prompting(COT)과 함께 사용될 때 효과적으로 모델의 추론 능력과 일관성을 향상시킵니다. 인간과 유사한 사고 체계를 모방하는 방식으로 복잡한 문제에 대해 더 정확하고 신뢰할 수 있는 결과를 도출합니다.1. 개념 및 정의 항목 설명 비고 정의언어 모델의 동일한 프롬프트에 대해 여러 출력을 생성하고, 가장 일관된 응답을 다수결 투표로 결정하는 전략Wang et al. (2022) 도입목적추론 정확도 향상 및 일관성 확보Chain-of-thought(COT)과 ..

Topic 2025.05.31

Token-Level Filtering

개요대규모 언어 모델(LLM)을 활용한 텍스트 생성에서는 응답의 정확성, 품질, 다양성, 안전성을 제어하는 다양한 기법이 존재합니다. 그중에서도 가장 낮은 수준에서 작동하는 핵심 기술이 바로 **Token-Level Filtering(토큰 단위 필터링)**입니다. 이 기법은 모델이 출력할 다음 토큰 후보군에 대해 사전 정의된 기준으로 필터링 및 재정렬하여, 결과물의 품질을 정밀하게 제어할 수 있도록 합니다.1. 개념 및 정의Token-Level Filtering은 LLM이 다음 토큰을 예측할 때 출력하는 확률 분포(logits 또는 softmax 확률)에서, 부적절하거나 품질이 낮은 토큰을 제거 또는 확률 재조정하는 과정입니다. 이 과정은 디코딩 단계에 직접 개입하여, 단어 수준의 편향 제어, 위험 응답..

Topic 2025.05.25

FIM (Fill-In-the-Middle) Pre-training

개요FIM(Fill-In-the-Middle) Pre-training은 기존의 왼쪽-오른쪽(LM-style) 언어 모델 학습 방식과 달리, 텍스트의 중간을 채우는 학습 방식으로, 자연스러운 문맥 삽입 능력을 향상시키기 위한 사전학습 기법입니다. 코드 자동완성, 문장 편집, 함수 보완 등에서 특히 효과적이며, GitHub Copilot과 같은 코드 생성 모델에서 그 유용성이 입증되었습니다. FIM은 텍스트 조각을 “prefix, middle, suffix”로 분리하여 모델이 middle을 예측하도록 훈련합니다.1. 개념 및 정의항목설명정의FIM은 텍스트 시퀀스를 중간 삽입 방식으로 학습하여, Prefix와 Suffix 사이에 적절한 Middle을 생성하도록 모델을 훈련하는 사전학습 기법입니다.목적중간 문장..

Topic 2025.05.16

ReAct (Reasoning and Acting)

개요ReAct(Reasoning and Acting)는 대규모 언어모델(LLM)이 사고(Reasoning)와 외부 환경에 대한 행위(Action)를 번갈아 수행하도록 유도하는 프롬프트 설계 기법입니다. ReAct는 LLM이 단순히 응답을 생성하는 데 그치지 않고, 생각하고 → 도구를 호출하고 → 다시 생각하고 → 결론을 도출하는 방식으로 능동적이고 인터랙티브한 에이전트 추론 체계를 구현합니다. 이는 검색 기반 QA, 툴 기반 작업 자동화, 다단계 추론형 AI 어시스턴트 등에서 핵심 전략으로 활용됩니다.1. 개념 및 정의ReAct는 하나의 프롬프트 흐름 내에서 다음을 반복합니다:Thought: 문제를 해결하기 위한 사고 과정 (CoT 기반)Action: 외부 API, 계산기, 검색 도구 등을 호출Obser..

Topic 2025.04.07

Self-consistency Prompting

개요Self-consistency는 Chain-of-Thought(CoT) Prompting의 확장 기법으로, LLM이 생성한 다수의 응답 중에서 가장 일관되고 빈도 높은 정답을 선택하여 추론 정확도와 안정성을 높이는 전략입니다. 단일 응답에 의존하지 않고, 여러 번 추론을 수행한 뒤 그 중 가장 빈도 높은 결과(majority vote)를 최종 응답으로 채택함으로써, 특히 수학, 논리, 추론 등 고난도 문제에서 효과적인 성능을 보입니다.1. 개념 및 정의Self-consistency는 다음과 같은 과정으로 이루어집니다:Chain-of-Thought 방식으로 다양한 응답 샘플 생성 (sampling or temperature variation)각 응답의 최종 정답만 추출 (step-by-step reas..

Topic 2025.04.07

Few-shot Prompting

개요Few-shot Prompting은 대규모 언어모델(LLM)에게 작업 예시(few examples)를 함께 제공하여 모델이 문맥(Context)만으로 태스크를 학습하도록 유도하는 프롬프트 전략입니다. 이는 LLM의 사전학습된 능력을 활용해 별도 파인튜닝 없이 다양한 태스크에서 높은 성능을 낼 수 있게 하며, 특히 GPT-3 이후 널리 사용되는 대표적인 프롬프트 방식입니다.1. 개념 및 정의Few-shot Prompting은 다음과 같은 구조를 갖습니다:예시 포함: 입력 프롬프트에 몇 개의 문제-답 예시 포함문맥 기반 학습: 예시를 통해 모델이 태스크 구조를 이해함추론 일반화: 예시 패턴을 바탕으로 새로운 입력에 대해 응답 생성예시:Translate English to Korean:English: ap..

Topic 2025.04.07

Prompt Engineering 기법

개요Prompt Engineering(프롬프트 엔지니어링)은 대규모 언어모델(LLM)의 성능을 최대한 이끌어내기 위해 입력 프롬프트를 설계, 구성, 조정하는 기술입니다. GPT-4, Claude, LLaMA, PaLM 등 현대 LLM은 같은 모델이라도 프롬프트 구조에 따라 응답 품질이 크게 달라지기 때문에, 효과적인 프롬프트 설계가 매우 중요합니다. 최근에는 Chain-of-Thought(CoT), Zero-shot, Few-shot, Role prompting, Instruction tuning 등 다양한 기법이 활용되며, 프롬프트 자체가 모델 성능의 핵심 변수로 작용합니다.1. 개념 및 정의Prompt Engineering이란 모델에게 문제 해결을 요청할 때 사용하는 입력 문장을 명시적, 구조화된 방..

Topic 2025.04.06

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

ITPE * JackerLab

Prompt engineering 8

티스토리툴바