Prefix Tuning (프리픽스 튜닝)

Topic

Prefix Tuning (프리픽스 튜닝)

JackerLab 2025. 4. 6. 20:17

728x90

개요

Prefix Tuning은 대규모 사전학습 언어모델(Pretrained Language Model, PLM)을 효율적으로 미세조정(fine-tuning) 하기 위한 경량화 기법입니다. 전체 모델 파라미터를 업데이트하지 않고, 입력 앞에 학습 가능한 'prefix(접두어)' 벡터를 삽입해 원하는 태스크에 맞게 모델 출력을 조정하는 방식입니다. 이는 특히 모델 크기가 큰 GPT, T5, BERT 등에서 적은 계산 비용으로 빠르고 유연한 파인튜닝을 가능하게 해 줍니다.

1. 개념 및 정의

Prefix Tuning은 입력 시퀀스에 추가적인 학습 가능한 벡터(프리픽스)를 붙여서 Transformer의 각 레이어에서 key와 value에 영향을 미치는 방식으로 모델의 출력을 제어합니다.

기존 파라미터는 동결(freeze)
Prefix는 각 레이어마다 별도 학습 (deep prefix tuning)
Input에 직접 텍스트를 추가하는 것이 아닌, 추상적 벡터를 학습하는 soft prompt 방식

2. 특징

항목	설명	비고
파라미터 효율	전체 모델 파라미터는 고정, prefix만 학습	수천 배 적은 파라미터 업데이트
높은 성능 유지	Full Fine-tuning에 근접한 성능	GLUE, SuperGLUE 등에서 검증됨
멀티태스크 활용 용이	여러 태스크에 prefix만 교체	파라미터 공유 가능

Prefix Tuning은 Parameter-Efficient Tuning(PET)의 대표 기법 중 하나로 각광받고 있습니다.

3. 구성 요소

구성 요소	설명	예시
Prefix Embedding	각 레이어에 삽입할 학습 가능한 벡터	길이 5~20의 토큰 벡터
Prefix Generator	prefix를 고정된 벡터가 아닌 함수로 생성	MLP 기반 모듈 가능
Transformer Block	기존 언어모델의 attention 구조 유지	GPT, BERT, T5 등 활용
Task Head	텍스트 생성 또는 분류를 위한 출력층	LM Head, CLS Head 등

Prompt Tuning과는 달리, Prefix는 Transformer 내부에 직접 주입됩니다.

4. 주요 연구 및 확장 모델

연구/모델	설명	특징
Prefix Tuning (Li & Liang, 2021)	GPT-2 기반 생성 태스크 실험	Full Fine-tuning 수준의 성능 달성
P-Tuning	Continuous Prompt 학습	RoBERTa, BERT 지원
LoRA (Low-Rank Adaptation)	저차원 선형 조정 방식	Parameter-efficient tuning 대안
Prompt Tuning	임베딩 레벨 입력 튜닝	단순/경량화 목적에 적합

Prefix Tuning은 특히 텍스트 생성형 모델에 매우 효과적인 것으로 보고되고 있습니다.

5. 장점 및 이점

장점	설명	효과
경량화 학습	수십 배 적은 파라미터로 학습 가능	모델 업데이트 및 배포 간소화
빠른 파인튜닝	GPU 비용 절감, 학습 시간 단축	대규모 모델 실험 비용 절감
멀티태스크 유연성	각 태스크마다 prefix만 교체	파라미터 공유 및 재사용 가능

Prefix Tuning은 특히 자원 제한 환경에서 PLM을 활용하는 핵심 전략이 됩니다.

6. 주요 활용 사례 및 고려사항

분야	활용 사례	고려사항
텍스트 생성	요약, 번역, 문장 완성 등	Prefix 길이와 초기화 전략 중요
자연어 이해	감정 분석, 문장 분류	클래스 수에 따라 prefix 구성이 달라짐
대화형 AI	사용자 인텐트 반영	사용자별 prefix 학습 가능
Few-shot/N-shot	소수 데이터 기반 튜닝	prefix로 task instruction 대체 가능

훈련 안정성, prefix 위치, 학습률 스케줄링은 성능에 큰 영향을 줄 수 있습니다.

7. 결론

Prefix Tuning은 대규모 언어모델을 효과적으로 활용할 수 있는 가벼우면서도 강력한 튜닝 기법입니다. 특히 PLM을 활용한 다운스트림 태스크에서 학습 비용을 줄이고 성능을 유지할 수 있는 방법으로, Prompt Engineering과 함께 파인튜닝 전략의 새로운 표준으로 자리잡고 있습니다. 앞으로 LoRA, Adapter, Prompt Tuning 등과 함께 조합되어 멀티태스크 및 멀티모달 AI 개발의 핵심 구성 요소가 될 것입니다.

728x90

'Topic' 카테고리의 다른 글

Parallel Cross Attention (병렬 교차 주의) (0)	2025.04.06
Adapter Modules (어댑터 모듈) (1)	2025.04.06
SwAV (Swapping Assignments Between Multiple Views) (1)	2025.04.06
Contrastive Learning (대조학습) (0)	2025.04.06
MoCo, SimCLR (자기지도 학습) (0)	2025.04.06

현재글Prefix Tuning (프리픽스 튜닝)

250x250

ITPE * JackerLab

ITPE 관련 정보를 정리합니다.

Today :
Yesterday :

08-24 06:03

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

ITPE * JackerLab