728x90
반응형

prompt injection 3

Prompt Injection

개요Prompt Injection은 대규모 언어 모델(LLM, Large Language Model) 을 겨냥한 보안 공격 기법으로, 모델의 입력(Prompt)을 악의적으로 조작하여 의도하지 않은 출력을 유도하는 방식입니다. 이는 SQL Injection과 유사하게, 모델의 동작을 교란하거나 민감한 정보를 유출시키는 심각한 보안 문제로 부각되고 있습니다.1. 개념 및 정의 구분 내용 정의Prompt Injection은 악성 프롬프트를 통해 모델이 원래 의도와 다르게 동작하도록 유도하는 공격입니다.목적모델 출력 왜곡, 민감 정보 탈취, 시스템 접근 유도필요성생성형 AI 확산과 함께 사용자 입력을 신뢰하는 구조적 취약성이 확대됨Prompt Injection은 AI 보안의 가장 주목받는 위협 중 하나입니다...

Topic 2025.09.20

OWASP LLM Top 10

개요OWASP LLM Top 10은 대규모 언어 모델(LLM, Large Language Model) 보안 위협과 이에 대한 대응 방안을 정리한 국제 보안 가이드라인입니다. ChatGPT, Claude, LLaMA와 같은 생성형 AI가 확산됨에 따라, 모델 자체와 이를 활용한 서비스의 보안 문제가 대두되고 있으며, OWASP LLM Top 10은 이에 대한 표준화된 위험 인식 체계를 제공합니다.1. 개념 및 정의 구분 내용 정의OWASP LLM Top 10은 LLM 보안과 관련된 주요 위험 10가지를 정의하고 완화 전략을 제시하는 문서입니다.목적AI 보안 위협 인식 제고, 안전한 LLM 활용 가이드 제공필요성LLM은 복잡성과 불확실성으로 인해 기존 보안 프레임워크로는 충분히 보호되지 않음OWASP는 애..

Topic 2025.09.20

Context Window Firewall

개요Context Window Firewall(CWF)은 대규모 언어모델(LLM)의 입력 컨텍스트 창(context window)에 삽입되는 악성 지시문, 정보 탈취 프롬프트, 프라이버시 침해 내용을 탐지·차단하는 보안 기술이다. 특히 RAG, 멀티턴 대화, WebLLM 등에서 외부 삽입 콘텐츠로 인한 공격(예: 프롬프트 인젝션)을 방지하는 핵심 기법으로 주목받고 있다.1. 개념 및 정의**Context Window Firewall(CWF)**는 LLM 입력 시 구성되는 전체 컨텍스트(window) 내부를 실시간 분석하고, 정책에 위배되거나 위험성이 있는 텍스트 시퀀스를 탐지·조정·삭제하는 보안 계층이다.목적: 컨텍스트 내 무단 프롬프트 삽입(Prompt Injection), Jailbreak, 탈정보 ..

Topic 2025.07.14
728x90
반응형