728x90
반응형

안전한ai 3

Llama Guard

개요Llama Guard는 Meta AI에서 개발한 콘텐츠 안전성(Content Safety) 필터링 모델로, LLM(Large Language Model) 기반 시스템의 입력과 출력을 정밀하게 평가하고 유해성, 편향, 악용 가능성을 판단합니다. 특히 Llama 및 다양한 오픈소스 LLM과 통합 가능한 구조로 설계되어, AI 안전성과 윤리적 사용을 강화하는 데 핵심 역할을 합니다.1. 개념 및 정의 항목 내용 정의LLM 입력/출력에 대한 정책 기반 콘텐츠 안전성 판단 모델목적AI 응답의 유해성 방지 및 사용자 안전 보호필요성LLM이 악용되거나 유해 콘텐츠를 생성하는 것을 방지하기 위함2. 주요 특징특징설명장점정책 기반 분류기Meta의 콘텐츠 정책 기준에 따라 입력/출력 분류일관된 안전성 검토 가능Ins..

Topic 2025.12.21

Function-Call Firewall

개요대형 언어 모델(LLM)을 이용한 애플리케이션에서 외부 API 호출, 시스템 함수 실행, 툴 연동을 위한 function calling 기능이 빠르게 확산되고 있습니다. 그러나 무제한 또는 비제한적인 함수 호출은 보안 위협, 자원 낭비, 서비스 장애 등을 유발할 수 있습니다. 이를 제어하고 보호하기 위한 핵심 기술로 등장한 개념이 바로 **Function-Call Firewall(FCF)**입니다. 본 글에서는 FCF의 정의, 구성 요소, 적용 시나리오, 보안 효과 등을 실무 중심으로 정리합니다.1. 개념 및 정의Function-Call Firewall(FCF)은 LLM이 외부 함수나 API를 호출할 때 이를 사전에 분석·검증·허용 여부를 판단하는 중간 제어 계층입니다. 이는 전통적인 네트워크 방화벽..

Topic 2025.08.24

Phi-2

개요Phi-2는 Microsoft에서 개발한 2.7B 파라미터 규모의 경량 언어 모델로, 소형임에도 불구하고 다양한 벤치마크에서 중대형 모델을 능가하는 성능을 보이는 대표적인 '스몰 언어 모델(SLM)'입니다. 혁신적인 커리큘럼 학습 전략과 정제된 데이터셋을 기반으로 학습되어, 교육, 코딩, 논리추론 등 다양한 영역에서 고성능을 실현합니다.1. 개념 및 정의Phi-2는 학습 효율성과 품질 간의 최적 균형을 목표로 설계된 SLM으로, 특히 학습 데이터의 질과 구성 전략에 중점을 둔 모델입니다.모델 규모: 2.7B 파라미터 (Transformer 기반)학습 전략: 인위적 품질 필터링 + 커리큘럼 학습 + 중복 제거적용 영역: 교육적 질의응답, 수학 추론, 코딩, 자연어 이해 등2. 특징 항목 Phi-2 특..

Topic 2025.05.22
728x90
반응형