728x90
반응형

rate limiting 2

Model Denial of Service (Model DoS)

개요Model Denial of Service(DoS)는 대규모 언어 모델(LLM) 과 같은 AI 시스템에 과도한 요청이나 악의적 입력을 보내 모델 응답 속도를 저하시키거나 정상 서비스를 불가능하게 만드는 공격 기법입니다. 이는 기존 네트워크 DoS 공격과 유사하지만, AI 모델의 고비용 연산 자원을 표적으로 삼는다는 점에서 차별화됩니다.1. 개념 및 정의 구분 내용 정의Model DoS는 과도한 요청 처리나 악성 프롬프트를 통해 모델의 응답 불가 상태를 유발하는 공격입니다.목적모델 가용성 저하, 서비스 중단, 비용 상승 유발필요성LLM은 연산 비용이 높아, DoS 공격 시 피해 규모가 기존 시스템보다 큼이 공격은 OWASP LLM Top 10에서 네 번째 주요 위험 요소로 지정되었습니다.2. 특징특징..

Topic 2025.09.21

Rate-Limiter 패턴

개요Rate-Limiter 패턴은 클라이언트 또는 요청 단위로 호출 빈도를 제한하여 시스템의 과부하를 방지하고, 자원의 공정한 분배를 보장하는 마이크로서비스 아키텍처 패턴입니다. 이 패턴은 API Gateway, 백엔드 서버, 인증 시스템 등 다양한 위치에서 적용되며, DDoS 대응, API 남용 방지, QoS 유지 등 현대 웹 서비스의 안정성과 확장성을 확보하는 핵심 요소로 자리잡고 있습니다.1. 개념 및 정의 항목 설명 정의Rate-Limiter는 지정된 시간 간격 내에 수용 가능한 최대 요청 수를 제한하는 시스템 보호 메커니즘입니다.목적트래픽 폭주로 인한 시스템 성능 저하 방지 및 공정한 리소스 배분필요성과도한 요청에 의해 발생하는 서버 과부하, 비용 증가, 보안 위협 대응 필요Rate-Limit..

Topic 2025.05.15
728x90
반응형