728x90
반응형

인시던트관리 2

Blast Radius

개요Blast Radius(블라스트 레이디우스)는 시스템에서 장애 또는 변경이 발생했을 때 영향을 받는 범위를 시각적으로 정의한 개념입니다. 주로 클라우드 인프라, 마이크로서비스 아키텍처, 보안 사고 분석, 변화 관리(Change Management) 등에서 활용되며, 안정성 중심의 시스템 설계와 운영 전략을 수립하는 데 핵심 기준으로 작용합니다.1. 개념 및 정의Blast Radius는 한 요소의 실패 또는 변경이 얼마나 많은 다른 구성요소나 사용자에게 영향을 미치는지를 나타내는 리스크 범위의 시각화입니다.주요 목적시스템 설계 시 장애 전파 최소화변경 배포 시 리스크 범위 사전 예측모니터링과 롤백 계획의 기준 수립2. 특징 항목 설명 효과 영향 기반 분류단일 포인트 실패 시 전파 범위 시각화고가용성..

Topic 2025.06.28

SRE(Site Reliability Engineering)

개요SRE(Site Reliability Engineering)는 대규모 시스템의 안정성과 가용성을 확보하면서도 빠른 배포와 확장을 가능하게 하는 운영 엔지니어링 프레임워크입니다. 구글(Google)에서 시작된 이 방식은 전통적인 시스템 운영과 소프트웨어 개발 간의 경계를 허물며, 코드 기반의 자동화된 운영과 지속적인 개선을 핵심 가치로 삼습니다.1. 개념 및 정의SRE는 ‘운영을 소프트웨어 엔지니어링 관점에서 접근’하는 방식입니다. 개발팀과 운영팀 간의 충돌을 줄이고, 시스템 안정성과 신속한 제품 개선을 동시에 달성하는 것을 목표로 합니다.핵심 개념:SLI(SLI: Service Level Indicator): 측정 지표 (예: 가용성, 오류율, 응답 시간)SLO(SLO: Service Level Ob..

Topic 2025.04.05
728x90
반응형