728x90
반응형

자동화 운영 2

IOAM (In-situ Operations, Administration, and Maintenance)

개요IOAM(In-situ OAM)은 네트워크 패킷 내에 운영/관리/유지보수 정보를 삽입하여, 네트워크 장비를 별도로 설정하지 않아도 실시간으로 성능 측정과 문제 진단이 가능하도록 설계된 IETF 표준 기술입니다. 패킷이 이동하면서 수집되는 정보는 트래픽 흐름에 대한 심층적 가시성을 제공하며, SDN, 5G, 클라우드 네트워크 등 고성능 인프라에서 필수적으로 활용되고 있습니다.1. 개념 및 정의 항목 내용 비고 정의네트워크 패킷에 운영 정보를 실시간 삽입하는 OAM 기술IETF RFC 9197 등 기반목적트래픽 경로에서 성능 및 장애 정보 실시간 수집에이전트 불필요한 경량 모니터링적용 분야데이터센터, ISP 백본망, 5G, 클라우드, SDN 등고성능 네트워크 필수 기술2. 특징항목설명비고실시간 수집네..

Topic 2025.10.23

Sustainable SRE

개요SRE(Site Reliability Engineering)는 시스템 가용성과 신뢰성을 극대화하기 위한 현대적인 운영 패러다임입니다. 하지만 고도화된 복잡성, 알람 피로(alert fatigue), 무제한적 온콜(on-call) 부담은 SRE 팀의 번아웃을 유발하고 지속 가능성을 위협합니다. 이에 대한 대응으로 Sustainable SRE 개념이 부상하고 있습니다. 본 글에서는 신뢰성과 인간 중심 운영의 균형을 추구하는 Sustainable SRE의 개념, 구조, 기술 및 문화적 실천 방안을 정리합니다.1. 개념 및 정의Sustainable SRE는 시스템 신뢰성과 운영 효율성을 유지하면서도 엔지니어의 웰빙과 조직의 지속 가능성을 고려한 사이트 신뢰성 엔지니어링 방식입니다.단기적인 장애 대응보다 예방..

Topic 2025.07.17
728x90
반응형