Topic

RIFT (Routing In Fat-Trees)

JackerLab 2025. 6. 24. 04:40
728x90
반응형

개요

RIFT(Routing In Fat-Trees)는 대규모 데이터센터 환경에서 사용되는 Fat-Tree 토폴로지에 최적화된 최신 계층적 라우팅 프로토콜이다. 고속 전환, 안정적 수렴, 확장성을 목표로 설계된 RIFT는 기존 라우팅 프로토콜의 복잡성과 오버헤드를 줄이면서, 자동화와 패브릭 중심 운영에 적합한 구조를 갖춘다.


1. 개념 및 정의

RIFT는 네트워크 토폴로지를 계층(hierarchy)으로 구분하고, 각 계층 간 역할을 분리하여 라우팅 효율성과 단순화를 달성하는 프로토콜이다. Leaf-Spine 구조를 포함한 다양한 Clos/Fat-Tree 환경에서 동작하며, 상하위 계층 간 링크 상태만을 교환함으로써 라우팅 상태 폭발을 방지한다.

구성 요소 설명 예시
Top-of-Fabric (ToF) 최상위 계층 라우터, 백본 역할 Spine 스위치 최상단
Spine 중간 계층, Leaf를 연결 Spine 스위치
Leaf 서버에 인접한 라우터 ToR (Top of Rack) 스위치
East-West Links 동등 계층 간 연결 Leaf 간 직접 연결 (선택적)

2. 특징

항목 RIFT OSPF/BGP IS-IS
라우팅 구조 수직 계층 통신 평면 라우팅 평면 라우팅
링크 상태 전파 상·하위 계층 간 제한 전체 네트워크 브로드캐스트 전체 Flooding
자동 구성 Zero-Touch Fabric 지원 복잡한 설정 복잡한 설정
스케일 확장성 매우 우수 제한적 제한적
  • Top-Down/Bottom-Up 방식: 아래에서 경로 정보 집계, 위에서 Prefix 전달
  • Zero Touch Provisioning (ZTP): 스위치 연결만으로 자동 구성 가능
  • Fabric Integrity 체크: 비정상 루프, 잘못된 연결을 사전에 감지

3. 작동 메커니즘

흐름 설명
Northbound Flow Leaf → Spine → ToF 방향의 경로 정보 집계
Southbound Flow ToF → Spine → Leaf 방향의 Prefix 배포
Horizontal Links 동일 계층 간 ECMP 경로 처리 (선택 사항)
Default Prefix Injection Leaf는 기본 경로를 상위에서 수신해 간단히 라우팅 처리
  • ToF 스위치가 최상위 Prefix Root 역할 수행
  • 각 계층은 이웃 인식 범위를 제한하여 전체 네트워크 수렴 속도 향상

4. 장점 및 이점

장점 설명 기대 효과
대규모 스케일 지원 트래픽 폭증 환경에서도 안정적 운영 데이터센터 확장 유연성 증가
자동 구성 복잡한 설정 없이도 구조 자동 인식 운영 효율 향상, 오류 감소
빠른 장애 복구 Topology 인지 범위 최소화로 빠른 수렴 네트워크 가용성 향상
경로 최적화 불필요한 경로 학습 제거 ECMP 기반 부하 분산 효율화

5. 활용 사례 및 고려사항

사례 적용 방식 고려사항
Hyperscale 클라우드 수천 대 이상의 스위치가 연결된 데이터센터 패브릭 구성 하위 계층의 자동 번호 매김(Prefix Index) 구조 설계 필요
프라이빗 데이터센터 오버레이 구조 없이 L3 기반 구성 기존 네트워크와의 경계 라우팅 고려
AI 클러스터 네트워크 고대역폭 고밀도 트래픽 패턴 대응 Incast, Congestion 대응 전략 병행 필요
  • RIFT는 현재 IETF RFC 기준으로 표준화 진행 중 (draft 기준)
  • 일부 상용 스위치 벤더만 현재 지원 (예: Nokia, Cumulus 기반 장비 등)

6. 결론

RIFT는 현대 데이터센터 요구사항에 최적화된 구조와 기능을 제공하는 차세대 계층적 라우팅 프로토콜로, 자동화된 구성, 빠른 장애 복구, 높은 확장성과 같은 핵심 특성을 통해 클라우드 인프라 운영을 더욱 단순하고 효율적으로 만든다. 향후 AI/ML 워크로드 증가와 함께 패브릭 네트워크의 표준 솔루션으로 자리잡을 가능성이 높다.

728x90
반응형

'Topic' 카테고리의 다른 글

Prophet Forecast Model  (2) 2025.06.24
One Table (Lakehouse Multi-Engine Table Spec)  (0) 2025.06.24
IriusRisk  (0) 2025.06.24
Data Flow Diagram (DFD)  (0) 2025.06.24
Attack Tree  (0) 2025.06.23