Topic

FeFET In-Memory Compute

JackerLab 2025. 5. 31. 04:07
728x90
반응형

개요

FeFET(Ferroelectric Field-Effect Transistor) In-Memory Compute는 전통적인 메모리-프로세서 간 데이터 이동의 병목 현상을 해소하고, 연산을 메모리 내에서 직접 수행함으로써 에너지 효율을 극대화하는 AI 하드웨어 기술입니다. 강유전체 특성을 이용한 FeFET은 고속, 저전력, 비휘발성이라는 특성을 가지며, 차세대 인공지능 추론/학습용 가속기의 핵심 컴포넌트로 부상하고 있습니다.


1. 개념 및 정의

항목 설명 비고
정의 강유전체 특성을 가진 트랜지스터를 이용하여 메모리 내에서 직접 연산을 수행하는 컴퓨팅 방식 Ferroelectric + FET 기반
목적 프로세서와 메모리 간 데이터 이동 없이 연산 처리 Von Neumann 병목 해소
필요성 AI 연산의 폭증, 에너지 효율 요구 증가 엣지/모바일 환경 필수 기술화 중

FeFET 기반 IMC는 AI 연산을 전통적 아키텍처 외에서 수행하는 패러다임 전환 기술입니다.


2. 특징

특징 설명 비교
비휘발성 저장 + 연산 전원이 꺼져도 정보 유지 DRAM 대비 전력 소모 감소
인메모리 행렬 곱 연산 가능 MAC(Multiply-Accumulate) 연산을 셀 내 수행 DNN 가속에 최적화됨
고속 스위칭 + 저전력 ns급 응답속도 + pJ급 에너지 소모 RRAM, PCM 대비 스위칭 우수

FeFET은 AI 연산에서 반복되는 행렬-벡터 곱을 효율적으로 처리할 수 있습니다.


3. 구성 요소

구성 요소 설명 예시
FeFET 셀 강유전체 + 게이트 산화막 + 소스/드레인 구조 Gate에 FeOxide 삽입된 nFET 구조
Word Line / Bit Line 메모리 배열 접근 및 제어 SRAM과 유사 구조로 확장 가능
계산 셀 어레이 행렬 연산을 병렬 수행하는 메모리 구조 Crossbar 형태로 구성 가능
Sense Amplifier 연산 결과를 아날로그-디지털로 전환 전류 차이 기반 비교 연산 포함
온칩 제어 로직 연산 스케줄링 및 메모리 액세스 제어 Microcontroller 내 포함

FeFET 어레이는 데이터 저장과 동시에 곱셈 연산 결과를 출력할 수 있습니다.


4. 기술 요소

기술 요소 설명 관련 기술
MAC in Memory 곱셈-누산 연산을 메모리 내에서 수행 CNN/DNN 연산의 핵심 연산
Analog Compute 아날로그 신호 기반 연산 처리 SAR ADC + DAC 연계 필요
Ferroelectricity 전계 인가 시 이력 현상을 활용한 상태 저장 비휘발성 특성 제공
CMOS 호환성 기존 CMOS 공정과 통합 가능 기존 로직과 통합 비용 절감
Quantized Weight Storage 2~8bit 양자화된 가중치 저장 및 연산 QAT 기반 모델에 유리

이러한 요소는 연산 밀도, 전력 효율, 생산 가능성 측면에서 장점을 가집니다.


5. 장점 및 이점

장점 설명 기대 효과
에너지 효율 향상 DRAM 대비 수십 배 전력 절감 배터리 기반 엣지 디바이스 수명 향상
연산 병목 해소 데이터 이동 최소화로 성능 향상 Von Neumann 병목 완화
고속 응답 ns 단위 스위칭 시간 실시간 AI 추론 가능
소형 집적 가능 CMOS 공정 호환성 모바일/엣지 통합에 유리

FeFET IMC는 “저전력 고성능 AI 연산”을 구현하는 최적 기술로 평가받고 있습니다.


6. 주요 활용 사례 및 고려사항

활용 사례 설명 고려사항
엣지 AI 추론 CCTV, IoT, 웨어러블에서 실시간 AI 적용 열 관리 및 양자화 정밀도 고려 필요
뉴로모픽 컴퓨팅 뇌 모사 컴퓨팅의 메모리-시냅스 역할 Spiking 모델과의 호환성 검토 필요
온디바이스 LLM 처리 모바일 내 LLM inference 모델 경량화와 병행 필요
센서+컴퓨팅 통합 센서단에서 바로 inference 수행 co-located compute 구조 설계 필요

도입 시 공정 안정성, 신뢰성 검증, 학습 불가 구조에 대한 처리 전략이 중요합니다.


7. 결론

FeFET In-Memory Compute는 고속, 저전력, 고집적 AI 연산 구조로서 기존의 메모리-프로세서 이분법적 아키텍처를 벗어난 진정한 ‘메모리 내 컴퓨팅’을 가능하게 합니다. 엣지·모바일·저전력 AI 응용에서 뛰어난 성능과 확장성을 보이며, 향후 LLM 엣지 추론, 뉴로모픽 플랫폼, 초저전력 임베디드 AI의 핵심 기술로 자리잡을 것입니다.

728x90
반응형