'EdgeAI' 태그의 글 목록

Mixture-of-Depthwise Experts (MoDE)

개요Mixture-of-Depthwise Experts(MoDE)는 딥러닝 모델의 경량화와 성능을 동시에 달성하기 위해 제안된 효율적인 합성곱 신경망 아키텍처다. 기존의 Mixture-of-Experts(MoE)와 Depthwise Convolution 기법을 결합하여, 연산량을 줄이면서도 학습 및 추론 정확도를 유지하거나 향상시키는 것이 핵심 목적이다.1. 개념 및 정의 항목 설명 정의MoDE는 여러 개의 depthwise convolution 전문가를 조합하여 입력에 따라 선택적으로 활성화하는 경량 딥러닝 구조목적연산 효율성과 정확도 향상을 동시에 추구하는 모바일·엣지 친화형 모델 구성필요성대규모 모델의 추론 비용 증가 문제 해결 및 Edge 환경에서의 실시간 대응력 확보2. 특징특징설명기존 기술과..

Topic 2025.07.17

Photonic Tensor Core

개요Photonic Tensor Core는 빛(광자)을 활용한 병렬 텐서 연산을 수행하는 하드웨어 아키텍처로, 기존 전자 기반 GPU·TPU 연산의 전력 한계를 극복하고자 등장한 차세대 광 컴퓨팅 연산 코어입니다. 특히 AI 모델 추론과 훈련에서 요구되는 행렬 곱셈(MATMUL) 연산을 초고속·초저전력으로 처리할 수 있어, 차세대 AI 칩 및 엣지 AI 응용 분야에서 주목받고 있습니다.1. 개념 및 정의Photonic Computing: 전자 대신 광자를 계산 매체로 활용하는 컴퓨팅 방식Tensor Core: AI 연산을 위한 행렬 곱셈 특화 병렬 연산 유닛Photonic Tensor Core: 광학 회로 내에서 텐서 연산을 수행하도록 설계된 연산 유닛2. 특징 항목 설명 기존 방식과 비교 전력 효율..

Topic 2025.07.07

Edge Data Product

개요Edge Data Product는 엣지(Edge) 위치에서 생성·수집되는 데이터를 실시간 분석, 처리, 정제하여 중앙 시스템이나 클라우드로 이전 없이도 직접 활용 가능하도록 만든 독립적인 데이터 제품 단위입니다. 데이터 메쉬(Data Mesh)와 데이터 제품 사고방식을 엣지 컴퓨팅 환경에 적용한 개념으로, 제조, 리테일, 스마트시티 등 분산 환경에서 데이터의 시간 가치와 실시간성을 극대화하는 전략적 설계 모델입니다.1. 개념 및 정의Edge: 센서, 게이트웨이, IoT 장비 등이 존재하는 네트워크 말단의 데이터 생성 지점Data Product: 특정 목적에 최적화된 데이터 처리·정의·제공 단위. API, 스키마, SLA 포함Edge Data Product: 엣지 위치에서 생성 및 가공된 데이터를 서비..

Topic 2025.07.06

In-Network AI Pre-Filter

개요In-Network AI Pre-Filter는 데이터센터나 클라우드 경계 외부의 네트워크 계층(엣지, 스위치, 게이트웨이 등)에서 실시간으로 흐르는 데이터를 분석하고 불필요하거나 위험한 트래픽, 민감 정보를 사전에 필터링하는 AI 기반의 선처리(pre-filtering) 기술입니다. 대규모 LLM 시스템, AI API 게이트웨이, 고속 IoT 환경 등에서 처리 효율성 및 보안성 확보를 위한 핵심 인프라로 주목받고 있습니다.1. 개념 및 정의In-Network AI: 네트워크 내에서 ML 모델을 실시간 실행하여 트래픽 흐름을 분석하고 반응하는 기술Pre-Filter: 메인 AI 모델 또는 백엔드 시스템에 도달하기 전 사전 조건 검사를 통해 유효성 판단 및 필터링In-Network AI Pre-Filte..

Topic 2025.07.06

PdM 4.0(Predictive Maintenance 4.0)

개요PdM 4.0(Predictive Maintenance 4.0)은 IIoT(Industrial Internet of Things)와 AI 기술을 기반으로 장비의 상태를 실시간으로 모니터링하고, 고장을 사전에 예측하여 계획적으로 정비하는 차세대 유지보수 전략입니다. 기존의 정기 점검(TBM)이나 사후 수리(RBM) 방식에서 벗어나, 데이터 기반의 정비 자동화 및 운영 최적화를 실현하는 핵심 기술입니다.1. 개념 및 정의PdM 4.0은 IoT 센서, 엣지 디바이스, 클라우드 분석 플랫폼, 머신러닝 알고리즘 등을 활용하여 설비 고장을 사전에 감지하고, 최적의 시점에 정비를 수행할 수 있도록 하는 디지털 트윈 기반 예지 정비 체계입니다.목표: 계획되지 않은 다운타임 최소화 및 유지보수 비용 절감핵심 요소: ..

Topic 2025.06.17

AWQ(Activation-aware Weight Quantization)

개요AWQ(Activation-aware Weight Quantization)는 대형 언어 모델의 추론 성능을 유지하면서도 4비트 양자화(INT4)를 실현하는 최신 양자화 기술이다. 기존 양자화 방식보다 더 적은 연산 자원으로 더 빠르고 정확한 추론이 가능하며, 특히 클라우드 및 로컬 환경에서의 효율적인 LLM 배포에 주목받고 있다.1. 개념 및 정의 항목 내용 정의AWQ는 'Activation-aware Weight Quantization'의 약자로, 활성값(activation)을 고려하여 가중치를 정밀하게 양자화하는 기술목적고성능 LLM의 정확도를 유지하면서도 저비용, 저전력 환경에 맞게 최적화필요성기존 8bit, 16bit 기반 추론 시스템의 성능/비용 한계를 극복하고, 4bit 정수 연산 기반 ..

Topic 2025.06.14

Processing-in-Memory(PIM) DRAM

개요Processing-in-Memory(PIM) DRAM은 기존 CPU-메모리 간 분리된 구조(Von Neumann Architecture) 한계를 극복하기 위해, DRAM 내부에 연산 기능(Processing Logic)을 통합하여 메모리 내에서 직접 데이터 처리를 수행하는 차세대 컴퓨팅 아키텍처입니다. 이 접근법은 데이터 이동 병목(Data Movement Bottleneck)과 에너지 소모를 획기적으로 줄여 AI, HPC(High Performance Computing), Edge Computing 등 데이터 집약형 응용 분야에 최적화된 솔루션을 제공합니다.1. 개념 및 정의 항목 항목 정의DRAM 메모리 내부에 연산 유닛을 내장하여 데이터 이동 없이 메모리에서 직접 데이터 처리 수행목적CPU-..

Topic 2025.05.02

넷어댑트(NetAdapt)

개요NetAdapt(넷어댑트)는 주어진 하드웨어 성능 제약(예: 연산량, 지연시간, 메모리 크기)에 맞춰 자동으로 최적의 딥러닝 모델 구조를 찾아주는 경량화 알고리즘입니다. 기존의 고정된 네트워크 구조를 사용하는 것이 아니라, 성능 손실을 최소화하면서 하드웨어 자원에 최적화된 경량 모델을 자동 탐색하여, 실제 환경에서 추론 효율을 극대화하는 것이 핵심입니다.1. 개념 및 정의 항목 설명 정의실제 하드웨어 측정 기반으로 딥러닝 모델을 자동 경량화하여 추론 효율을 최적화하는 알고리즘개발 배경수동 튜닝의 한계, 연산량 기반 최적화의 실제 성능 불일치 문제를 해결하기 위해 등장적용 분야스마트폰, IoT, 드론, 자율주행, 로봇 등의 엣지 환경 AI 모델 최적화2. 작동 방식단계설명1. 성능 측정원본 모델을 다..

Topic 2025.04.24

셔플넷(ShuffleNet)

개요ShuffleNet은 경량 딥러닝 모델로, 모바일·IoT 환경에서도 높은 정확도를 유지하면서도 매우 낮은 연산량과 파라미터 수를 갖춘 합성곱 신경망(CNN) 구조입니다. 2017년 중국 메그비(Megvii, Face++) 연구진이 발표했으며, Group Convolution과 Channel Shuffle이라는 두 가지 혁신적 기법을 도입해 MobileNet 대비 더 높은 연산 효율을 달성한 것이 특징입니다.1. 개념 및 정의 항목 설명 정의경량 모델에서 발생하는 채널 간 정보 흐름의 한계를 해결하기 위해 ‘채널 셔플링(Channel Shuffle)’을 적용한 CNN 구조목적경량화된 모델에서 정보 병목을 최소화하면서도 정확도 향상대표 구조ShuffleNet V1, ShuffleNet V2 (2018)..

Topic 2025.04.24

모바일넷(MobileNet)

개요MobileNet은 모바일, IoT, 임베디드 디바이스처럼 연산 및 메모리 자원이 제한된 환경에서 실시간 딥러닝 추론이 가능하도록 설계된 경량 합성곱 신경망(CNN) 구조입니다. Google이 2017년 발표한 MobileNet은 경량성과 정확도 사이의 균형을 맞추기 위해 깊이별 분리 합성곱(Depthwise Separable Convolution)이라는 혁신적인 구조를 도입했으며, 이후 다양한 변형(MobileNetV2, V3 등)을 통해 성능이 지속적으로 개선되고 있습니다.1. 개념 및 정의 항목 설명 정의경량 CNN 모델로, 연산량과 파라미터 수를 줄이기 위한 Depthwise Separable Convolution 기반 구조목적모바일·에지 디바이스에서 효율적이고 빠른 추론이 가능하도록 최적화..

Topic 2025.04.24

스퀴즈넷(SqueezeNet)

개요SqueezeNet은 딥러닝 모델의 크기(파라미터 수)를 극도로 줄이면서도 AlexNet 수준의 정확도를 유지하는 것을 목표로 개발된 초경량 합성곱 신경망(CNN) 구조입니다. 2016년 Forrest N. Iandola 등 UC Berkeley 팀이 제안했으며, 경량 딥러닝 분야에서 대표적인 연구 결과로 인정받고 있습니다. 특히 모바일, 임베디드, IoT 장비와 같이 메모리·계산 자원이 제한된 환경에서 강력한 이미지 인식 성능을 제공하는 것이 특징입니다.1. 개념 및 정의 항목 설명 정의파라미터 수를 50배 이상 줄이면서도 AlexNet 수준의 정확도를 유지하는 초경량 CNN 모델모델 크기약 4.8MB (AlexNet: 약 240MB)주요 특징파라미터 절감, 연산 효율화, 경량화에 최적화된 아키텍..

Topic 2025.04.24

경량 딥러닝 기술(Lightweight Deep Learning)

개요경량 딥러닝 기술(Lightweight Deep Learning)은 인공지능(AI) 모델의 크기, 계산량, 전력 소비를 최소화하여 모바일, IoT, 임베디드, 에지 디바이스 등 성능 제약이 있는 환경에서도 딥러닝을 실행할 수 있도록 최적화하는 기술입니다. AI의 클라우드 중심 구조에서 벗어나 디바이스 자체에서의 추론이 가능해짐으로써 지연 최소화, 네트워크 의존도 감소, 개인정보 보호 등 다양한 이점을 제공합니다.1. 개념 및 정의 항목 설명 정의기존의 대형 AI 모델을 크기, 속도, 연산 효율 면에서 최적화하여 저사양 환경에서도 동작하도록 경량화한 기술적용 환경모바일 앱, IoT 기기, CCTV, 드론, 웨어러블, 자동차 등목적AI의 온디바이스(On-Device) 실행을 가능하게 하여 실시간 처리와..

Topic 2025.04.24

Pruning with Lottery Ticket Hypothesis(로터리 티켓 가설 기반 가지치기)

개요Pruning with Lottery Ticket Hypothesis(로터리 티켓 가설 기반 가지치기)는 복잡한 딥러닝 모델 속에서 성능은 유지하면서도 훨씬 작고 효율적인 서브네트워크(Subnetworks)를 찾아내는 최적화 전략입니다. 이 개념은 모델 압축 및 추론 최적화의 중요한 전환점을 제시하며, 특히 자원이 제한된 엣지 디바이스에서 경량화된 모델 구현에 강력한 효과를 발휘합니다.1. 개념 및 정의Lottery Ticket Hypothesis(LTH)는 2019년 Frankle & Carbin 논문에서 제시된 이론으로, 초기 무작위로 설정된 딥러닝 모델 내에는 동일한 초기화값과 동일한 구조로 훈련했을 때도 원래 모델과 유사한 성능을 낼 수 있는 'Winning Ticket'(당첨 티켓)이 존재한..

Topic 2025.04.09

Quantization-aware Training(QAT)

개요Quantization-aware Training(QAT, 양자화 인지 학습)은 딥러닝 모델의 경량화(모델 크기 축소 및 연산량 감소)를 위해 도입되는 기술 중 하나로, 학습 과정에서 양자화를 시뮬레이션하여 정확도 손실을 최소화합니다. 특히 엣지 디바이스나 모바일 환경에서 고속 추론과 낮은 전력 소비가 요구되는 분야에 적합하며, Post-Training Quantization(PTQ)보다 높은 정밀도를 유지할 수 있다는 장점이 있습니다.1. 개념 및 정의QAT는 훈련 단계부터 8-bit 또는 정수 연산을 염두에 두고, 양자화 시뮬레이션을 포함한 연산을 통해 모델을 학습시키는 방식입니다. 이는 학습 중 float 연산과 양자화된 정수 연산 사이의 오차를 고려하여 weight와 activation을 함께..

Topic 2025.04.08

Incremental Learning(점진적 학습)

개요Incremental Learning(점진적 학습)은 데이터가 순차적으로 유입되는 환경에서 기존 학습 모델을 재학습 없이 점진적으로 업데이트할 수 있는 머신러닝 기법입니다. 특히 스트리밍 데이터, IoT, 실시간 모니터링 시스템 등에서 활용도가 높으며, 저장 공간과 연산 자원이 제한된 상황에서 매우 효과적인 접근 방식입니다.1. 개념 및 정의점진적 학습이란 전체 데이터를 한 번에 학습하는 전통적인 방식과 달리, 데이터가 연속적으로 주어질 때마다 기존 모델을 업데이트하는 학습 방식입니다. 이를 통해 학습 모델은 새로운 정보에 적응하면서도 이전에 학습한 내용을 유지할 수 있습니다.주요 목적은 지속 가능한 학습, 효율적인 자원 활용, 실시간 분석 대응에 있으며, 특히 온라인 학습(Online Learnin..

Topic 2025.04.08

스몰 데이터 AI(Small Data AI)

개요스몰 데이터 AI(Small Data AI)는 대규모 학습 데이터가 없는 환경에서도 효율적인 학습과 예측이 가능한 인공지능 기술 및 접근 방식을 의미합니다. 이는 수천만~수억 개의 샘플을 요구하는 기존 딥러닝과 달리, 적은 양의 데이터로도 학습 가능하도록 설계된 경량화된 알고리즘, 전이 학습, 데이터 증강, 메타 러닝 등이 핵심입니다. 산업 현장, 의료, 제조, 특수 환경 등 데이터 확보가 어려운 분야에서 실용성을 인정받고 있으며, LLM 이후의 ‘효율 중심 AI’ 트렌드를 대변하고 있습니다.1. 개념 및 정의 구분 정의 스몰 데이터소수의 레이블된 샘플, 수십~수천 개 수준의 제한된 학습 데이터스몰 데이터 AI스몰 데이터를 기반으로도 일반화 능력이 높은 인공지능을 구현하는 기술 및 전략"작은 데이터..

Topic 2025.03.27

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

ITPE * JackerLab

EdgeAI 16

티스토리툴바