ETRI-Knowledge Sharing Plaform

KOREAN
기술이전 검색
Year ~ Transaction Count Keyword

Detail

Parallel NPU-based On-device AI platform for operating multiple AI models

Manager
Ryangsoo Kim
Participants
Kang Jusung, Kang Hyun Seo, Kim Geun Yong, Ryangsoo Kim, Kim Jaein, Chorwon Kim, Kim Hee Do, Ryu Ji Hyoung, Byung-Hee Son, Wang/Kicheoul, Yoo Hark, Yoon Giha
Transaction Count
1
Year
2025
Project Code
25IK1500, The Development of Scale-up Valley on Next-Generation Intelligent Semiconductor Applied On-Device AI, Kang Hyun Seo
본 기술은 복수개의 NPU가 탑재되어 다중의 AI 모델 추론 연산에 대하여 병렬처리를 지원하는 온디바이스 AI 플랫폼 기술로, 단일 MPU에서 PCIe switch를 이용해 복수개의 NPU 동시 사용을 지원하고, 이를 바탕으로 시각지능 및 시계열 분석 AI 모델 추론 서비스를 병렬로 실행시킴으로써 다단계로 구성 되어있는 복잡한 AI 추론 응용서비스를 단일 온디바이스 AI 플랫폼에서 실시간으로 제공할 수 있음
- 본 이전 기술은 복수의 NPU를 탑재한 온디바이스 AI 플랫폼을 통해 클라우드서버 의존도를 크게 낮추고, 동시에 다수의 AI 모델을 병렬로 추론함으로써 실시간 분석 및 의사결정이 필요한 산업 현장, 스마트시티, 무인점포, 스마트공장, 스마트팜 등에서 손쉽게 활용할 수 있음
- 국산 지능형 반도체(NPU) 기술을 적용하여 초저지연 AI 연산 서비스를 구현함으로써, 국내 기업들이 다양한 AI 응용서비스(객체검출, 시계열 예측, 음성·언어 모델 등)를 빠르게 상품화·사업화할 수 있도록 지원함
- 기존 클라우드 기반 AI 분석은 대규모 트래픽과 전송 지연 문제, 보안 이슈가 발생할 수 있으나, 본 온디바이스 AI 플랫폼을 활용하면 영상·센서 데이터를 엣지단에서 직접 분석하여 네트워크 및 응답지연 부담을 획기적으로 완화하고 민감정보 유출 위험을 최소화할 수 있음
■ PCIe 스위치 방식을 사용한 병렬 NPU 활용 고성능 병렬 연산을 지원하는 하드웨어 구조 포함
■ 온디바이스 AI 가속장치 활용 다중 AI 모델 추론 병렬처리 및 다채널 영상 데이터 분석 최적화를 위한 파이프라인 구현
■ 원격 서버와의 협력으로 이상상태 실시간 알림 및 고차원의 AI 분석을 결합하여 다양한 시각지능 응용서비스 구현 가능
■ 온디바이스 AI 가속장치 기반 IoT 시계열 데이터 추론 AI 모델 운영을 통한 시계열 응용 서비스 제공
■ 시계열 예측 값 기반 서비스 예보 알람 등 다양한 시계열 응용 서비스 구현 가능
■ 1세부 기술명: 병렬 NPU기반 온디바이스 AI 공용 하드웨어 플랫폼(HW)
- 고성능 병렬 연산 지원을 위한 PCIe 스위치 방식으로 Inference Latency 최소화하여 다중 AI 모델 추론 분산 처리
■ 2세부 기술명: 다중 AI 모델 활용 시각지능 서비스 최적화 기술 (SW)
- 온디바이스 AI 가속장치 활용 다중 AI 모델 추론 병렬처리 구현
- 다채널 영상 데이터 분석 최적화를 위한 다중 쓰래딩 큐 기반 작업 파이프라인 구축
■ 3세부 기술명: 경량 NPU 기반 시계열 데이터 추론 기술 (SW)
- 온디바이스 AI 가속장치 기반 IoT 시계열 데이터 AI 모델 추론 기술
- 시계열 데이터 추론 가속을 위한 병렬 NPU 분산처리 기술
■ 1세부 기술명: 병렬 NPU기반 온디바이스 AI 공용 하드웨어 플랫폼(HW)
- 병렬형 엣지 AI 가속기 모듈 구조설명서포함 기술문서 7건
■ 2세부 기술명: 다중 AI 모델 활용 시각지능 서비스 최적화 기술 (SW)
- 다중 AI 모델 활용 시각지능 서비스 최적화 기술 소스코드 1종
- 온디바이스 AI 가속장치 활용 다중 AI 모델 추론 병렬처리 기술 상세설계서 포함 기술문서 7건
■ 3세부 기술명: 경량 NPU 기반 시계열 데이터 추론 기술 (SW)
- 시계열 데이터 추론 모델 활용 AI 기술 소스코드 1종
- 시계열 데이터 추론 모델 활용 AI 기술 SW 상세설계서 포함 기술문서 7건
- 본 이전 기술은 복수의 NPU를 병렬로 활용하는 온디바이스 AI 플랫폼으로서, 화재감지·거수자 탐지·행동인식 등 복합적인 영상분석을 동시에 수행할 수 있으므로, 다채널 CCTV 환경에서 실시간으로 이상상태를 감지·분석해야 하는 다양한 분야(방범, 재난안전, 교통관제 등)에 적용 가능함
- 무인점포 운영 및 지자체 공공 CCTV 관제 시스템 등에서 요구되는 여러 AI 모델을 동시에 탑재함으로써, 저비용으로 고성능·저지연 AI 서비스를 제공할 수 있으며, 개인정보가 포함된 원천 데이터를 외부로 전송하지 않고 엣지에서 자체분석함으로써 보안성과 처리 효율을 높dlf 수 있음
- 본 기술은 다중 모델 추론이 가능한 병렬 NPU 기반 엣지형 시스템으로, 산업·건설 현장의 안전관리, 교통 흐름 분석, 스마트공장·스마트팜 등의 실시간 모니터링 및 예측 서비스까지 범위를 확장할 수 있으며, 이를 통해 국산 AI 반도체 기술 경쟁력을 제고하고 다양한 산업 분야에서 지능형 서비스를 빠르게 사업화할 수 있을 것으로 기대됨