ETRI-Knowledge Sharing Plaform

KOREAN
기술이전 검색
Year ~ Transaction Count Keyword

Detail

On-device ASR-LLM-TTS Platform

Manager
Chorwon Kim
Participants
Kang Jusung, Kang Hyun Seo, Kim Geun Yong, Ryangsoo Kim, Kim Jaein, Chorwon Kim, Kim Hee Do, Ryu Ji Hyoung, Byung-Hee Son, Wang/Kicheoul, Yoo Hark, Yoon Giha
Transaction Count
4
Year
2025
Project Code
25IK1500, The Development of Scale-up Valley on Next-Generation Intelligent Semiconductor Applied On-Device AI, Kang Hyun Seo
본 기술은 사람과 인공지능 간 자연스러운 음성 기반 상호작용을 구현하기 위한 것으로 ASR, LLM, TTS (ALT) 엔진을 경량 메시지 브로커 기반 파이프라인으로 통합하여, 라즈베리파이5와 같은 소형 엣지 디바이스에서도 구동 가능한 초경량 소프트웨어 프레임워크와 이를 위한 하드웨어 플랫폼으로 구성됨. Whisper.cpp, Llama.cpp, Piper 등 경량 오픈소스 AI 엔진을 기반으로 파이프라인을 구성하고, 모듈 간 통신은 MQTT 프로토콜을 통해 수행함으로써 모듈 간 독립성과 유연한 확장성을 제공함. 이러한 구조는 리소스가 제한된 엣지 환경에서도 안정적이고 효율적인 대화형 AI 서비스를 실현할 수 있는 기술적 이점을 제공함
(중소기업의 AI 기술확보 및 자립에 기여) 현재 고성능 음성지능 기술은 대부분 글로벌 빅테크 기업이 주도하고 있으며, 국내 중소기업은 상용 API나 클라우드 기반 서비스에 의존하는 경우가 많아 독자적인 기술 확보가 어려운 실정임. 본 기술은 오픈소스 기반 경량 엔진을 활용한 온디바이스 구현 구조를 제공함으로써, 중소기업이 독립적으로 AI 서비스를 개발·운영할 수 있는 기반을 마련함. 이를 통해 기술 종속성을 탈피하고, 자체 기술력을 확보할 수 있음

(실시간 대응이 가능한 AI 서비스 구현) 기존의 음성 AI 서비스는 대부분 클라우드 환경에 의존하여 고비용 구조 및 네트워크 지연 문제가 존재. 반면, 본 기술은 소형 엣지 디바이스에서 구동 가능한 초경량 플랫폼으로 설계되어 있어, 중소기업도 고가의 서버나 외부 클라우드 없이 저비용으로 고품질 실시간 대화형 서비스를 제공할 수 있음. 이는 AI 도입 장벽을 낮추고 서비스 대응력을 높이는데 크게 기여함

(사업화 및 응용 가능성 확보) 본 기술은 비서형 AI, 키오스크, 차량용 인포테인먼트, 헬스케어, 교육, 산업용 로봇 등 다양한 분야에 손쉽게 적용이 가능함. 특히, 음성 기반 UI의 수요가 급증하는 산업현장에서 고객 맞춤형 인터페이스를 구현할 수 있어, 기술이전 이후 중소기업의 제품 차별화 및 고부가가치 서비스 개발에 실질적인 기여가 가능
(경량 하드웨어) 온디바이스 ASR-LLM-TTS 서비스를 위한 라즈베리파이5 CM5 모듈 기반의 하드웨어 플랫폼은 GPU 없이도 CPU만으로 AI 기반 대화형 서비스를 구현할 수 있도록 설계되어, 다양한 분야를 위한 전용 하드웨어 제작이 가능
(초소형 크기) ASR-LLM-TTS 하드웨어 플랫폼은 CM5모듈과 같은 크기의 확장보드로 이루어져 있으며, 확장보드에는 USB 포트x2와 SD카드 슬롯이 있어 전원인가 및 인터페이스 확장이 용이함
(경량 소프트웨어) ASR-LLM-TTS 엔진은 온디바이스 환경에서 효율적으로 동작할 수 있도록 외부 라이브러리에 대한 의존 없이 C++로 구현된 오픈소스 엔진인 whisper.cpp, Llama.cpp, Piper를 기반으로 개발됨
(확장성) MQTT 브로커인 기반 경량 메시지 송수신 구조를 채택하여 소규모 메모리 및 제한된 연산 자원을 갖는 디바이스 간에도 결과 데이터를 신속하게 송수신할 수 있으며, 다수의 저사양 AI 추론 모듈이 분산된 환경에서도 확장성을 확보
1) 기술이전 내용
ㅇ 온디바이스 ASR-LLM-TTS 소프트웨어와 하드웨어 플랫폼
- AI기반 대화 서비스를 위한 ASR-LLM-TTS 소프트웨어 플랫폼
- 라즈베리파이 CM5 모듈과 확장보드로 이루어진 하드웨어 플랫폼

2) 기술이전 범위
ㅇ 온디바이스 ASR-LLM-TTS 소프트웨어와 하드웨어 플랫폼
- 온디바이스 ASR-LLM-TTS 플랫폼 소프트웨어 소스코드
- 온디바이스 ASR-LLM-TTS 플랫폼 요구사항정의서
- 온디바이스 ASR-LLM-TTS 플랫폼 시험절차 및 결과서
- 온디바이스 ASR-LLM-TTS 플랫폼 하드웨어 회로도/거버/BOM
- 온디바이스 ASR-LLM-TTS 플랫폼 하드웨어 모듈 구조설명서
- 온디바이스 ASR-LLM-TTS 플랫폼 활용 및 개선내용
자동차 인포테인먼트 시스템, 키오스크, 스마트 가전, 산업용 로봇, 웨어러블 디바이스, 헬스케어 기기 등 다양한 산업 현장에 적용이 가능함. 특히 네트워크가 제한되거나 클라우드 접속이 어려운 환경에서도 자연어 이해와 음성 응답을 기반으로 한 사용자 인터페이스 제공이 가능하므로, 인터랙티브 기능이 요구되는 제품의 경쟁력을 높일 수 있음

온디바이스 ASR-LLM-TTS 플랫폼은 외부 서버나 클라우드 시스템에 의존하지 않고도 실시간으로 음성 인식과 응답이 가능한 구조를 제공함. 이를 통해 응답 지연을 최소화하고, 네트워크 환경의 영향을 받지 않으며 고품질의 대화형 AI 서비스를 안정적으로 제공할 수 있음. 또한 개인정보가 외부로 전송되지 않기 때문에 프라이버시 보호 측면에서도 강점을 가지며, 보안이 중요한 분야(예: 의료, 금융 등)에 적합함