ETRI-Knowledge Sharing Plaform

KOREAN
기술이전 검색
Year ~ Transaction Count Keyword

Detail

Real-time Crop Growth and Video Summary?based Pest Detection and Voice AI Chatbot System(VISTA Agent)

Manager
Eun Kyoung Jeon
Participants
Kang Hyun Seo, Keo Sik Kim, Kyeeun Kim, Kim Daegil, Park Si Woong, Hyoungjun Park, Yeo Chan Il, Yun Kwang Su, Eun Kyoung Jeon, Heo Young Soon
Transaction Count
1
Year
2025
Project Code
25ZK1100, Honam region regional industry-based ICT convergence technology advancement support project, Kang Hyun Seo
MCP 기반 멀티에이전트오케스트레이션과 로컬 VLM을 융합하여 센서·영상 데이터를 실시간 분석하고 병해충 탐지 및 생육 상태를 음성·텍스트로 요약·제어하는 지능형 VISTA Agent로 스마트팜환경에서 LLM·VLM·IoT제어를 통합 운영하여 자율적 생육 관리와 지능형 의사결정을 수행하는 AI 시스템임
ㅇ 스마트농업 산업은 생산성 향상과 자동화를 목표로 빠르게 확산되고 있으나, 현장에서는 여전히 병해충 발생의 예측 실패, 전문 인력 부족, 비효율적인 환경 제어 등의 문제가 지속되고 있음
ㅇ 특히 기후변화와 이상기후로 인해 병해충의 발생 양상이 불규칙하게 변화하면서, 기존의 정적·경험 기반 진단 시스템으로는 신속하고 정확한 대응이 어려운 상황임
ㅇ 또한 국내 농업은 고령화율이 40% 이상으로, 전문 인력에 의존하는 관리 체계로는 지속 가능한 농업 유지가 점점 더 어려워지고 있음
ㅇ 농업 현장에서 AI가 실시간으로 생육 데이터를 분석하고 병해충을 탐지하며, 자동으로 환경을 제어할 수 있는 자율형 시스템의 필요성이 급격히 증가하고 있음
ㅇ 본 기술은 로컬 VLM(Vision-Language Model) 과 MCP(Multi-Agent Control Protocol) 기반 LLM 오케스트레이션을 결합함으로써, 센서·영상·음성 데이터를 통합적으로 분석하고 제어할 수 있는 구조를 제공있음
ㅇ 이를 통해 농업인이나 관리자가 물리적으로 현장에 상주하지 않아도 영상 기반 병해충 탐지, 생육상태 분석, IoT 제어가 가능한 자율형 스마트팜 AI 에이전트 구현이 가능함
ㅇ 단순히 농업 생산성 향상을 넘어, 국내 스마트농업의 AI·데이터 생태계 고도화를 촉진하고, 스마트팜 산업의 자립형 기술 역량 확보가 가능함
ㅇ MCP 기반 멀티에이전트 오케스트레이션 구조
- 다중 AI Agent(LLM, RAG, VLM 등) 간 상호작용을 표준화한 제어 프로토콜로, 각 기능(영상 분석, 센서 데이터 처리, 음성 대화 등)을 자동 분담하여 병해충 탐지 및 제어를 수행.
- LangGraph 기반 구조로 실시간 데이터 흐름 제어가 가능하며, 확장형 설계로 다양한 IoT 기기 및 제어 API 연동이 용이함.

ㅇ 로컬 VLM 기반 실시간 병해충 영상 분석 기술
- 클라우드 의존도가 낮은 로컬 엣지 VLM 기술을 활용하여,농장 내 네트워크 환경이 불안정한 상황에서도 실시간 병해충 탐지 가능.
- 영상 인식 기반으로 작물 생육상태, 병충해 징후, 생리적 스트레스 등을 시각적으로 분석하고 LLM에 전달하여 자연어 요약 및 대응 명령을 자동 생성.

ㅇ 음성 AI 챗봇 인터페이스 (VISTA Agent)
- STT/TTS(음성인식 및 합성) 기반 음성 대화형 인터페이스로, 농업인이 “말로 묻고 듣는” 방식으로 병해충 진단, 생육상태 확인, 환경 제어 명령을 수행할 수 있음.
- 대화형 LLM 모델을 탑재하여, 작물 상태에 따라 공감형 대화 및 상황별 관리 가이드 제공.

ㅇ 데이터 융합 및 자율제어
- 온도, 습도, 조도, CO₂, 토양 수분 등 환경 데이터를 영상 데이터와 함께 분석하여 생육 상태를 다중모달(Multimodal) 방식으로 판단.
- 판단 결과에 따라 관수·환기·조명 등 IoT 장비를 자동 제어하는 피드백 루프(Feedback Loop) 구조 구현.
ㅇ (기술이전 내용) 실시간 생육 데이터·영상 요약 기반 병해충 탐지 및 음성 AI 챗봇시스템(VISTA Agent)
- MCP(Multi-Agent Control Protocol) 기반 LLM 오케스트레이션 제어 기술
- 로컬 VLM(Vision-Language Model)을 활용한 생육 영상 병해충 분석 기술지니어링 기반 LLM을 활용하여 공감능력과 대화 지속성이 높은 심리상담 챗봇

ㅇ (기술이전 범위)
- ETRI 요구사항정의서 1건
- ETRI 시험절차 및 결과서 1건
- API 문서 관련 기술문서 등 총 3건
- 알고리즘 관련 특허 1건
- 실시간 생육 데이터·영상 요약 기반 병해충 탐지 및 음성 AI 챗봇시스템판별알고리즘 SW 1건
ㅇ (적용분야)
- 스마트팜 : 병해충 진단, 환경제어
- 스마트시티/산업안전 : 영상 기반 이상탐지, IoT 연동
- 시설환경 제어 : 냉난방, 조명 자동화
- AI 융합 연구 : LLM+VLM+IoT 통합 플랫폼 연구

ㅇ (기대효과)
- 기술적 관점 : 멀티에이전트 기반 LLM·VLM 오케스트레이션을 통해 영상·센서·음성 데이터를 통합 분석함으로써, 지능형 자율제어 및 실시간 의사결정이 가능한 AI 인프라를 구현할 수 있음
- 산업적 관점 : 스마트팜, 스마트시티, 산업안전 등 다양한 산업에 적용되어 운영 효율성 및 생산성 향상, 인력 의존도 감소 효과를 기대할 수 있음
- 사회, 경제적 관점 : 지능형 농업 및 환경 관리 기술 확산을 통해 고령화·인력 부족 문제를 완화하고 지역 균형 발전에 기여할 수 있음.