ETRI-Knowledge Sharing Plaform

ENGLISH
기술이전 검색
연도 ~ 이전수 키워드

상세정보

기계학습 기반의 이미지/동영상에서 사물 분류 및 검출 기술

전수책임자
박종열
참여자
강규창, 권용진, 문진영, 박경, 박종열, 배승환, 배유석, 윤영석, 이전우, 정영식, 조영주, 진준호, 황중원
기술이전수
1
이전연도
2016
협약과제
16MS2400, (1세부) 실시간 대규모 영상 데이터 이해·예측을 위한 고성능 비주얼 디스커버리 플랫폼 개발, 박경
이미지/동영상에서 사물을 분류 및 검출하는 기술은 다양한 사물을 동시에 인식할 수 있어야 하기 때문에 기저에 다양한 사물을 구분할 수 있는 능력을 가지고 있어야 한다. 본 기술은 입력된 영상에서 주요한 객체가 학습된 분류에 따라 어디에 해당되는 지를 알려준다. 이를 위해 다양한 계층을 적층하여 100 레이어 이상의 심층 구조를 제공한다.
기존의 기계 학습은 제한된 학습 데이터의 패턴을 일반화하여, 보편적인 패턴을 추론하는 과정이다. 이러한 일반화, 혹은 학습 후 학습 모델의 추론 성능은 두 가지 이유로 저하되게 된다. 첫 번째는 충분하지 못한 학습 시간, 성능이 좋지 않은 최적화 알고리즘, 유연하지 못한 모델이 이유이다. 이 경우에는 일반화의 문제가 아니기 때문에 학습 데이터에 기반한 학습 모델이 생성되고 다시 추론 과정을 거치게 되어도 성능이 낮아지는 문제가 있다. 이를 under-fitting 문제라 하고 이를 해결하기 위해서는 더 우수한 최적화 기법을 개발해야 한다. 두 번째는 학습 데이터가 모든 패턴을 포함한다고 맹신하여, 학습 데이터와 다른 경우에 대하여 올바른 판단을 못하게 되는 경우이다. 이는 모델이 지나치게 유연하고, 성능 좋은 최적화 알고리즘의 파라미터를 부적절하게 잡았을 때, 모델이 학습 데이터에 너무 최적화되어 일어나는 문제이다. 이를 over-fitting 문제라 하고 이를 해결하기 위해서는 학습 데이터의 외적인 상황을 고려한 Regularization 설계가 필요하다.
본 기술은 Under-fitting 문제와 Over-fitting 문제를 고려하여 설계 및 개발된 기술로 다양한 사물 분류 및 인식을 지원한다. 특히 신경망 시스템을 포함하여, 관심 영역 추천 및 시각화 연계 기술을 포함하고 있다.
. 기존의 이미지/동영상에 등장하는 다양한 사물을 인식하는 기술은 사람의 생각에 의존하고 있어 다양한 상황에 적절하게 대응하지 못하는 한계가 있음
- 사람의 인지능력에 기초하고 있어 대량의 사물을 학습하기에는 어려운 구조를 지니고 있어 확장성이 낮음
- 사람이 사물을 잘못 이해하는 경우 시스템도 같이 성능이 낮아지고, 정확도가 떨어지는 경우가 발생
- 작은 사물이나 흐른 사람에 대해서 정확한 인식 성능 제공이 어려움 (학습 데이터에서 관련된 내용이 포함된 경우 일부 가능)

. 본 기술은 사람의 생각이나 추론을 대신하여 데이터를 기반으로 학습하고 학습된 결과를 수행하여 사물을 인식할 수 있는 시스템 기술을 제공
- 데이터 기반으로 학습하고 분류하고 있으며, 중간 처리 과정을 사람의 인지 능력을 모사하는 심층 신경망 기반의 기술
- 다양한 분야의 필요한 사물을 빠르게 학습 및 대체가 가능해, 산업적 활용 범위를 다양하게 적용 가능
본 기술은 사물을 분류하고 인식하기 위한 학습 네트워크의 세부 내용을 포함하고 있는 기술로

새롭게 이미지/비디오를 분석하기 위한 기계학습 기반의 원천 기술을 획득하고자 하는 자(회사) 또는
영상 기반의 세부 분류를 확장하면서 기술을 축적하고자 하는 자(회사)를 위한 기술을 포함하고 있음
다양한 이미지 파일에서 여러 사물을 동시 학습 및 인식하는 기술을 포함하고 있으며 세부적인 기술로

- 객체 검출을 위한 객체 분류 기능
- 앙상블 학습 기능
- 객체 검출을 위한 영역 추천 기능
- 신경망 분석을 위한 시각화 기능

을 포함한다.
기술이전의 범위는 다양한 사물을 학습하고 인식하고 시각화하는 기술을 포함하며, 다음의 내용을 포함한다.

- 기술문서 : 기술동향, 설치 및 운영방법, 학습 방법, 인식방법에 대한 자료
- 프로그램 : 구동이 가능한 프로그램
- 시험절차서 및 결과서 : 개별적인 기능을 시험하기 위한 환경 및 평가 결과서
- 지적재산권 : 관련 기술을 포함한 다수의 특허
- 이미지/동영상에서 사물을 분류 및 검출하는 기술은 다양한 응용 분야에서 활용이 가능하지만, 다음의 3가지 시나리오를 고려하고 있으며, 본 기술은 사물의 분류 및 검출에 최적화 되어 있어 사업화에 필요한 추가적인 기술 개발이 필요함

1. 공산상황 분석 및 예측 분야: 수자원관리, 기후변화, 해수변화 관리 등의 다양한 환경 변화를 영상으로 분석하는 기술 분야
2. 시각지식 큐레이션: 이미지/동영상 큐레이션 서비스를 대상으로 사용자의 환경에 맞는 미디어를 추천하거나 관련된 미디어를 검색 (해운대 가면 해운대 관련 영화를 추천)
3. 원격시각: 사람을 대신하여 위험지역이나 탐사가 쉽지 않은 지역을 탐사하는 경우 탐사 지역의 다양한 사물과 환경을 이해하기 위한 엔진으로 활용 가능