With the development of personal broadcasting such as YouTube, the demand for editing the video he filmed himself is steadily increasing. Traditional media video editing solutions help edit the results of the filming. However, there is a problem that requires a lot of editing time, as people usually edit videos that are from tens to hundreds of times longer than the final result of a personal broadcasting after filming. To overcome this problem, this paper automatically classifies images with specific scenes in the whole media image editing process, and secondly proposes automatic media editing solution technology in which people intervene. In particular, personal broadcasting focuses on the use of images that include characters, specific objects, and cue sign gestures among the entire. While the existing deep learning techniques such as faces, objects and gestures are advanced, integrated recognition technologies that simultaneously deal with special requirements for editing videos are still in the early stages of research. In this paper, the automatic composite recognition technology for editing video based on deep learning is proposed. The proposed technology was implemented with python and tensorflow software based on edge computing equipment. Using actual youtube videos, it took 0.1 second to process five-person recognition, 63-food recognition, or cue sign recognition using clapping or V poses at the same time. The recognized results are divided into timestamps of the entire movie, recognition results, and locations of objects on the screen, and are output to the json file. In addition, this solution was developed on an edge computing in order to increase real-Time reliability. We expect to provide automatic video editing based on perceived json results as well as shorter editing times based on this implementation.
KSP 제안 키워드
Early stages, Food Recognition, Image editing, Integrated recognition, Object Recognition, Person recognition, Real-time reliability, Traditional media, deep learning(DL), edge computing, sign recognition
저작권정책 안내문
한국전자동신연구원 지식공유플랫폼 저작권정책
한국전자통신연구원 지식공유플랫폼에서 제공하는 모든 저작물(각종 연구과제, 성과물 등)은 저작권법에 의하여 보호받는 저작물로 무단복제 및 배포를 원칙적으로 금하고 있습니다. 저작물을 이용 또는 변경하고자 할 때는 다음 사항을 참고하시기 바랍니다.
저작권법 제24조의2에 따라 한국전자통신연구원에서 저작재산권의 전부를 보유한 저작물의 경우에는 별도의 이용허락 없이 자유이용이 가능합니다. 단, 자유이용이 가능한 자료는 "공공저작물 자유이용허락 표시 기준(공공누리, KOGL) 제4유형"을 부착하여 개방하고 있으므로 공공누리 표시가 부착된 저작물인지를 확인한 이후에 자유이용하시기 바랍니다. 자유이용의 경우에는 반드시 저작물의 출처를 구체적으로 표시하여야 하고 비영리 목적으로만 이용이 가능하며 저작물을 변형하거나 2차 저작물로 사용할 수 없습니다.
<출처표시방법 안내> 작성자, 저작물명, 출처, 권호, 출판년도, 이용조건 [예시1] 김진미 외, "매니코어 기반 고성능 컴퓨팅을 지원하는 경량커널 동향", 전자통신동향분석, 32권 4호, 2017, 공공누리 제4유형 [예시2] 심진보 외, "제4차 산업 혁명과 ICT - 제4차 산업 혁명 선도를 위한 IDX 추진 전략", ETRI Insight, 2017, 공공누리 제 4유형
공공누리가 부착되지 않은 자료들을 사용하고자 할 경우에는 담당자와 사전협의한 이후에 이용하여 주시기 바랍니다.