본 기술은 방송 콘텐츠의 영상과 자막을 이용하여 방송 콘텐츠를 장면 단위로 분할하고, 장면 단위의 토픽을 자동 생성하여 융합형-메타데이터를 자동으로 생성하는 기술임.
- 최근 방송 프로그램을 이용한 콘텐츠 시장은 포화 상태에 이르러 성장이 둔화되고
있으며, 방송 프로그램의 메타데이터를 활용한 신규 시장이 부각됨으로써 메타데이
터의 중요성이 점차 증대하고 있음
- 메타데이터를 기반으로 한 PPL 시장이 확대되고 있을 뿐만 아니라, 세컨드 스크린
을 이용한 미디어 커머스 시장이 새로운 시장으로 각광받기 시작했음.
- 따라서, 충분한 메타데이터 공급에 대한 필요성이 제기되고 있으나, 현재까지는 인
력에 의해 수동으로 메타데이터를 생성하거나 입력하고 있는 점이 문제점으로 인식
되고 있어, 이를 자동화하기 위한 기술이 주요 이슈로 대두됨
- 본 기술의 경쟁기술로는 순차적 유사도 계산에 기반한 장면 분할 방법과 키워드 기
반 콘텐츠 태깅 방법이 있음
? 순차적 유사도 계산에 기반한 장면 분할 방법: 장면을 구성하는 샷 간 영상/음
성 등 특징 벡터 유사도를 계산하여 크게 변하는 시점을 장면의 경계로 결정하
는 방법으로, 다양한 특징에 따라 서로 다르게 나타나는 유사도를 기반으로 경
계를 결정하기 위해 다수의 규칙을 수동으로 정의하여 사용해야 함. 이러한 규
칙은 콘텐츠의 내용, 장르 등에 따라 재정의되어야 하므로 범용성이 떨어짐.
? 키워드 기반 콘텐츠 태깅 방법 : 방송 콘텐츠와 관련된 텍스트로부터
키워드를 추출하고 이를 태깅하는 방법으로, 대부분 콘텐츠 단위 태깅에 머물
고 있으며, 몇몇 장면 단위 태깅의 경우에도 한정된 도메인에서만 적용 되고
있음.
- 본 기술은 상기 문제점을 해결하기 위해 방송 프로그램을 장면 단위로 자동으
로 분할하고, 자막을 분석하여 장면에 결합된 토픽 기반의 메타데이터를 기계적
으로 자동 생성함으로써 메타데이터 생성 및 입력의 자동화를 가능하게 함
- 본 기술은 방송 프로그램을 대상으로 메타데이터를 생성함에 있어서, 사람의 직접
적인 입력을 거치지 않고, 방송 프로그램에 포함된 자막을 분석하여 기계적으로
메타데이터를 자동으로 생성하는 점이 장점임
- 또한, 본 기술은 방송 프로그램 전체가 아닌, 장면 단위로 자막을 분석하여 장면마
다, 장면과 연계된 토픽 정보를 태깅할 수 있다는 점이 큰 특징임
- 본 기술은 방송 콘텐츠 관련 데이터의 특성을 반영할 수 있도록, 적은 양의 짧은 텍스트 문서에 대한 토픽 생성이 가능한 점이 특징임
- 장면 분할에 있어서, 영상의 색상 정보, 모션, 음성 정보 등 3가지의 특징 정보를
동시에 활용한다는 점도 특징 중의 하나임
가. 기술이전의 내용
- 샷에 대한 다수의 영상/음성 특징을 자동 결합하기 위한 Co-training 기능
- 다양한 형태의 장면에 대응하기 위한 spectral-clustering 기능
- 셋 이상의 특징 결합과 장면 생성을 수행하기 위한 다중 특징 데이터 클러스터링 기능
- 다중 특징 데이터 클러스터링 API
- 적은 양의 자막 데이터로부터 토픽을 생성하기 위한 PMI (Point-wise Mutual Information) 기반 종자 어휘 추출 기능
- Hierarchical Dirichlet Process를 이용한 토픽 학습 기능
- 장면 단위 토픽 태깅 기능
- 융합형-메타데이터 자동 생성 API
나. 기술이전의 범위
- 시스템 요구사항 정의서 1종
- 구조기능 설계서 1종
- 상세 설계서 2종
- 시험 절차 및 결과서 2종
- 시맨틱 클러스터 기술 프로그램 1종
- 융합형-메타데이터 생성 기술 프로그램 1종
- 본 이전기술은 미디어 커머스, 정보 검색, 지식 검색의 일부 모듈로의 적용이
가능하기에 본 기술이 진출 가능한 시장은 미디어 커머스 뿐만 아니라, 정보 검색
포탈 사이트, 콘텐츠 추천, 상품 검색, 맞춤형 광고 산업 등이 있음
- 본 기술의 주요 수요처는 방송 사업자, 콘텐츠 사업자, 광고 사업자, 플랫폼 사업
자 등 소수의 대기업과 다수의 중소기업들로 구성되어 일정 수준의 수요처 확보가
가능할 것으로 판단됨
? 이전기술의 적용시 초기 투자비용이 많지 않고, 특히 국내에는 스마트 미디어의
관심 및 개발 지원 등 국가적 지원과 기술개발 인프라가 비교적 잘 갖추어져 있
고 방송 관련 사업자들이 큰 관심과 사업화 의지가 있기에 상용화의 가능성이
높을 것으로 보임
- 이전기술은 방송 자막을 기반으로 토픽 자동 생성을 목표로 하고 있으나, 이외에
SNS 정보 분석을 통한 토픽 생성, 언론 기사 분석을 통한 토픽 생성, 블로그 등의
웹데이터 분석을 통한 토픽 생성 응용이 가능함
- 본 기술의 상용화시 스마트 미디어 커머스 시장을 활성화시킬 수 있고, 인력 대신
기계적인 메타데이터 생산으로 제조 원가 절감을 통한 가격경쟁력 향상이 기대됨