ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

논문 검색
구분 SCI
연도 ~ 키워드

상세정보

학술지 Modeling Long-Term Multimodal Representations for Active Speaker Detection with Spatio-Positional Encoder
Cited 0 time in scopus Download 38 time Share share facebook twitter linkedin kakaostory
저자
경민영, 송화전
발행일
202310
출처
IEEE Access, v.11, pp.116561-116569
ISSN
2169-3536
출판사
Institute of Electrical and Electronics Engineers Inc.
DOI
https://dx.doi.org/10.1109/ACCESS.2023.3325474
협약과제
23HS3800, 다화자 동시 처리를 위한 인공지능 기반 대화 모델링 기술, 송화전
KSP 제안 키워드
Active speaker detection, Multimodal representation
본 저작물은 크리에이티브 커먼즈 저작자 표시 (CC BY) 조건에 따라 이용할 수 있습니다.
저작자 표시 (CC BY)