23ZS1100, Core Technology Research for Self-Improving Integrated Artificial Intelligence System,
Hwa Jeon Song
Abstract
□ 과제수행 목표 및 내용 ◎ 최종 목표 ㅇ 세계최초 자율성장이 가능하며 인간-기계간 자연스러운 교감이 가능한 인간두뇌 모사형 conversational AI 원천기술 및 상황변화에 자율 대처하는 자가적응형 인공지능 원천기술 확보
◎ 전체 내용 ㅇ 자율성장 휴먼증강 인지컴퓨팅 원천기술 개발 ㅇ Conversational AI 공통 핵심기술 개발 ㅇ 상황변화에 자율 대처하는 자가적응형 인공지능 원천기술 개발
◎ 1단계 ● 목표 ㅇ 뉴럴 메모리모델 기반 복합 지식 학습기술 개발
● 내용 ㅇ 지식 자율성장형 복합인공지능 핵심 요소 기술 개발
◎ 2단계 ● 목표 ㅇ 인터랙션 기반 지식성장형 복합지능
● 내용 ㅇ 인터랙션 기반 지식 자율성장형 복합인공지능 핵심 요소 기술 고도화
◎ 3단계 ● 목표 ㅇ 복합 컨텍스트 이해 기반 교감형 AI 개발
● 내용 ㅇ 자율성장 교감형 에이전트 통합 검증용 프로토타입 시스템 개발
◎ 당해 연도 ● 목표 ㅇ 자율성장 휴먼증강 인지컴퓨팅 핵심기술 고도화 ㅇ Conversational AI 공통 핵심기술 고도화 ㅇ 상황변화에 자율 대처하는 자가적응형 인공지능 원천기술 고도화
● 내용 ㅇ 자율성장 휴먼증강 인지컴퓨팅 핵심기술 고도화 - 인터랙티브 자율성장 기술 개발(II) - 자율성장 기억 지식베이스 모델링 기술 개발 - 복합정보 기반 경험상황 학습 및 추론 기술 고도화 - 성능검증용 프로토타입 v2.0 개발 ㅇ Conversational AI 공통 핵심기술 고도화 - Deep Conversational End-to-End 자동통역 고도화 - 언어확장이 용이한 다국어 음성인식 고도화 - 음성‧언어 복합지능 고도화 ㅇ 상황변화에 자율 대처하는 자가적응형 인공지능 원천기술 고도화 - 상황변화에 대처하는 그래프 모델(graphical model) 기반 자가적응형 인공지능 원천기술 핵심엔진(CybreBrain) 고도화 - 의료데이터의 희소성·이질성·파편화·비공유 특성에 대한 자가적응형 정밀의료 분석도구(CybreDX) 고도화
□ 과제 수행과정 및 내용 ㅇ 과제 수행과정 ◇ 현재 인공지능 기술 상황 • 거대 기업들의 인공지능 기술 독점화가 심화됨 - 방대한 빅데이터 독점, 자본기반 거대 사전모델 학습 및 관련 시장 독점예상 • 향후 인공지능 경쟁력의 핵심이 될 차세대 인공지능 연구과제가 시작된 시점임(2022.4 부터) • 현재 인공지능 스피커 기반 단순서비스가 주류이나 메타버스 등 다양한 서비스 플랫폼이 대두됨 • 현재 인공지능 시스템이 빅데이터를 기반하여 What(암기)문제를 해결하는데 집중함
◇ 본 과제 중요성 및 핵심기술 개발 수행과정 • 방대한 빅데이터 기반 AI 기술뿐만 아니라 시간에 따라 변하는 소규모 복합모달 데이터 및 데이터 자동증강에 효율적인 인공지능 학습 알고리즘을 포함한 차세대 인공지능 핵심기술 개발을 목표로 기획되어 2017년부터 수행되고 있음 • 메타버스 플랫폼 등 서비스 장벽이 허물어짐에 따라 국적 및 사용언어에 제약없는 사람간 소통이 더욱더 중요해짐 • 자율성장형 복합인공지능은 What(암기)뿐만 아니라 How(경험) 및 Why(이해, 설명, 교감)를 해결하는 것에 집중함 → 인간처럼 배우고, 인간을 이해하고 교감하는 기술
ㅇ 과제 수행내용 - 주의 집중 기반의 전역/로컬 가중치 및 위치 인지 기술로 의미 청크 마스킹을 통한 사전학습 언어모델 기술 개발 - 소규모 그룹에 대한 전략을 학습하여 미지의 태스크 수행이 가능한 메타학습 기반 지식 성장 기술 개발 - 양수의 하위 보상이 높은 상태와 행동을 우선적 탐색하는 효율적 에이전트 협업 기술 개발 - 생성 모델 기반의 불균형 시각 속성 인식 기술과 주의 집중 기반의 텍스트 상호 참조 해결 융합 기술 고도화 - 차원 확장 프레임워크로 기존 지식을 유지하고 점진적 지식을 반영하는 지식베이스 연속 성장 기술 개발 - 인터랙티브 지식 기반 복합모달 지식베이스 성장 기술 개발과 절차기억 생성/수정을 위한 지식베이스 모델링 - 복합정보 기반 경험상황 학습 및 추론 기술 고도화 . 실생활 환경 적용을 위한 기본행동 인식 기술 고도화, 복합정보 기반 경험 속성 추출 및 행동 인식 모델링 . 경험 데이터 관리 및 분석 프로토타입 시스템 v2.0 개발 - 감성지능 수준 기반 심혈관 반응 및 미주신경 반응 유효변수 최적화를 통한 감성인식 AI 모델 개발 - 라이프로그 그래프 분할기반 그래프 컨볼루션 신경망 고도화 및 추천 알고리즘 개발 - 라이프로그 데이터 증거 기반 수면장애 의사결정지원 임상 실험 프로세스 구축 및 임상데이터 수집 - Zero UI Conversational End-to-End 자동통역 기술 및 다국어 확장이 용이한 음성인식 기술 개발 - 희소언어의 학습데이터 부족문제 해결을 위해 언어간의 유사성을 이용한 비지도 학습 방식 개발 및 거대LM 융합한 음성인식 성능개선 가능성 확인 - 국내 최대 다국어 음성인식(40여개 언어) 및 통역기술(13개 언어) 확보 및 세계최초 ZeroUI 자동통역 관련 Audio-visual 핵심기술 확보 및 우수특허 확보 - 점진적 학습 알고리즘(SAIL) 고도화 및 다수 병원의 의료 빅데이터 활용 검증 - 브레인 네트워크 특성을 반영한 Reservoir Computing 모델 도출 - Tabular Data에 대한 Continual Learning 모델 및 생성 모델(TabGFN) 연구 - 시계열 데이터의 Heterogeneous 이벤트 시퀀스에 대한 예측 모델 개발 - CybreDX 개인정보보호를 위한 TabGFN 기반 의료데이터 생성 모듈 개발 - CybreDX의 호흡음 기반 질병 진단 관련 전주기 시스템 개발 및 ETRI AI 나눔 “기술체험” 서비스
□ 과제 수행결과 및 목표달성도 ㅇ 과제 수행결과 ㅇ 과제 수행 목표달성도 가. 과제 수행 목표달성도 (기술개발 성과지표) 나. 공통지표
□ 관련 분야에 대한 기여 ㅇ 관련 분야 과학적·기술적·경제적·사회적 기여 ◇ 과학적 • 해마의 승계 표상, 대뇌 피질의 계층적 구조, 기억의 희소 분포 표현, 행위-지각 순환 학습을 모방한 두뇌 모사형 인공지능 원천 기술 개발 기여 - SCIE 2.65편, 국내저널 1편, 국제학술대회 3.25편, 국내학술대회 5.25편 • 복합정보 기반 경험 학습 및 추론 기술 고도화를 통해 실생활 적용이 가능한 데이터 수집 기술 분야, 라이프로그 생활패턴 추출 및 감성지능 평가 모델의 성능 저하 문제 해결에 기여 - SCIE 논문 3.0편, 국내학술지 1.5편, 국내외학술대회 5.9편(국제우수학술대회 1.4편 포함) • 희소언어의 학습데이터 부족문제 해결을 위해 언어간의 유사성을 이용한 비지도 학습 방식 개발 및 거대LM 융합한 음성인식 성능개선 가능성 확인 (비지도학습 기반 기술을 통해 40여개 언어로 확장) • 자가적응형 점진적 학습 기술(SAIL)인 RAIL 알고리즘을 데이터 공유가 되지 않는 실제의 병원 세 곳에 적용하여 기존 점진적 학습 모델 대비 우수한 성능 검증 • 브레인 네트워크의 모듈 구조의 특성을 반영한 새로운 Reservoir Computing 모델 도출 • Tabular 데이터에 대한 연속학습 및 개인정보보호를 위한 생성모델 도출 ◇ 기술적 • 제로샷/연속학습이 가능한 복합모달 인터랙션 및 지식 그래프 실시간 통합형 인공지능 패션 코디네이터를 개발하여 데이터 의존형 딥러닝의 한계를 극복 • 4차 챌린지 개최를 통해 패션 코디 데이터셋과 베이스라인을 확장 공개함으로써 자율성장 인공지능 기술의 대중화에 기여 - 국제특허출원 3건, 국제특허등록 2건, 국내출원특허 6.7건, 국내등록특허 5건, 국제학술대회 2.7편, 국내학술대회 1편 • 복합정보 기반 경험 속성 추출 및 고수준 행동 인식 핵심기술 확보 - 국제출원특허(2건), 국내출원특허(3건), 국내특허등록(3건) • 국내 최대 다국어 음성인식(40여개 언어) 및 통역기술(13개 언어) 확보 • 세계최초 ZeroUI 자동통역 관련 Audio-visual 핵심기술 확보 및 국내외특허 3건 확보 • 새로운 데이터가 지속적으로 유입되면서 동시에 변수들이 역동적으로 변하는 상황에서 기존 SOTA 기술 대비 더 강건하고 획득을 더욱 잘 보존하는 점진적 학습 알고리즘(SAIL)의 실제 데이터 응용 ◇ 경제적 • 다국어 Conversational 음성인식은 AI스피커, AI콜센터, 키오스크, 로봇, 자율주행차 등 기본 인터페이스로 채택가능성이 높아 경제적 파급효과가 매우 큼 • 한국어 위주 사업화에서 다국어 음성인식 및 자동통역으로 사업화 확대(기술이전 2.03억) ◇ 사회적 • 국내거주 외국인 증가로 민원, 사법 수요 증가따라 공공기관에서 언어장벽 애로 • 관광안내통역, 무역통역, 학술통역, 경찰통역 등 시연/실증/시범서비스 실시 (서울교통공사 명동역 자동통역 시범서비스 실시. 내년에 6개 지역으로 확대 예정) • 호흡 임상의 정밀진단 사전 검증 보조로 CybreDX 활용(충남의대 응급의학과 실증 사용) • CybreDX의 기술체험 서비스를 통해 대중의 참여 유도
ㅇ 후속 과제에 도움을 줄 수 있는 연구 결과 - 신속하게 협업이 가능한 자율성장 기술은 스스로 동기를 부여하고 공감 행동과 시너지 학습법의 신속 도출에 기반한 집단 지성 인공지능 분야에 활용이 가능함 - 경험 데이터 관리 및 분석 프로토타입 시스템 및 행동/감정 인식 기술은 인지적/신체적 건강을 지키는 디지털 헬스케어, 디지털치료제 분야에서 데이터 수집 및 분석 플랫폼으로 활용이 가능함
□ 성과관리 및 활용계획 ㅇ 성과관리 현황 (예시) ※ 연구데이터 관리계획(DMP : Data Management Plan) 참고 - (연구데이터 수집 생산) 우선 패션 아이템의 메타데이터 및 학습/평가 대화 데이터셋 구축을 위한 툴킷을 제작하고, 패션 및 자연어처리 전문가를 활용하여 데이터셋 구축하며, 본 과제에서 개발한 자율성장 인공지능 기술을 적용하여 데이터셋 검증 - 연구계획서, 연구대상자 모집 공고문 및 설명문 작성 후 생명윤리위원회(IRB) 승인 획득, 연구대상자 모집 후 스마트폰앱을 이용한 실험기간내 일상생활 데이터 수집 등 - (연구데이터 저장 및 보존) 데이터셋 구축 과정에서 2주 단위로 서버와 외부 하드디스크에 저장하고 최종 데이터셋은 복수의 과제 서버에 보존 - 연구대상자로부터 수집된 행동반응과 생리반응 신호를 포함한 센서 및 모바일 디바이스의 사용자 데이터는 개인식별이 불가능하도록 나이와 성별만 기록하고 일련번호로만 구분하도록 함 - (데이터 공동활용) 데이터셋 구축이 완료되는 시점에, 웹사이트(https://fashion-how.org/)를 통해 다운로드 - 한국어 멀티모달 감정 데이터셋(KEMDy19, KEMDy20), 라이프로그 데이터셋(2020-2018)을 “ETRI 나눔AI” 포털에 공개하여 연구 목적으로 활용하도록 함
ㅇ 성과활용 계획 - (기술적) 인간과의 상호 작용을 통해 지식을 학습하여 성장하고 예측 및 추론을 수행하는 자율성장 인공지능 에이전트 기술은 지식의 지속적 축적 및 창의적 해석을 요구하는 대화형 고품질 전문 지식 상담 서비스 시장에 응용 - 경험 데이터 관리 및 분석 프로토타입 시스템을 수면장애 임상 연구에 활용하여 일상 중 마음과 신체 건강 관리를 위한 서비스의 기술적 문제를 해결하고 확장하는데 활용 - 국내 최대 다국어 음성인식(40여개 언어) 및 통역기술(13개 언어) 확보를 통해 글로벌 기업과 기술적 경쟁 가능 - 자가적응형 점진적 학습 알고리즘 SAIL을 통해 데이터 공유가 어려운 일반적 학습 환경하에서 우수 성능 확보를 통해 AI 기술발전 견인 - (사회문제해결) 저소득층에서 의료, 법률, 금융, 교육 등 전문 지식이 요구되는 분야에서 비용 부담에 따른 사회적 정보 불균등 현상이 존재하는데 이를 완화하는데 활용 - 신체와 정신 건강 유지와 적시 알림을 통해 삶의 질을 향상시키고, 감성지능이 낮은 사람들의 감성 지능을 향상시켜 더 건강한 사회활동을 하는데 기여 - 국내거주 외국인 증가로 민원, 사법 수요 증가따라 공공기관에서 언어장벽 애로 해소를 위한 관광 안내통역, 무역통역, 학술통역, 경찰통역 등에 활용 - 자가적응형 점진적 학습 알고리즘 SAIL을 공유 불가능한 다수 데이터셋에 적용함으로써 개인정보 침해 여지가 있거나 높은 보안이 요구되는 분야에서도 우수 성능 확보 - (확보된 기술의 사업화 전략) 향후 자율성장과 휴먼이해 에이전트의 통합 프로토타입을 개발하고 멀티 모달 로봇 분야에서 테스트를 수행함으로써 사업 종료시 사업화를 위한 최적화 기술을 확보함 - 일상생활에서 라이프로그 데이터를 수집하고 분석하는 시스템과 이에 기반한 행동/감정 인식 기술은 인지적/신체적 건강을 지키는 디지털 헬스케어, 디지털치료제 분야에 기반 기술로 활용 가능 - 다국어 Conversational 음성인식은 AI스피커, AI콜센터, 키오스크, 로봇, 자율주행차 등 기본 인터페이스로 채택가능성이 높아 경제적 파급효과가 매우 큼 - 자가적응형 점진적 학습 기술을 의료 데이터에 적용하여 의료 빅데이터 관련 업체에 기술 라이센싱을 통해 병원 및 의료기관에서 활용 가능
□ 향후 과제 수행계획 ㅇ 다음 연도 연구개발계획 1) 연구개발 목표 및 내용 - 자율성장 교감형 에이전트 통합 검증 시스템 구현 - 다중 경험 기반 자율성장 기술 개발(I) - 경험학습 기반 감정/행동 예측 기술 개발(I) - 자율성장 교감형 에이전트 프로토타입 v0.5 구현 2) 국내외 분야 환경변화 (해당시 작성) - 다중 인공지능 협업 기술을 활용하여 자율주행, 지능형 로봇, 스마트팩토리 등 제조업 융합 분야에서 글로벌 산업 간의 치열한 주도권 경쟁이 벌어지고 있음 - 라이프로그 데이터를 활용한 AI 연구가 활발해지고 있으며, 과거 데이터로부터 예측하거나 데이터 사이 관계성을 찾는 기술에 대한 요구가 커지고 있음 - 국내 유입하는 외국인이 대폭 증가함에 따라 언어소통을 위한 자동통번역 필요성이 커지고 있음 3) 연구개발 추진전략 - 에이전트 간 협업으로 인간의 개입 없이 스스로 개인 맞춤형 행동 추천 지식을 성장시키는 교감형 자율지식 성장 연구를 수행하고 멀티모달 교감형 로봇에 적용하여 검증 - 휴먼이해 원천기술 개발 후 실증에 적용하여 라이프로그 데이터의 품질을 높이고 다시 원천기술을 고도화하는 선순환 전략으로 연구 추진 - 서울경제진흥원, 관세청 등 통번역 서비스를 현장에 적용하기 위한 노력을 병행 노력 4) 연구개발 일정 및 기대 성과 - 당해년도 연구개발비 사용 현황 기준으로 에이전트 간 협업 기술 개발 전략에 맞추어 세부 비목별 예산 편성 예정 - 자율성장 및 휴먼이해 에이전트 요소기술을 통합한 자율성장 교감형 인공지능 통합 검증 시스템 v0.5 개발 (BIG사업) - 40여개 다국어 음성인식 기술 확보 및 현장에 적용하기 위한 통합모델 개발 추진 5) 다음 연차 연구개발비 사용계획 - 당해연도 연구개발비 사용현황을 기준으로 하되 정부의 연구비 조정안을 반영하여, 원천기술 고도화, 통합 검증 시스템 개발에 중점을 맞추어 세부 비목별 예산 편성예정 6) 사업화 추진 계획 (해당시 작성) - 서울교통공사 명동지역 자동통역 서비스 사업화 추진
(출처 : 요약문 2p)
Copyright Policy
ETRI KSP Copyright Policy
The materials provided on this website are subject to copyrights owned by ETRI and protected by the Copyright Act. Any reproduction, modification, or distribution, in whole or in part, requires the prior explicit approval of ETRI. However, under Article 24.2 of the Copyright Act, the materials may be freely used provided the user complies with the following terms:
The materials to be used must have attached a Korea Open Government License (KOGL) Type 4 symbol, which is similar to CC-BY-NC-ND (Creative Commons Attribution Non-Commercial No Derivatives License). Users are free to use the materials only for non-commercial purposes, provided that original works are properly cited and that no alterations, modifications, or changes to such works is made. This website may contain materials for which ETRI does not hold full copyright or for which ETRI shares copyright in conjunction with other third parties. Without explicit permission, any use of such materials without KOGL indication is strictly prohibited and will constitute an infringement of the copyright of ETRI or of the relevant copyright holders.
J. Kim et. al, "Trends in Lightweight Kernel for Many core Based High-Performance Computing", Electronics and Telecommunications Trends. Vol. 32, No. 4, 2017, KOGL Type 4: Source Indication + Commercial Use Prohibition + Change Prohibition
J. Sim et.al, “the Fourth Industrial Revolution and ICT – IDX Strategy for leading the Fourth Industrial Revolution”, ETRI Insight, 2017, KOGL Type 4: Source Indication + Commercial Use Prohibition + Change Prohibition
If you have any questions or concerns about these terms of use, or if you would like to request permission to use any material on this website, please feel free to contact us
KOGL Type 4:(Source Indication + Commercial Use Prohibition+Change Prohibition)
Contact ETRI, Research Information Service Section
Privacy Policy
ETRI KSP Privacy Policy
ETRI does not collect personal information from external users who access our Knowledge Sharing Platform (KSP). Unathorized automated collection of researcher information from our platform without ETRI's consent is strictly prohibited.
[Researcher Information Disclosure] ETRI publicly shares specific researcher information related to research outcomes, including the researcher's name, department, work email, and work phone number.
※ ETRI does not share employee photographs with external users without the explicit consent of the researcher. If a researcher provides consent, their photograph may be displayed on the KSP.