ETRI-Knowledge Sharing Plaform

KOREAN
논문 검색
Type SCI
Year ~ Keyword

Detail

Conference Paper 강화학습 게임에서 높은 보상 수렴속도 개선을 위한 가상환경 기반의 DQN 모델
Cited - time in scopus Share share facebook twitter linkedin kakaostory
Authors
이성준, 온병원, 최규상, 이성원
Issue Date
2020-10
Citation
한국정보기술학회 종합 학술 대회 2020, pp.472-475
Publisher
한국정보기술학회
Language
Korean
Type
Conference Paper
Abstract
강화학습 연구에서 연속적인 데이터들을 바로 학습에 이용할 경우 특정한 학습 패턴에 갇히게 되는 문제가 발생한다. 이를 해결하기 위해 심층 큐 네트워크(Deep Q-Network; DQN)알고리즘에서는 리플레이 메모리를 이용하여 데이터를 바로 학습시키지 않고 메모리에 저장해 두었다가 랜덤으로 꺼내서 학습하는 방식으로 해결하였다. 이 논문은 DQN 알고리즘을 기반으로 단일 환경이 아닌 가상의 환경을 추가로 구축하고 이로부터 얻은 데이터들을 학습에 이용함으로써 높은 보상에 빠르게 수렴한다.
KSP Keywords
Deep Q-Network