서지주요정보
Data augmentation for learning to play in text-based games = 텍스트 게임에서의 일반화를 위한 데이터 증강 연구
서명 / 저자 Data augmentation for learning to play in text-based games = 텍스트 게임에서의 일반화를 위한 데이터 증강 연구 / Jinhyeon Kim.
발행사항 [대전 : 한국과학기술원, 2022].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8039298

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MAI 22022

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Text-based game is an instance of partially observable environment where the observation and action are in the form of natural language. Generalizing in text-based games serves as a useful stepping-stone towards reinforcement learning (RL) agent with generic linguistic ability. Prior works on generalization in RL often applied data augmentation techniques, but none of them focused on text-based games. We propose a novel data augmentation technique for text-based games, Transition-Matching Permutation, where we identify phrase permutations that match as many transitions in the trajectory data. Applying this technique resulted in the state-of-the-art performance in a procedurally generated TextWorld's Cooking Game benchmark.

텍스트 게임은 관측과 행동이 모두 자연어로 된 부분 관측 환경의 일종이다. 텍스트 게임에서의 일반화는 일반 언어 능력을 지닌 강화학습을 위한 중요한 발판이다. 이전의 강화 학습 연구에서도 일반화를 위해 데이터 증강을 적용하였으나 텍스트 게임에 이를 적용한 연구는 없었다. 본 연구는 텍스트 게임에 적용할 수 있는 데이터 증강 방법인 "전이 대응 치환"을 제안한다. 이 방법론은 경로 자료를 바탕으로 개별 전이를 일정 기준보다 많이 대응시키는 어구 치환을 찾아 훈련에 적용한다. 이 기법을 절차 생성 텍스트 게임 벤치마크에 적용한 결과 이전보다 더 높은 성능을 얻을 수 있었다.

서지기타정보

서지기타정보
청구기호 {MAI 22022
형태사항 iv, 19 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김진현
지도교수의 영문표기 : Kee-Eung Kim
지도교수의 한글표기 : 김기응
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 김재철AI대학원,
서지주기 References : p. 16-17
주제 텍스트 게임
자연어 처리
강화 학습
데이터 증강
Text-based game
Natural language processing
Reinforcement learning
Data augmentation
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서