서지주요정보
Intrinsic motivation driven intuitive physics learning = 본질적인 동기 유발 중심의 직관적 물리 학습
서명 / 저자 Intrinsic motivation driven intuitive physics learning = 본질적인 동기 유발 중심의 직관적 물리 학습 / Jae Won Choi.
저자명 Choi, Jae Won ; 최재원
발행사항 [대전 : 한국과학기술원, 2019].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8033588

소장위치/청구기호

학술문화관(도서관)2층 패컬티라운지(학위논문)

MRE 19003

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

At an early age, human infants are able to learn and build a model of the world very quickly by constantly observing and interacting with objects around them. One of the most fundamental intuitions human infants acquire is intuitive physics. Human infants learn and develop these models which later serve as a prior knowledge for further learning. Inspired by such behaviors exhibited by human infants, we introduce a graphical physics network integrated with reinforcement learning. Using pybullet 3D physics engine, we show that our graphical physics network is able to infer object's positions and velocities very effectively and our reinforcement learning network encourages an agent to improve its model by making it continuously interact with objects only using intrinsic motivation. In addition, we introduce a reward normalization trick that allows our agent to efficiently choose actions that can improve its intuitive physics model the most. We experiment our model in both stationary and non-stationary state problems, and measure the number of different actions agent performs and the accuracy of agent's intuition model.

영아들은 주위의 대상을 지속적으로 관찰하고 상호 작용함으로써 실세계 모델을 매우 빠르게 학습하고 구축할 수 있습니다. 영아들이 구축하는 가장 근본적인 직감 중 하나는 직관적 물리입니다. 인간 유아는 추후 학습을 위한 사전 지식으로 사용되는이 모델을 배우고 개발합니다. 인간 유아가 보여준 그러한 행동에 영감을 받아 강화 학습과 통합된 물리 네트워크를 소개합니다. pybullet 3D 물리 엔진을 사용하여 물리 네트워크가 객체의 위치와 속도를 매우 효과적으로 추론 하고, 강화 학습 네트워크는 에이전트가 내재적 동기만을 사용하여 객체와 지속적으로 상호 작용함으로써 모델을 개선 하는 것을 보여주고자 합니다. 또한 직관적 물리 모델을 가장 효과적으로 개선 할 수있는 작업을 효율적으로 선택할 수있는 보상 정규화 트릭을 소개합니다. 우리는 고정 및 비 고정 상태 문제 모두에서 모델을 실험하고 에이전트가 수행하는 다양한 작업의 수와 직관 모델의 정확성을 측정하여, 본 연구의 우수성을 보이고자 합니다.

서지기타정보

서지기타정보
청구기호 {MRE 19003
형태사항 iii, 21 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 최재원
지도교수의 영문표기 : sung-eui Yoon
지도교수의 한글표기 : 윤성의
학위논문 학위논문(석사) - 한국과학기술원 : 로봇공학학제전공,
서지주기 References : p. 18-20
주제 Cognitive science
intuitive physics
reinforcement learning
intrinsic motivation
직관적 물리
강화 학습
내재적 동기
QR CODE qr code