Recent studies have suggested various computational models of human reinforcement learning , but task design for these studies is often difficult, due to the complexity of human reinforcement learning and high individual variability. Furthermore, unlike animal studies, human studies lack brain stimulation methodologies, thus impeding the investigation of the computational mechanisms underlying reinforcement learning. In this thesis, I propose an algorithm, called a task controller , for improving learned task design, using interaction with a standard computational model of human reinforcement learning. The model-based fMRI analysis, involving 21 human subjects, showed that the learned task design has the potential to guide the neural activity of the targeted brain regions.
최근에 많은 연구들은 인간의 강화학습에 대한 다양한 계산 모델들을 제시해주고 있다. 하지만 여전히 인간의 강화학습 연구를 위한 실험 설계는 사람의 강화학습의 복잡성과 개인간의 차이 때문에 연구자들에게 많은 문제를 안겨주었다. 또한, 인간에대한 강화학습 연구는 동물 실험과 달리 특정 뇌 영역을 조정하는 방법이 흔하지 않아 계산 모델과 뇌의 생리적 기작을 연구하는데 한계를 부여하고 있다. 본 학위논문에서는 인간의 강화 학습 모델과 기계 학습을 조합하여 다양한 실험 목적에 맞는 효과적인 실험 설계를 도출하고, 해당 설계를 통해 뇌의 특이적 구역 활성 패턴을 원하는 상태로 유도하는 알고리즘을 제안한다.