서지주요정보
Robust performance evaluation of POMDP-based dialogue systems = POMDP 기반 대화 시스템의 강인한 성능 평가 방법
서명 / 저자 Robust performance evaluation of POMDP-based dialogue systems = POMDP 기반 대화 시스템의 강인한 성능 평가 방법 / Dong-Ho Kim.
발행사항 [대전 : 한국과학기술원, 2011].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8022280

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 11003

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Partially observable Markov decision processes (POMDPs) have received significant interest in research on spoken dialogue systems, due to among many benefits its ability to naturally model the dialogue strategy selection problem under unreliable automated speech recognition. However, the POMDP approaches are essentially model-based, and as a result, the dialogue strategy computed from POMDP is still subject to the correctness of the user model. Moreover, there are difficulties in evaluating the dialogue strategies with no guarantee of the user model quality. In this paper, we propose a novel evaluation scheme for dialogue strategies of MDP/POMDP-based dialogue systems, which evaluates the dialogue strategies under model uncertainty. For the experiments, we extend some of the previous MDP user models to POMDPs, and evaluate the effects of user models on the dialogue strategy computed from POMDPs. We experimentally show that this evaluation method yields more reliable results in a sense that a strategy learned with a poor user model fails severely across different user models, and a strategy learned with a good user model performs well consistently. We additionally show that the strategy computed from POMDPs is more robust for model variations compared to MDPs.

부분 관찰 마르코프 의사결정 과정(POMDP)은 대화 관리 시스템 연구에서 많은 주목을 받고 있다. 이는 부정확한 자동 음성인식 하에서 대화 정책의 선택 문제를 자연스럽게 모델링할 수 있는 POMDP의 장점 때문이다. 그러나 POMDP는 기본적으로 모델 기반 방법이기 때문에 POMDP로부터 계산된 대화 정책의 품질은 사용자 모델의 정확도에 영향을 받는다. 그러므로 이러한 사용자 모델의 정확도를 보장할 수 없는 경우에 POMDP로부터 계산된 대화 정책의 성능을 평가하는 데에는 어려움이 따르게 된다. 본 학위논문에서는 한정된 데이터로부터 학습된 사용자 모델의 불확실성을 고려하는 새로운 대화 정책 성능 평가 방법을 제안한다. 이를 위해 기존의 마르코프 의사결정 과정(MDP) 기반 사용자 모델을 POMDP로 확장하고, 이로부터 계산된 대화 정책에 미치는 사용자 모델의 영향을 평가한다. 실험 결과, 제안된 대화 정책 평가 방법을 사용하였을 때 나쁜 사용자 모델에서 학습된 정책은 어떠한 사용자 모델에 적용하더라도 나쁜 성능을 보이고, 좋은 사용자 모델에서 학습된 정책은 일관되게 좋은 성능을 보이는 등 더 신뢰성이 높은 평가 결과를 보였다. 또한, POMDP로부터 계산된 정책이 MDP로부터 계산된 정책보다 모델의 변이에 대해 더욱 강인하다는 사실을 확인하였다.

서지기타정보

서지기타정보
청구기호 {DCS 11003
형태사항 vii, 66 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 김동호
지도교수의 영문표기 : Kee-Eung Kim
지도교수의 한글표기 : 김기응
공동교수의 영문표기 : Jin-Hyung Kim
공동교수의 한글표기 : 김진형
수록잡지명 : "Robust Performance Evaluation of POMDP-Based Dialogue Systems". IEEE Transactions on Audio, Speech, and Language Processing,
학위논문 학위논문(박사) - 한국과학기술원 : 전산학과,
서지주기 참고문헌 : p. 61-65
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서