The dialog state tracking, which refers to identifying the user's intent from the utterances, is one of the most important tasks in dialog management. In this paper, we present our dialog state tracker developed for the fifth dialog state tracking challenge (DSTC5), which focused on cross-language adaptation using machine-translated training data, which was very scarce compared to the size of the ontology. Our dialog state tracker is based on the bi-directional long short-term memory (LSTM) with a hierarchical attention mechanism in order to spot important words in user utterances. The intent prediction is done by finding the most relevant keyword in the ontology to the attention-weighted word vector. Our tracker thus has various advantages over existing approaches, such as predicting out-of-vocabulary (OOV) intent due to scarce training data or machine translation. We show that our tracker outperforms other trackers submitted to the challenge in terms of almost all performance measures.
발화로부터 사용자의 의도를 파악하는 대화 상태 추적은 대화 관리에 존재하는 중요한 문제들 중 한 가지이다. 본 논문에서 우리는 대화 상태 추적 대회 (DSTC5)를 위해 개발된 대화 상태 추적기를 제안한다. DSTC5는 기계 번역된 학습 데이터를 사용하여 언어 간 학습에 초점을 맞추고 있으며, 방대한 양의 온톨로지에 비해 학습 데이터의 양이 매우 적다. 우리의 대화 상태 추적기는 양방향의 LSTM을 기반으로 구성되며 계층적 어텐션 메커니즘을 이용하여 사용자의 발화에서 중요한 단어들에 집중하도록 한다. 가중치 합으로 생성된 단어 벡터와 가장 관련 있는 온톨로지의 단어를 찾는 과정을 통해 의도 예측이 이루어진다. 우리의 추적기는 기계 번역이나 부족한 양의 학습 데이터 때문에 발생하는 OOV를 예측하는 것을 포함하여 기존의 방법들에 비해 여러 가지 장점을 갖는다. 우리는 거의 모든 평가요소에 대하여 기존에 제안된 추적기들에 비해 우리가 제안한 추적기가 좋은 성능을 가지는 것을 보였다.