The goal-oriented dialogue system needs to be optimized for tracking the dialogue flow and carrying out an effective conversation under various situations to meet the user goal. The traditional approach to building such a dialogue system is to take a pipelined modular architecture, where its modules are optimized individually. However, such an optimization scheme does not necessarily yield an overall performance improvement of the whole system. On the other hand, end-to-end dialogue systems with monolithic neural architecture are often trained only with input-output utterances, without taking into account the entire annotations available in the corpus. This scheme makes it difficult for goal-oriented dialogues where the system needs to be integrated with external systems or to provide interpretable information about why the system generated a particular response. In this paper, we present an end-to-end neural architecture for dialogue systems that addresses both challenges above.
목표 지향적 대화 시스템은 사용자의 목표를 달성하기 위해 대화 흐름을 추적하고 다양한 상황에서 효과적인 대화를 수행 할 수 있도록 최적화되어야 한다. 이러한 대화 시스템을 구축하는 전통적인 접근 방식은 각 대화 모듈들이 개별적으로 최적화되어 파이프 라인 형태의 구조이다. 그러나 이러한 최적화 방식이 반드시 전체 시스템의 전반적인 성능 향상을 가져 오는 것은 아니다. 반면, 통합된 신경 아키텍처를 사용하는 엔드-투-엔드 대화 시스템은 대화 데이터셋에서 사용할 수 있는 부가적인 정보를 활용하지 않고 입력-출력 발화로만 훈련이 된다. 이러한 방식은 시스템이 외부 시스템과 통합되어야 하는 목표 지향적 대화를 어렵게 하거나 시스템이 특정 응답을 생성 한 이유에 대한 해석 가능한 정보를 제공하기 어렵다. 본 논문에서는 위의 두 가지 문제를 모두 해결하는 대화 시스템을 위한 엔드-투-엔드 신경망 구조를 제안한다.