Goal-oriented dialog systems require a different approach from chit-chat conversation systems in that they typically interact with an external knowledge base. It is desirable to incorporate domain knowledge to operate on the external knowledge. This paper presents extensions to hybrid code networks with reinforcement learning agent for the sixth dialog system technology (DSTC6) Facebook AI research (FAIR) dialog dataset. It reduced the effort in manually constructing the rules or additional labeling compared to the previous approaches. Thanks to the well-designed RL agents and reasonable domain-specific rules, the proposed model achieved high accuracy in the most of the test sets.
목적을 갖는 대화 시스템은 일반적으로 외부 지식 베이스와의 상호작용이 수반되기 때문에, 목적을 갖지 않는 대화 시스템과는 다른 접근이 필요하다. 외부 지식 베이스와의 상호작용을 위해 도메인 지식을 혼합하는 접근방법을 취할 수 있다. 본 논문에서는 강화 학습 에이전트를 이용하여 하이브리드 코드 네트워크를 확장하여 대화 시스템 기술 챌린지 (DSTC6) 페이스북 인공지능 연구소 (FAIR) 대화 데이타셋에 적용하였다. 기존 접근 방법과 비교하여 본 모델은 규칙을 만들거나 추가 라벨을 생성하는 등의 노력을 감소시켰다. 강화학습 에이전트와 도메인 규칙을 바탕으로 본 모델은 대부분의 테스트 셋에 대하여 높은 정확도를 보였다.