This thesis presents new methods for generating appropriate responses of open-domain conversations and evaluating the quality of the generated responses.
Open-domain conversations are casual conversations between people without limited topics.
Many neural network based open-domain conversation models have seen successes in recent years.
Despite these recent successes, the open-domain conversation models still have challenges to imitate the human-level conversations.
One of the challenges is the consideration of speakers in the conversations.
The main contribution of this thesis is suggesting a novel speaker oriented conversation model and its evaluation metric.
First, I build a new and large open-domain conversation corpus, Twitter conversation corpus.
The corpus has three characteristics.
First, the conversations are open-domain, as opposed to specific topics such as forum comments.
Second, the conversations are naturally-occurring, as opposed to authored such as movie scripts.
Third, Twitter users are socially connected among them, as opposed to task-oriented corpora.
I propose a speaker oriented conversation model, Variational Hierarchical User-based Conversation Model (VHUCM).
VHUCM generates appropriate responses for given conversations and personalized responses.
With the new conversation corpus, VHUCM outperforms baselines for most of the automated metrics.
VHUCM also generates personalized responses based on the speakers.
VHUCM solves the new user cold-start problem.
I suggest new evaluation metrics for open-domain conversation responses, Speaker Sensitive Responses Evaluation Model (SSREM).
SSREM examines the conversational context and ground truth response together.
It learns the model parameters from the unlabeled Twitter conversation corpus.
The main idea of the approach is that it considers the speakers in defining the different levels of similar context.
Experiments show that SSREM outperforms the other existing evaluation metrics in terms of high correlation with human annotation scores.
I also show that SSREM trained on Twitter can be applied to movie dialogues without any additional training.
이 논문은 열린 주제의 대화에서 적절한 대화 대답을 생성하는 모델 및 그 평가방법에 대해 논한다.
열린 주제의 대화란 사람들 간의 주제에 대한 제한 없이 자유롭게 얘기하는 일상대화를 뜻한다.
많은 뉴럴 네트워크 기반 대화 모델들은 최근에 큰 성공을 거두고 있다.
하지만 이런 성공에도 사람 수준의 대화를 생성함에는 한계가 여러 있다.
여러 도전 중 하나로 대화 속 화자에 대한 고려가 부족했다는 점이 있다.
이 논문의 기여점은 화자 기반의 대화 모델 및 그 방법론에 대한 것을 제안하였다는 것이다.
이를 위해 나는 일상적인 대화 데이터인 트위터 대화를 구축하였다.
그 후 화자를 고려한 대화 모델을 제안하였으며 그 모델은 다른 모델들보다 적절한 대화 대답을 생성하였다.
더 나아가서 나는 생성된 대화 대답을 자동으로 평가하는 모델도 개발하였다. 해당 모델은 사람이 평가한 것과 유사한 평가를 내렸다.