서지주요정보
Speaker oriented conversation model and its evaluation = 화자 기반 대화 모델 및 평가 방법
서명 / 저자 Speaker oriented conversation model and its evaluation = 화자 기반 대화 모델 및 평가 방법 / JinYeong Bak.
저자명 Bak, JinYeong ; 박진영
발행사항 [대전 : 한국과학기술원, 2020].

소장정보

등록번호

8036358

소장위치/청구기호

학술문화관(도서관)2층 패컬티라운지(학위논문)

DCS 20020

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

리뷰정보

초록정보

This thesis presents new methods for generating appropriate responses of open-domain conversations and evaluating the quality of the generated responses. Open-domain conversations are casual conversations between people without limited topics. Many neural network based open-domain conversation models have seen successes in recent years. Despite these recent successes, the open-domain conversation models still have challenges to imitate the human-level conversations. One of the challenges is the consideration of speakers in the conversations. The main contribution of this thesis is suggesting a novel speaker oriented conversation model and its evaluation metric. First, I build a new and large open-domain conversation corpus, Twitter conversation corpus. The corpus has three characteristics. First, the conversations are open-domain, as opposed to specific topics such as forum comments. Second, the conversations are naturally-occurring, as opposed to authored such as movie scripts. Third, Twitter users are socially connected among them, as opposed to task-oriented corpora. I propose a speaker oriented conversation model, Variational Hierarchical User-based Conversation Model (VHUCM). VHUCM generates appropriate responses for given conversations and personalized responses. With the new conversation corpus, VHUCM outperforms baselines for most of the automated metrics. VHUCM also generates personalized responses based on the speakers. VHUCM solves the new user cold-start problem. I suggest new evaluation metrics for open-domain conversation responses, Speaker Sensitive Responses Evaluation Model (SSREM). SSREM examines the conversational context and ground truth response together. It learns the model parameters from the unlabeled Twitter conversation corpus. The main idea of the approach is that it considers the speakers in defining the different levels of similar context. Experiments show that SSREM outperforms the other existing evaluation metrics in terms of high correlation with human annotation scores. I also show that SSREM trained on Twitter can be applied to movie dialogues without any additional training.

이 논문은 열린 주제의 대화에서 적절한 대화 대답을 생성하는 모델 및 그 평가방법에 대해 논한다. 열린 주제의 대화란 사람들 간의 주제에 대한 제한 없이 자유롭게 얘기하는 일상대화를 뜻한다. 많은 뉴럴 네트워크 기반 대화 모델들은 최근에 큰 성공을 거두고 있다. 하지만 이런 성공에도 사람 수준의 대화를 생성함에는 한계가 여러 있다. 여러 도전 중 하나로 대화 속 화자에 대한 고려가 부족했다는 점이 있다. 이 논문의 기여점은 화자 기반의 대화 모델 및 그 방법론에 대한 것을 제안하였다는 것이다. 이를 위해 나는 일상적인 대화 데이터인 트위터 대화를 구축하였다. 그 후 화자를 고려한 대화 모델을 제안하였으며 그 모델은 다른 모델들보다 적절한 대화 대답을 생성하였다. 더 나아가서 나는 생성된 대화 대답을 자동으로 평가하는 모델도 개발하였다. 해당 모델은 사람이 평가한 것과 유사한 평가를 내렸다.

서지기타정보

서지기타정보
청구기호 {DCS 20020
형태사항 viii, 87 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 박진영
지도교수의 영문표기 : Alice Oh
지도교수의 한글표기 : 오혜연
수록잡지명 : "Speaker Sensitive Response Evaluation Model". Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, 6376–6385(2020)
학위논문 학위논문(박사) - 한국과학기술원 : 전산학부,
서지주기 References : p. 76-84
주제 Open-domain Conversation
Conversation Modeling
Evaluation
Metric
Machine Learning
Deep Learning
User Modeling
열린 주제 대화
대화 모델링
평가 방법
평가 수치
기계학습
딥러닝
유저 모델링
QR CODE qr code