I present a computational framework for understanding the social aspects of emotions in Twitter conversations, where a conversation is a consecutive chain of reply tweets. Using that data, I explore in-depth questions of the emotional patterns in conversational interactions. I look for meaningful patterns of emotional exchanges in a conversation, and those patterns may depend on the topics and words of the conversation. I also hypothesize that conversational partners can influence each others` emotions and topics. Further, I discover interesting patterns in the overall emotions, affected by the lexical usages of the interlocutors. To find these patterns, I develop a novel computational framework, based on LDA, to discover the emotions from an unannotated corpus of Twitter conversations, and I evaluate the model by a human-annotated corpus. Specifically, I use LDA with Dirichlet Forest prior (DF-LDA) to discover emotion-centric topics from unannotated corpus. From the evaluation I verify our framework as a practical emotion classifier. I find that conversational partners usually express the same emotion, which I name Emotion accommodation, but when they do not, one of the conversational partners tends to respond with a positive emotion to a negative emotion rather than vice versa. I also show that tweets containing sympathy, apology, and complaint are significant emotion influencers. One interesting pattern is that Twitter users tend to feel happy at morning and feel angry at the night. Finally, I discover lexical patterns, such as the usage of swear words, that influence the overall emotion of a conversation.
본 학위논문에서는 온라인 소셜 네트워크 대화에서 나타나는 감정의 사회적 측면을 이해하고자 대화에서 감정을 발견하는 자동화된 프레임워크를 제시한다. 트위터에서 연속된 reply를 chain으로 정의하여, 온라인에서의 대화에서 나타나는 감정 패턴을 발견한다. 이러한 패턴은 대화 주제(topic)나 단어(word)로 표현되며, 대화에 참여하는 대화자들이 대화 주제, 단어, 감정 그 자체를 통해 상대방의 감정에 영향을 줌을 보인다. 또한, 대화자들의 종합적인 어휘적 사용이 감정적 패턴에 미치는 영향 패턴을 발견한다. 이러한 패턴을 찾기 위해, 본 논문에서는 주석 없는 대용량의 트워터 데이터에서 감정과 대화 주제를 자동으로 찾아내도록 설계된 latent Dirichlet allocation (LDA)에 기반한 자동화된 프레임워크를 제시하고, 사람이 분류한 데이터를 기반으로 프레임워크의 성능을 평가한다. 이 프레임워크는 Dirichlet Forest prior (DF-LDA)를 사용하여 여러 개의 감정이 겹치지 않은 대화 주제를 찾아내며, 성능 분석을 통해 이 프레임워크가 실용적으로 사용될 만함을 보였다. 실험을 통해, 같은 대화에 참여하는 대화자들이 비슷한 감정을 가짐을 보였으며, 본 논문에서는 Emotion accommodation이라고 정의한다. 또한 대화자들이 부정적보다는 긍정적인 감정을 가지는 대답을 더 선호함을 보였다. 또한 공감, 사과, 불만이 상대방의 감정을 가장 효과적으로 바꾸는 대화 주제이며, 트위터 사용자들이 아침에는 행복해하며 밤에 기분이 언짢아지고, 욕과 같은 특정 단어들이 대화에서의 전체적인 감정에 영향을 미침을 보였다.