Facts and opinions are two main types of textual information on the Web. Though current research focuses on the analysis of factual information in text, understanding sentiment and opinions expressed in text is getting important to understand text. Sentiment topic detection summarizes sentiment expression of the same target distributed over documents. Researches on sentiment topic detection have found sentiment topic by analyzing topic over documents and associating sentiment expression to topics. This paper proposes an approach of sentiment topic detection that utilizing local sentiment expression to detect sentiment topic. Sentiment expressions in each document are analyzed and documents are grouped by sentiment expressions of them. Through MPQA dataset, we found proposed approach reduces clustering error of sentiment topics compared.
사실 정보와 의견 정보는 웹 문서에서 얻을 수 있는 언어 정보이다. 현재의 연구는 사실 정보를 분석하는데 초점이 맞추어져 있으나, 문서를 더 잘 이해하기 위해 의견 정보의 분석의 필요성이 대두되었다. 감성 주제 탐지는 같은 대상에 대해서 각 문서에 분포된 감성 표현에 대해 요약을 제공한다. 현존하는 감성 주제 탐지 연구들은 주어진 문서에 대하여 주제를 탐지하고 각 주제에 대하여 감성 정보를 결부하는 접근법으로 감성 정보를 탐지하였다. 본 논문에서는 문서 내 감성 표현을 활용하여, 각 문서에 표현된 감성 정보에 기반한 감성 주제 탐지를 제안한다. MPQA 말뭉치를 이용해 평가하여, 기존 연구의 접근법에 비해 제안하는 접근법이 더 낮은 군집 오류를 보임을 확인하였다.