서지주요정보
Identifying mentions about long-term experiences and sentiment change on a specific target based on linguistic analysis: application to a product review domain = 언어학적 분석에 기반한 특정 대상에 대한 장기 경험 및 감정 변화 파악: 상품리뷰에의 응용
서명 / 저자 Identifying mentions about long-term experiences and sentiment change on a specific target based on linguistic analysis: application to a product review domain = 언어학적 분석에 기반한 특정 대상에 대한 장기 경험 및 감정 변화 파악: 상품리뷰에의 응용 / Hye-Jin Min.
발행사항 [대전 : 한국과학기술원, 2012].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8024568

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 12013

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

People post and share their experiences through social media on the web these days. The resulting usergenerated web documents have become a useful source of advice for making a decision or resolving difficulties because people can learn from others’ past successes or failures. Recently, in response to the rapid growth of such documents and great potential of experience-based information, researches have been conducted on analyzing experiences in user-generated web documents. Earlier work has addressed the issue on distinguishing “experience sentences” from others and has proposed a discrimination method based on the linguistic properties of the mentioned events in such sentences. However, such work has focused mostly on a single event at a sentence level in large-scale data, so that a meaningful series of a specific person’s experiences on a particular target has not been analyzed fully yet. This dissertation presents a method to analyze mentions about target-oriented experiences. More specifically, we propose a novel method to identify mentions about a customer’s experiences on a particular product in two aspects: long-term experiences and sentiment change in such experiences. As for long-term experiences, the hypothesis is that the two linguistic expressions time expressions and product names fully capture the customer’s long-term experiences mentioned in a review. As for sentiment change, the hypothesis is that sentiment change can be determined by detecting the state in a such review such that the overall sentiment towards a product instance purchased at a certain time in the past may not be the same as the overall sentiment towards another instance purchased at the latest time. In this dissertation, we address three major research questions. The first question is about identifying product names. Unlike previous researches on identification on a product entity level, instance level identification for instance distinction should be accounted for. Our research question is to determine the types of linguistic feature that are useful for such distinction. Based on experimental results, we argue that linguistic features including time expressions, term-based features and event features should be combined differently with respect to the linguistic characteristics of the product names referring to each type of instance. More specifically, we argue that the best combination for the distinction between recent purchases and past purchases is time expressions and term-based features, and the best combination between recent purchases and recent & past purchases is time expressions and event features. The second question is about sentiment classification regarding product names. The inherent polarity of the adjectival modifier should be blocked when it is used to refer to the property or the identity of the product. Regarding the question of determining the context in which the polarity of the adjectival modifier be blocked, we argue that the refined blocking rules with the semantic types of nouns, verbs, and clauses based on compositionality-based syntactic rules enhance the sentiment classification performance especially for neutral sentences. As for product name-sentiment association, we argue that comparative expressions are crucial to associating the compared target with the sentiment opposite to the one in the given grammatical structure and also argue that the product names referring to generic objects are crucial to discarding the sentiment in the given grammatical structure. The last question is about how we utilize the results from our method. As practical applications, we demonstrate a system that identifies helpful reviews by utilizing the proposed measure. The user study shows that this measure is not only as helpful as the best existing ones, such as ‘helpful vote’ or ‘reviewer rank’, but is also free from undesirable biases. We also illustrate another application that rates product reviews with respect to sentiment change. The user study shows that the review rating system based on sentiment change is more credible than the system based on the clause-level sentiment classification.

최근 사람들은 웹 상의 소셜미디어를 통해 자신의 경험을 공유한다. 이러한 유저 생성 웹 문서 (user generated web documents)는 결정을 내릴 때나 어떤 문제를 해결해야 할 때 유용한 조언이 되는데, 이는 우리가 다른 사람들의 성공 또는 실패 경험을 통해 교훈을 얻을 수 있기 때문이다. 이러한 문서의 급속한 성장과 경험정보의 잠재적 유용성으로 인해 유저 생성 웹 문서로부터 개인의 경험정보를 분석하는 연구가 최근 활발히 진행되고 있다. 기존 연구들은 특히, 언어학적 특성을 기반으로 하여 경험이 담긴 문장을 판별하는 문제를 제기하였고, 해당 문장 내에서의 이벤트의 속성을 활용하는 방법을 제안하였다. 그러나, 대부분의 연구들은 광범위한 데이터에 대하여 문장 단위에서 단일 경험정보에 초점을 맞추고 있어 특정 대상에 대한 한 사용자의 연속된 경험에 대해 분석하는 연구는 현재까지 이뤄지고 있지 않다. 본 논문에서는 대상과의 경험에 대한 정보를 파악하는 방법을 제안한다. 특히, 본 논문에서는 특정 상품에 대한 구매자의 경험정보를 두 가지 관점, 즉, 장기 경험(long-term experiences) 과 감정변화(sentiment change) 관점에서 분석한다. 장기 경험에 대해서 본 논문에서는 두 가지 언어 표현, 시간 표현 (time expression)과 상품 이름 (product names)에 의해 구매자의 오랜 기간의 다양한 경험정보를 파악할 수 있다는 가설을 설정한다. 감정 변화 (sentiment change) 에 대해서는 과거 특정 시간에 구매한 상품 객체에 대한 감정 (sentiment)이 최근 구매한 상품 객체에 대한 감정(sentiment)과 같지 않음을 파악하고 이를 통해 구매자의 상품에 대한 감정변화 (sentiment change)를 파악할 수 있다는 가설을 설정한다. 본 논문에서는 제안하는 방법과 관련하여 크게 세 가지 연구 문제에 대하여 다룬다. 그 중 하나는 상품 이름(product names)을 파악하는 것이다. 상품 개체 (product entity) 단위에서 상품명을 파악하는 기존의 연구와 달리 본 연구에서는 상품 객체 (product instance) 단위의 파악이 다뤄져야 한다. 이를 위해서, 본 논문에서는 시간 표현 (time expression), term 기반 자질(term-based features), 그리고 이벤트 기반 자질 (event features)을 각 상품 객체 클래스에 속하는 상품명의 언어학적 특성에 따라 다르게 조합되어야 한다고 주장한다. 실험결과에 따르면, 최근 구매(recent purchases) 객체와 과거 구매 (past purchases) 객체 사이의 구별을 위해서는 시간 표현과 term 기반 자질의 조합이 가장 우수한 성능을 가져옴을 알 수 있었고, 최근 구매(recent purchases) 객체와 최근 & 과거(recent & past purchases) 객체 사이의 구별을 위해서는 시간 표현과 이벤트 기반 자질의 조합이 가장 우수한 성능을 가져옴을 알 수 있었다. 또 다른 중요한 문제는 상품 객체에 대한 감정(sentiment)을 파악하는 것이다. 특히, 본 논문에서는 adjectival modifier 가 특정 상품의 속성이나 식별에 관련이 있을 때, 이 adjectival modifier 가 가지는 polarity 가 차단되어야 한다고 주장한다. 본 연구에서는 기존 연구에서 제안된 compositionality-based syntactic rules 를 기반으로 명사, 동사, 절의 의미적 타입을 기반으로 확장한 규칙을 제안한다. 실험을 통해 제안 규칙이 특히 중립성을 띄는 문장 (neutral sentence)을 파악하는데, 효과적임을 알 수 있었다. 또한, 상품 객체와 polarity 간의 연결에 있어서 비교 표현이 비교대상이 되는 상품 객체와 반대의 class 에 속하는 polarity 와의 연결에 있어 매우 중요한 역할을 하며, 일반적인 객체를 가리키는 상품 객체는 해당 절의 polarity 를 제거시키는데 아주 중요한 역할을 한다고 주장한다. 본 논문에서는 제안하는 방법론에 의하여 유용한 상품리뷰를 파악하는 응용시스템을 제시한다. 사용자 평가를 통해 제안하는 방법이 현재 사용되고 있는 ‘helpful vote’ 나 ‘reviewer rank’ 만큼 유용하고 또한 원하지 않는 편향성으로부터도 자유로움을 파악할 수 있었다. 또한, 상품 리뷰 상에서 구매자의 상품에 대한 감정변화를 기반으로 상품리뷰 상의 만족도를 자동으로 측정하는 시스템을 제시한다. 사용자 평가 결과, 절 단위의 감정분류 (sentiment classification) 를 기반으로 한 시스템에 비하여 보다 신뢰도 있는 평점이라는 결과를 얻었다.

서지기타정보

서지기타정보
청구기호 {DCS 12013
형태사항 vii, 76 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 민혜진
지도교수의 영문표기 : Jong-Cheol Park
지도교수의 한글표기 : 박종철
수록잡지명 : "Identifying helpful reviews based on customer’s mentions about experiences". Expert Systems with Applications, (2012)
학위논문 학위논문(박사) - 한국과학기술원 : 전산학과,
서지주기 References : p. 70-74
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서