서지주요정보
Detection of controversial issues and their subtopics using sentiment analysis = 감성 분석을 이용한 이슈 및 연관된 부주제 탐지
서명 / 저자 Detection of controversial issues and their subtopics using sentiment analysis = 감성 분석을 이용한 이슈 및 연관된 부주제 탐지 / Yoon-Jung Choi.
발행사항 [대전 : 한국과학기술원, 2010].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8021544

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 10029

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

People often want to know about how others think negatively or positively about controversial issues and their subtopic (reason). We define a controversial issue as a concept that invokes conflicting sentiments or views and a subtopic as a reason or factor that gives a particular sentiment or view to the issue. Given the definitions, we propose a method for automatically detecting controversial issues and their subtopics for news articles. For controversial issue detection, we consider the magnitude of sentiment information and the difference between the amounts of two different polarity values. Also, for subtopic identification, we extract candidate phrases and apply a statistical classifier using five different features, some of which attempt to capture the relationship between the identified issue phrase and the candidate subtopic phrase using term distribution information and sentiment clues. Through an experiment and analysis using the MPQA corpus consisting of news articles, we found that the proposed method is promising for both of the tasks although many additional research issues remain to be tapped in the future.

사람들은 논쟁되고 있는 이슈나 사회적 사건과 같이 많은 사람들의 관심의 대상이며 감성을 유발하는 이야기에 대해 흥미를 갖는다. 감성이란 어떠한 객체 (상품, 영화, 정치가 등) 나 추상적인 개념 (사회적 사건, 정치적 개념 등) 에 대해 평가 혹은 판단을 하거나, 찬반을 논하거나, 감정을 느끼는 것을 의미한다. 예를 들어, 사회적 사건에 대해 찬성 혹은 반대를 논하거나, 영화에 대해 긍정적인 평가 혹은 부정적인 평가를 하는 것을 의미한다. 다시 말해, 사람들은 상품, 영화, 사회적 사건 등과 같은 대상에 대해서 다른 사람들의 감성을 알고 싶어한다. 최근 온라인 토론 그룹이나 상품 후기 사이트 등이 급속하게 발전함으로써 이를 뒷받침해준다. 구체적인 대상에 대하여 사람들의 긍정적인 감성 혹은 부정적인 감성이 나타나 있는 텍스트로부터 자동적으로 감성 정보를 추출하는 것은 정부, 기업, 혹은 개인에게 많은 도움을 준다. 이에 따라, 많은 연구자들이 감성 분석에 대하여 연구를 해왔다. 기존 감성 분석 연구에서는 감성을 가지는 텍스트 혹은 문장을 찾아내고, 찾아낸 텍스트 혹은 문장에 대하여 긍정, 부정, 혹은 중립과 같은 극성을 판단하며, 감성의 주체 혹은 대상을 추출하였다. 하지만 사람들은 특성 대상에 대한 감성 정보뿐만 아니라, 현재 논쟁되고 있는 이슈나 사회적 사건 등이 무엇인지 알고 싶어한다. 또한 이슈나 사건에 대해 특정 감성을 갖는 요인이나 이유에 흥미를 갖는다. 실제 뉴스 웹사이트에서 제공하는 관심뉴스 리스트의 70%이상이 현재 논쟁되고 있는 이슈 혹은 사건에 대한 기사이다. 본 논문에서는 뉴스 기사로부터 이러한 논쟁적 이슈와 이와 관련된 감성을 갖는 요인이나 이유에 해당하는 부논제(주제)를 탐지하는 새로운 방법을 고안하였다. 이는 우리가 알고 있는 한 기존 연구에는 존재하지 않는 새로운 시도이다. 논쟁적 이슈는 검색 엔진에서 자주 입력되는 질의(Query) 중 하나이다. 이를 기반으로, 논쟁적 이슈 추출을 위하여 질의 생성 방법을 응용하여 질의의 가능성이 가장 높은 것을 선택하였다. 하지만 이렇게 선택된 질의는 논쟁의 여부를 판단하지 않았기에 논쟁적 이슈라고 하기에는 문제의 여지가 있다. 관찰에 의하면, 논쟁적 이슈는 문장 내에서 감성 단서가 되는 단어들('찬성하다', '부적절하다', '좋다' 등)과 많은 연관 관계를 가진다. 따라서 적합한 논쟁적 이슈를 추출하기 위하여, 선택된 질의와 관련된 문장의 문맥을 분석하여 감성 단서가 되는 단어들을 기반으로 논쟁의 여부를 판단하였다. 만약 선택된 질의가 논쟁의 여지가 없다면, 새로운 질의를 선택하며 이는 적합한 이슈가 추출되기까지 반복한다. 감성 주제는 앞서 추출된 논쟁적 이슈와 밀접한 관련이 있는 문장으로부터 탐지한다. 추출된 이슈와 관계와 감성 단서가 되는 단어들과의 관계를 기반으로 감성 주제 분류기(Classifier)를 제안하였다. 실험을 통해 일반적인 자질(Feature)보다 감성 단서를 이용한 감성 모델 자질이 감성 주제를 탐지하는데 있어서 중요한 단서가 되는 것을 보였으며, 본 논문에서 제안한 방법이 논쟁적 이슈 및 감성 주제 탐지 하는데 있어서 효과적인 것을 보였다.

서지기타정보

서지기타정보
청구기호 {MCS 10029
형태사항 v, 59 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 최윤정
지도교수의 영문표기 : Sung-Hyon Myaeng
지도교수의 한글표기 : 맹성현
Appendix: A, Annotation guideline. - B, User evaluation guideline
학위논문 학위논문(석사) - 한국과학기술원 : 전산학과,
서지주기 Reference: p. 41-47
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서