서지주요정보
Collective intelligence for election prediction & behavioral analysis of online crowd in Korea = 집단지성을 활용한 선거 예측 및 온라인 군중 행동 분석
서명 / 저자 Collective intelligence for election prediction & behavioral analysis of online crowd in Korea = 집단지성을 활용한 선거 예측 및 온라인 군중 행동 분석 / Deug-Cheon Han.
발행사항 [대전 : 한국과학기술원, 2011].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8022370

소장위치/청구기호

학술문화관(문화관) 보존서고

MGSM 11034

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

등록번호

9000554

소장위치/청구기호

서울 학위논문 서가

MGSM 11034 c. 2

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Recently online public opinions have played an important role in elections. However the majority of research companies did not exploited online data to predict a result of elections in Korea. Regarding the Korean regional election in 2010, this paper analyzes online group behavior on a large scale with suggesting a prediction method using data on web-comments from the most activated websites in Korea. Through a suggested scoring algorithm, each of comment data is transformed into numerical data and then regression analysis is conducted on the data for predicting each candidate’s approval rating. In prediction phase, buzz analysis shows a tight competition between the candidates as election date approaches, given that most pollsters predicted about a ten percent gap between the two candidates. Depending on the sources, users support different candidates. In addition, bloggers show more positivity regardless of candidates or parties while users in news website show more negativity. The result of regression analysis exhibits matador effect at large-group level. The prediction result shows 6.66% MAE (mean absolute error) while displaying converging tendency on the line of approval rating as time passes.

최근 들어서 인터넷 여론이 선거에서 차지하는 중요성이 높아지고 있다. 하지만 많은 여론 조사 기관들이 전화 설문 방식 등 전통적인 조사 방식에 의존하고 있는 상황에서 온라인 여론을 실제 지지율 예측에 반영하는데 많은 한계점이 있다. 본 연구에서는 2010년 서울시 지방선거와 관련한 댓글 데이터를 수집하여, 댓글로 선거 예측 가능성을 탐색해보고, 온라인에서 보이는 집단 행동을 분석하고자 한다. 네이버 뉴스, 네이버 블로그, 다음 미디어, 다음 아고라 4개의 소스에서 약 12만개의 댓글을 추출하여, 직접 고안한 스코어링 방식으로 댓글 데이터를 정량화하고 이것을 바탕으로 회귀분석을 실시하였다. 그리고 회귀 분석 이외에도, 버즈 분석을 통해서 기존 여론 조사 기관과 다른 결과를 도출하였는데, 시간이 갈수록 두 후보의 버즈가 치열한 양상을 보였다. 특정 이벤트가 버즈를 촉발시키긴 하지만, 장기적인 관점에서 이벤트에 대한 효과가 어느 정도 진정 되면서 선거를 예측하는데 도움을 줄 수 있는 가능성을 발견하였다. 분석 결과, 총 8개의 변수(오세훈 후보 긍/부정, 한명숙 후보 긍/부정, 한나라당 긍/부정, 민주당 긍/부정) 사이에 흑색 선전 혹은 마타도어 효과(matador effect)를 확인하였다. 그리고 데이터 소스 별로 다른 양상을 보였는데, 먼저 블로그의 경우 전체적으로 긍정적인 의견이 부정적인 의견보다 높이 나왔고, 네이버의 경우 보수 후보 및 보수당에 대한 지지가, 다음의 경우 진보 후보 및 진보당에 대한 지지가 높게 나오는 것을 확인했고, 이는 특정 웹 사이트가 참여자의 정치적 성향을 짐작 할 수 있는 낼 수 있음을 알려준다. 마지막으로 예측 결과는 가장 예측력이 높은 모델이 6.66%의 절대 평균 편차를 기록했고, 시간이 갈수록 여론 조사 기관의 예측치에 수렴하는 추세를 보여주었다.

서지기타정보

서지기타정보
청구기호 {MGSM 11034
형태사항 iv, 42 p. : 삽화 ; 30 cm
언어 영어
일반주기 Including Appendix
저자명의 한글표기 : 한득천
지도교수의 영문표기 : Sung-Joo Park
지도교수의 한글표기 : 박성주
학위논문 학위논문(석사) - 한국과학기술원 : 경영공학과,
서지주기 References : p. 39-40
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서