서지주요정보
Analyzing controversial articles in wikipedia in terms of native languages of editors = 위키피디아에서 논란이 있는 문서들의 편집자들의 모국어에 대한 분석
서명 / 저자 Analyzing controversial articles in wikipedia in terms of native languages of editors = 위키피디아에서 논란이 있는 문서들의 편집자들의 모국어에 대한 분석 / Jeong Min Byun.
발행사항 [대전 : 한국과학기술원, 2015].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8028293

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 15073

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Since Wikipedia has successfully motivated users around the world to collectively write over 3.5 million articles, collaborative authoring platforms became popular as a research topic recently. English Wikipedia, the biggest language edition in Wikipedia, has the richest articles among all editions and the contents of it are often being translated into other language editions. Therefore editors with various native languages edit articles in English Wikipedia to be in their perspective, which makes English a lingua franca in Wikipedia. However, because of the different backgrounds of editors, there are controversies observed in the collaboratively writing process of many articles. In this thesis, I develop a classifier for predicting native language of Wikipedia editors. I propose a set of measures for quantitatively represent controversies and behavioral patterns between conflictual editors on Wikipedia articles. I run Latent Dirichlet Allocation (LDA) on controversial Wikipedia articles for topic analysis, and calculate the proposed measure for all articles and average them for the topics. Finally, I qualitatively analyze on the resulting groups of articles. With this procedure, I show the noticeable difference between characteristics of articles belong to different topics, and compare the behavioral pattern of editors with different native languages in articles on various topics.

위키피디아는 온라인 상에서의 사용자 협력을 통해 내용을 채워나갈 수 있는 플랫폼 형태의 백과사전으로, 3백 50만 개 이상의 문서를 사용자들의 협력을 통해 작성하여 서비스하고 있다. 위키피디아에서 가장 많은 문서를 가지고 있고, 동시에 각 문서의 내용이 가장 풍부한 것은 영어 버전의 위키피디아로, 많은 경우 영어 위키피디아의 내용이 다른 언어 버전의 위키피디아로 사용자들에 의해 번역되어 서비스된다. 따라서 영어는 위키피디아 상에서 일종의 국제 공용어로 사용되며, 다양한 나라의 사용자들이 영어 위키피디아의 문서들을 수정한다. 이때, 사용자들의 모국어와 관계된 이해 관계의 충돌로 인해, 문서의 공동 작성 과정에서 많은 논쟁과 충돌이 발생하게 된다. 본 연구에서는, 위키피디아 사용자들의 모국어 예측을 위한 코드를 작성하고, 공동 작성 과정에서의 논쟁 및 충돌과 사용자들의 행동 패턴을 수치화할 수 있는 다양한 척도를 제안하며, LDA를 이용한 토픽 추론을 통해 위키피디아 상의 논란이 있는 문서 카테고리에 등록된 문서들과 이들의 토픽에 대해 공동 작성 과정을 수치화하여 나타낸다. 이들에 대해 정성적 분석을 실시하고, 그 결과로 각 토픽에 속한 문서들의 속성들간의 차이를 보인 뒤, 다양한 토픽의 문서들에서 다양한 모국어를 가지는 사용자들이 보이는 행동 패턴의 차이를 비교한다.

서지기타정보

서지기타정보
청구기호 {MCS 15073
형태사항 iv, 24 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 변정민
지도교수의 영문표기 : Hae Yun Oh
지도교수의 한글표기 : 오혜연
Including Appendix
학위논문 학위논문(석사) - 한국과학기술원 : 전산학부,
서지주기 References : p.
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서