서지주요정보
Detecting and reducing the spread of fake news using multimodal data = 멀티모달 데이터를 이용 한 가짜뉴스의 탐지와 확산 방지 기법
서명 / 저자 Detecting and reducing the spread of fake news using multimodal data = 멀티모달 데이터를 이용 한 가짜뉴스의 탐지와 확산 방지 기법 / Jooyeon Kim.
발행사항 [대전 : 한국과학기술원, 2020].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8036365

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 20027

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

An overwhelming number of true and fake news stories are posted and shared in social networks and users diffuse the stories based on multiple factors. In this thesis, I address the problem of detecting and reducing the spread of fake news or misinformation by leveraging the signals coming from different sources. The key idea is to adopt computational approach for modeling the social behavior, such as flagging or sharing, of users in the social network. First, I propose a method of detecting fake news using a particular diffusion property called homogeneity. Diffusion of news stories from one user to another depends not only on the stories' content and the genuineness but also on the alignment of the topical interests between the users. In this paper, we propose a novel Bayesian nonparametric model that incorporates such homogeneity of news stories as the key component that regulates the topical similarity between the posting and sharing users' topical interests. The model extends hierarchical Dirichlet process to model the topics of the news stories and incorporates Bayesian Gaussian process latent variable model to discover the homogeneity values. I train the model on a real-world social network dataset and find homogeneity values of news stories that strongly relate to their labels of genuineness and their contents. Through experimental demonstration I show that the supervised version of HBTP predicts the labels of news stories better than the state-of-the-art neural network and Bayesian models. Second, I propose an algorithm that, using the signals from the crowd, suggests certain news articles to be fact checked at an optimized time so that the number of people receiving misinformation is minimized. Given the uncertain number of exposures from news articles, the high cost of fact checking, and the trade-off between flags and exposures, such crowd-powered fact-checking procedure requires careful reasoning and smart algorithms. In this thesis, I first introduce a flexible representation of the fact-checking procedure using the framework of marked temporal point processes. Then, I develop a scalable online algorithm, CURB, to select which stories to send for fact checking and when to do so to efficiently reduce the spread of misinformation with provable guarantees. In doing so, a novel stochastic optimal control problem for stochastic differential equations with jumps needs to be solved. Throughout the experiment, I show that the suggested algorithm is able to effectively reduce the spread of fake news and misinformation. Finally, I present a method to combine the fact-checking algorithm (CURB) with the fake-news detection model (HBTP). By this combination, I propose an online fact-checking algorithm that returns the fact-checking time using the crowd's temporal signals as well as the news article's homogeneity index that is inferred from its users' alignment of topical interests. Therefore, this method, which we term CURB + h, leverages 1) users' temporal dynamics such as the time stamps of theirs exposures, shares, and flagging events, as well as 2) the textual information (i.e., the title and the content of the news articles) to come up with an optimal fact-checking time aimed to reduce the total number of users that gets exposed to misinformation because of the news article of interest. Using this method, the precision of correctly targeting the fake news increases by 65.4% and the total number of users that do not get exposed to misinformation in the presence of the fact-checking algorithm (i.e., misinformation reduction) increases by 69.2% when compared to the fact-checking algorithm CURB.

압도적으로 많은 수의 진실과 가짜 뉴스 기사가 소셜 네트워크에 게시되고 공유되며, 사용자는 여러 가지 요인에 따라 기사를 확산시킨다. 이 논문에서는 다른 소스에서 오는 신호를 활용하여 가짜 뉴스 또는 잘못된 정보의 확산을 감지하고 줄이는 문제를 해결한다. 핵심 아이디어는 소셜 네트워크에서 사용자의 신고 또는 공유와 같은 사회적 행동을 모델링하기 위해 전산 적 접근 방식을 채택하는 것이다. 먼저 균질성이라는 특정 확산 속성을 사용하여 가짜 뉴스를 탐지하는 방법을 제안한다. 한 사용자에서 다른 사용자로 뉴스 기사를 확산시키는 것은 스토리의 내용과 진실성뿐만 아니라 사용자 간의 주제 관심사의 정렬에 달려 있다. 본 논문에서는 게시와 공유 사용자의 주제 관심사 간의 주제 적 유사성을 규제하는 주요 구성 요소와 같은 뉴스 기사의 동질성을 통합 한 새로운 베이지안 비모수적 모델을 제안한다. 이 모델은 계층 적 Dirichlet 프로세스를 확장하여 뉴스 기사의 주제를 모델링하고 베이지안 가우시안 프로세스 잠재 변수 모델을 통합하여 동질성 값을 발견한다. 나는 실제 소셜 네트워크 데이터 세트에서 모델을 훈련시키고 진실과 내용의 레이블과 밀접하게 관련된 뉴스 기사의 동질성 값을 찾는다. 실험을 통해 지도 된 HBTP 버전이 최신 신경망 및 베이지안 모델보다 뉴스 기사의 레이블을 더 잘 예측 함을 보여준다. 둘째, 군중의 신호를 사용하여 잘못된 정보를받는 사람의 수가 최소화되도록 최적화 된 시간에 특정 뉴스 기사를 사실 확인하도록 제안하는 알고리즘을 제안한다. 뉴스 기사로부터의 노출 횟수가 불확실하고, 사실 확인 비용이 높으며, 플래그와 노출 사이의 절충을 고려할 때, 이러한 군중 기반 사실 확인 절차는 신중한 추론과 현명한 알고리즘을 필요로 한다. 이 논문에서는 먼저 표시된 시간적 프로세스의 프레임 워크를 사용하여 사실 확인 절차를 유연하게 표현한다. 그런 다음 확장 가능한 온라인 알고리즘 인 커브를 개발하여 사실 확인을 위해 전송할 스토리와시기를 선택하여 잘못된 정보의 확산을 효과적으로 보장한다. 그렇게함으로써, 점프를 갖는 확률 미분 방정식에 대한 새로운 확률 적 최적 제어 문제가 해결 될 필요가있다. 실험을 통해 제안 된 알고리즘이 가짜 뉴스 및 잘못된 정보의 확산을 효과적으로 줄일 수 있음을 보여준다. 마지막으로 CURB (팩트 체킹 알고리즘)와 HBTP (가짜뉴스 탐지모델)를 결합하는 방법을 제시합니다. 이 조합을 통해 군중의 시간적 신호와 사용자의 주제 관심사 정렬에서 유추 된 뉴스 기사의 동질성 지수를 사용하여 사실 확인 시간을 반환하는 온라인 사실 확인 알고리즘을 제안한다. 따라서 curb + h라고하는이 방법은 1) 노출, 타임 및 플래그 지정 이벤트의 타임 스탬프 및 텍스트 정보 (예 : 제목 및 내용)와 같은 사용자의 시간적 역학을 활용하고, 2) 관심있는 뉴스 기사로 인해 잘못된 정보에 노출되는 총 사용자 수를 줄이기위한 최적의 사실 확인 시간을 제시한다. 이 방법을 사용하면 가짜 뉴스를 정확하게 타겟팅하는 정확도가 65.4 % 증가하고 사실 확인 알고리즘 (예 : 잘못된 정보 감소)이있는 경우 잘못된 정보에 노출되지 않은 총 사용자 수가 69.2 % 증가한다.

서지기타정보

서지기타정보
청구기호 {DCS 20027
형태사항 v, 56 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김주연
지도교수의 영문표기 : Alice Haeyun Oh
지도교수의 한글표기 : 오혜연
수록잡지명 : "The Proficiency-Congruency Dilemma: Virtual Team Design and Performance in Multiplayer Online Games". CHI '16: Proceedings of the 2016 CHI Conference on Human Factors in Computing Systems, pp. 4351–4365(2016)
수록잡지명 : "Leveraging the Crowd to Detect and Reduce the Spread of Fake News and Misinformation". WSDM '18: Proceedings of the Eleventh ACM International Conference on Web Search and Data Mining, pp. 324–332(2018)
학위논문 학위논문(박사) - 한국과학기술원 : 전산학부,
서지주기 References : p. 47-54
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서