Understanding interest divergence over the regions allows a novel analysis of SNS data such as global consensus and grouping regions.
In dissertation, we propose the notion of topic versatility that refers to the degree to a topic's coverage for different points of view or sub-topics over the regions in social media.
Since versatility of a topic captures its characteristics across different regions, identifying versatile topics can help understand regional interests. In addition, it becomes possible to identify regions with minority sub-topics, which can be easily obscured.
Then, we propose the set of methods to analyze the dynamics of interests among different regions for the specific topic. In particular, we generate a topic-based inter-region networks and cluster regions based on sub-topic interests. We apply Markov Chain Clustering (MCL) to group regions for their commonality in sub-topic interest. The clustering results are further used to reveal the level of consensus and dissensus among the regions. For illustration, we show analyses of four topics, two for the cases where versatility value drops and the other for increases.
Finally, we use the inter-region network to conduct information propagation analysis and event mention prediction. We propose the edge weighting schemes for accurate propagation modeling, and show that the graph with the varying weighted sum of follower network and topical similarity-based network for edge weighting gives the best performances. For the second task, we propose a method for predicting major event mentions in Tweets based on the multivariate regression method utilizing the regional event occurrence status. In particular, we apply region clusters that noisy relationships among the regions can be removed. Compared to the state-of-art method for predicting events, we show the proposed method of using the topical similarity-based network of regions gives a better performance.
이 논문에서는 소셜 네트워크 서비스 상에서 나타는 데이터의 시공간적 분석을 위한 주제 기반의 지역 네트워크를 구축하고, 유사한 관심사를 갖는 장소 집합을 찾아 주었다. 구체적으로, 각각의 주제에 대한 장소 별 관점들을 추출하고 장소 간 다양한 관점을 갖는 정도를 측정할 수 있는 토픽 다양성이라는 개념을 제안하였다. 또한, 해당 관점간의 유사성을 기반으로 네트워크 상에서 각 지역 간 관계를 정의하였다. 이후 지역 간 네트워크에 마코브 체인 클러스터링 방법을 적용하여 유사 지역 간 그룹을 찾아 주었다. 제안하는 지역 네트워크와 장소 그룹을 통해서, 기존에는 볼 수 없었던 주제 별 시간의 흐름에 따른 전역적인 합의에 대한 분석을 가능하게 하였다. 또한, 기존의 소셜 네트워크와 장소 네트워크를 함께 고려함으로써 정보 전파 모델의 정확성을 높여 줄 수 있었고, 이 때, 정확석을 높이기 위해 소셜 네트워크와 장소 네트워크를 동시에 고려하기 위해 최적의 가중치 적용 방법을 찾았다. 이벤트 예측에 있어서는 지역 그룹을 통해 관계없는 지역 제거해 줌으로써 예측 성능을 높일 수 있었고, 최신 연구 내용과 비교해서도 좀 더 좋은 성능을 내는 것을 볼 수 있었다.