As the number of social network services (SNSs) and their users grow, so does the complexity of individual networks as well as the amount of information to be consumed by the users. Unlike ordinary bloggers who tend to focus on posting rather long, unidirectional content, on the other hand, the SNS users exchange shorter and more instantaneous messages and contents more inter-actively to form conversations. In order to alleviate the information overload problem and help SNS users manage their social networks, we show that more refined networks of several kinds can be identified over the explicit, connectivity-based social network by analyzing the conversational content based on the topical diversity and topical purity of the conversations, which was revealed by an LDA-based algorithm applied to about 1.5 million conversations including about 5 million tweets posted by more than 2,000 Twitter users and about 0.3 million their conversational partners. The resulting “semantic” social networks help identifying more meaningful social relationships among the users interconnected by a “syntactic” social network and determining new properties such as different types of relationships based on topic diversity and topic purity or different types of users based on types of relationships they have. We expect that the proposed method can lead to more meaningful SNS analyses and hence to more practical values to SNS in general.
소셜 네트워킹 서비스 (SNS) 사이트가 증가하고, SNS를 이용하는 사용자의 수가 증가함에 따라 한 개인이 관리하는 소셜 네트워크가 복잡해지고 사용자가 소비하는 정보의 양도 많아지고 있다. 또한, 주로 길고 단방향의 내용을 게시하는 경향이 있는 일반적인 블로거 와는 달리, SNS의 사용자는 상대적으로 더 짧고, 즉각적인 메시지와 컨텐츠를 상호 적극적으로 교환한다. 정보 과부하 문제를 완화 하고, SNS 사용자의 소셜 네트워크를 관리할 수 있도록 하기 위해, 본 논문에서는 명시적이고 연결 기반의 소셜 네트워크 이상의 더 정제된 네트워크를 보인다. 이 정제된 네트워크는 SNS 안에서 사용자들이 서로 관계를 맺음에 있어서 상호 교환한 컨텐츠 주제의 다양성과 순도를 기반으로 분석함으로써 찾아진다. 이러한 네트워크를 시맨틱 소셜 네트워크라 정의하고, 본 논문에서는 Latent Dirichlet Allocation (LDA) 모델을 기반으로 하는 주제의 다양성과 순도를 측정할 수 있는 방법을 제안하고, 2000명 이상의 사용자, 500만개의 트윗으로 구성된 150만개의 대화를 통해 대화 주제의 다양성과 순도를 기반으로 하는 시맨틱 소셜 네트워크를 식별하였다. 식별된 시맨틱 소셜 네트워크의 새로운 특성을 갖는 관계와 사용자를 특징지음으로써 정보 과부화 문제를 해결 할 수 있고, 정보 공유 시스템의 과대 특수화 (overspecialization) 문제를 해결할 수 있는 가능성을 제시한다.