In recent years, the number of virtual on-line communities has grown rapidly. These on-line systems have been developed to support such user activities like online shopping, e-learning, item tagging and site bookmarking and so on. Among them, Collaborative Tagging System (CTS), also known as social bookmarking system, is one of the most popular systems. The core of these systems is to provide a simple and easy interface to collaboratively annotate Internet objects ?? mostly URLs but not restricted to documents, Internet media, and so on ?? by tags or keywords. CTS allow much greater malleability and adaptability in organizing information than do formal classification systems. Groups of users do not have to agree on a hierarchy of tags or detailed taxonomy, they only need to agree, in a general sense, on the `meaning` of a tag enough to label similar material with terms for there to be cooperation and shared value.
In this paper, we analyze the user behavior pattern of CTS as well as their dynamical feature. We propose a methodology to build social network using the tripartite entity diagram and clustered the tags, URLs and Users. Finally, we suggest collaborative filtering (CF) which reflect tag and time information to grasp user’s current interest more accurately.
In the first part of research, we analyze the user behavior pattern of collaborative tagging systems and their dynamical aspects. Specifically, we found out the distribution of social bookmarking system, relation between bookmarks and tagging, regularities in user activity, bursts of popularity in bookmarking and a distinguishable stability in the relative proportions of tags. In particular, we examine whether the distribution of the frequency of use of tags can be described by a power law distribution, often characteristics of what are considered complex systems.
In the second part of this paper, we propose methodology building social network by using bookmarking log data. We have supposed that users bookmarking the common resource have similar interest so they have link between themselves. We analyze social network and investigate general measure (Centrality, Betweenness, Closeness) after the social network graph was built. Through hierarchical clustering, we will split dataset to communities and compare two methods (User-based and URL-based network) building social network by exploring information retrieval indices.
In the third part of paper, we conduct collaborative filtering using tag and time information to enhance recommendation quality. We build computational recommender system and reflect tag and time at weight generation and similarity calculation. Also we demonstrated our approach to real dataset and experimental results show that the proposed algorithm offers improved performance when such information is integrated.
최근 들어 가상의 온라인 커뮤니티가 급속하게 성장하였다. 이러한 온라인 시스템들은 쇼핑이나, e-러닝, 아이템 태깅 소셜 북마킹과 같은 기능들을 지원해준다. 그 중에서도 소셜 북마킹이라고도 알려진 협업적 태깅 시스템은 가장 유명한 시스템 중 하나로 여겨진다. 이 시스템의 핵심적인 기능은 사용자들이 문서나 인터넷 미디어등과 같은 아이템들을 협업적으로 관리하고 공유할 수 있도록 간단하고 용이한 인터페이스를 제공한다는 것이다. 협업적 태깅 시스템을 통해서는 전통적인 분류체계에서보다 정보 조직화에 있어 더욱 유연하고 융통적이다. 사용자들은 태그의 상하위 체계나 특정 분류 체계에 동의할 필요 없이 단지 태그의 일반적인 의미에만 합의를 이루면 되며, 이를 통해 유사한 자료를 협력을 통해 공유할 수 있다.
본 논문에서는 협업적 태깅 시스템의 동적인 특색과 구조를 분석하였다. 또한 태깅 시스템의 3 객체인 태그, URL, 사용자들의 소셜 네트워크를 형성하고 클러스터링을 수행하는 방법론을 제시하였다. 추가적으로 사용자들의 최근 관심사를 더욱 정확하게 포착하기 위해서 태그와 시간 정보를 반영한 협업적 필터링을 제안하였다.
연구의 첫 번째 부분에서는 협업적 태깅 시스템의 구조와 동적인 성격을 분석하였다. 구체적으로 소셜 북마킹 시스템의 분포를 밝혀냈고, 북마크와 태깅 빈도 간의 관계를 살펴보았으며, 사용자 행위 패턴의 정규성을 분석 하였다. 또한 시간에 따른 북마킹 인기도의 변화와 특정 URL에 부여되는 태그의 상대 비율이 수렴함을 밝혀냈다. 특히, 복잡계의 고유 특성이라고 볼 수 있는 멱법칙 함수가 태그의 사용 빈도 분포에서 관찰 됨을 확인 하였다.
두 번째 연구에서는 북마킹 로그 데이터를 토대로 소셜 네트워크 형성 방법론을 제안하였다. 공통의 리소스를 북마킹한 사용자들끼리는 유사한 관심사를 지닐 것이고, 결과적으로 그들간에는 링크가 있다는 논리를 제안하였다. 소셜 네트워크 그래프를 형성하고, 일반적인 지표 (연결 중심성, 매개 중심성, 근접 중심성)들을 측정하였다. 계층적 클러스터링을 통하여 대상 데이터를 분류하였으며 정보 추출 지표를 통하여 사용자 기반의 네트워크와 URL 기반의 네트워크 방법을 비교 분석하였다.
세 번째 연구에서는 추천 성능 향상을 위해 태그와 시간 정보를 반영한 협업적 필터링을 수행하였다. 추천 계산 모델을 제안하여, 태그와 시간을 가중치 산정과 유사도 측정에 적용하였다. 또한 제안한 방법을 검증하기 위해 실제 거래 데이터 정보에 적용하였고, 실험 결과 제안한 방법이 성능을 향상시킴을 확인 하였다.