A recommendation system is an application to recommend items or information which interest to a user by analyzing the user`s preference. Many researchers have developed various recommendation techniques to provide high quality recommendation to users. Collaborative filtering which recommends items to a user based on interest of other users having similar preferences is known to be the most popular approach in the recommendation system. However, sparse and high dimensional input data for collaborative filtering cause poor recommendation performance. I thus utilize external meta information to make a dense form of input data for collaborative filtering. In this paper, I propose a novel Multiple Metadata based Collaborative Filtering (MMCF) and use such multiple metadata as genre, director, and actor. In detail, MMCF builds a movie k-partite graph of users, movies and multiple metadata, and extract their implicit relationships between metadata and between users and metadata. Then it propagates the implicit relationships between metadata into the implicit relationships between users and metadata by applying random walk process in order to alleviate sparsity of the original data. Finally, I empirically evaluate the accuracy of my MMCF on the real Netflix movie dataset, and achieve 10.5% RMSE improvement over previous collaborative filtering methods.
추천 시스템은 사용자들의 과거 기록으로부터 선호도를 파악하여 그들의 관심을 가질 수 있는 아이템들을 제공해주는 시스템을 말한다. 사용자들의 선호도를 파악하는 기술은 콘텐트 기반 방식과 협업적 필터링 기반 방식이 있다. 내용 기반 방식은 사용자가 과거에 사용한 아이템들의 속성을 기반으로 비슷한 속성의 아이템들을 찾고 추천해주는 방식이다. 반면, 협업적 필터링 방식은 사용자가 과거에 사용한 아이템에 기반하여 유사한 패턴의 아이템들을 사용하는 사용자들을 찾고, 그 유사한 사용자들이 사용한 아이템으로부터 새로운 아이템을 추천해주는 방식이다. 내용 기반 방식과 달리, 협업적 필터링 방식은 과거에 사용자가 사용하지 않은 아이템들을 추천할 수 있기 때문에 현재 많은 연구가 진행 중이다. 하지만, 사용자의 과거 선호도 데이터의 희박성으로 자신과 비슷한 사용자들을 찾는 데 어려움이 있다. 이러한 문제점을 해결하기 위하여 본 연구에서는 장르, 감독, 배우와 같은 영화의 다중 메타데이터와 이들의 내재적 관계 정보를 사용하여 유사한 사용자들을 찾는 다중 메타데이터 기반 협업적 필터링 방법을 제안하였다. 구체적으로 사용자의 영화 선택 정보와 영화의 다중 메타데이터 관계 정보를 k-분할 그래프로 표현하며, 그래프로부터 사용자와 영화의 메타데이터, 그리고 다중 메타데이터 간의 내재적 관계 정보를 추출하게 된다. 그리고 추출한 내재적 관계 정보에 랜덤 워크 기법을 적용하여 사용자가 선호하는 숨겨진 메타 정보 값을 부각시켰다. 이와 같이 메타데이터의 내재적 관계 의미를 기반으로 영화 선호도가 비슷한 사용자들로부터 영화 평점을 예측한 결과가 기존의 추천 방식들로 영화 평점을 예측한 결과보다 정확도가 높음을 Netflix영화 데이터를 이용하여 실증적으로 증명하였다.