서지주요정보
An approach to improving the performance of memory-based collaborative filtering = 접근도가 높은 아이템을 선택적으로 고려한 메모리 기반 협업 필터링의 성능 향상 방법
서명 / 저자 An approach to improving the performance of memory-based collaborative filtering = 접근도가 높은 아이템을 선택적으로 고려한 메모리 기반 협업 필터링의 성능 향상 방법 / Eun-Ae Kim.
발행사항 [대전 : 한국과학기술원, 2014].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8027135

소장위치/청구기호

학술문화관(문화관) 보존서고

MWST 14008

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Memory-based approaches for collaborative filtering predict users` preferences on items. Its prediction is based on average ratings given by other users who have similar rating patterns. The prediction accuracy of memory-based approaches is usually better in case of having sparse datasets. It is because the memory-based approaches can capture local associations in the datasets. However, the memory-based approaches have scalability problems in processing large-scale datasets because they use full datasets for every time when they make rating predictions. Especially, the similarity measurement between users consume most of the time during the recommendation process. The computation time of the memory-based approaches increase exponentially when the number of users is increased. In this work, we propose a filtering method to reduce the time for similarity measurement by considering only the users who showed their preferences on popular items. Furthermore, we consider users` preferences on the types of items (e.g. genres for movie items) rather than individual items to reduce the number of users to compare in the similarity measurement. By considering both popular items and type information, we could decrease the running time of the recommendation process by 70% in average while maintaining the accuracy of recommendation. Our approach outperforms existing memory-based approaches that use clustering methods. The evaluation was conducted with a real-world dataset from MovieLens.

메모리기반 협업필터링은 사용자 또는 아이템의 유사성을 바탕으로 사용자가 좋아할만한 아이템을 추천해주는 방법이다. 메모리 기반 방법은 간단한 추천 알고리즘과 높은 정확도의 추천으로 실시간 추천에 많이 사용되고 있다. 하지만 추천을 수행할 때마다 모든 데이터베이스를 계산에 사용하여야 하기 때문에 데이터의 크기가 매우 큰 경우에는 많은 시간과 공간이 요구된다. 특히 사용자 또는 아이템의 수가 많아지게 되면 유사성을 비교하는 과정에서 복잡도가 높아지게 된다. 이러한 문제를 해결하기 위해 관련 연구들은 사용자를 사전에 클러스터 하는 방법을 사용하였다. 하지만 클러스터링 방법 또한 사용자 또는 아이템의 수가 많아지면 많은 시간이 필요하게 된다. 관련 연구들에서는 클러스터링을 데이터 전처리 과정으로 두어 추천이 수행되는 시간을 줄였다. 하지만 소셜 커머스나 시청 컨텐츠의 추천 시스템 같이 사용자 또는 아이템의 정보가 빠르게 변하는 경우에는 클러스터링한 결과를 갱신하여야 할 필요성이 있다. 본 연구에서는 전처리 과정 없이 메모리기반 추천 방법에서 가장 많은 시간이 요구되는 유사성 비교 단계의 불필요한 단계를 생략함으로 추천의 정확도를 유지하면서 속도를 향상시키는 방법에 대해 제시한다. 제안하는 방법은, 유사성 비교 단계에서 대상 사용자와 유사할 확률이 없는 사용자를 비교 단계에서 제외 시킴으로 유사성을 계산하는 시간을 줄일 수 있다. 이를 사용자의 접근도가 높은 아이템들을 유명아이템으로 선정하여 이에 대한 사용자의 선호도 경향이 전혀 다른 경우는 유사할 확률이 적다고 가정하였다. 또한 아이템의 의미적 정보를 바탕으로 아이템을 분류하여 이에 대한 사용자의 선호도도 비교하여 선호 경향성이 다른 경우 유사성 비교 단계에서 제외하도록 하였다. 본 연구에서는 영화 추천시스템인 MovieLens를 대상으로 아이템의 의미적 정보는 장르를 사용하였다. 이러한 두 가지의 경우에 대한 사용자의 선호도를 비교함으로 유사성 계산 과정의 시간을 정확도를 유지하며 70% 이상 줄일 수 있었다.

서지기타정보

서지기타정보
청구기호 {MWST 14008
형태사항 iv, 42 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김은애
지도교수의 영문표기 : In-Young Ko
지도교수의 한글표기 : 고인영
학위논문 학위논문(석사) - 한국과학기술원 : 웹사이언스공학전공,
서지주기 References : p. 34-37
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서