Analysis of customer behavior patterns for enhancing the collaborative recommendations : Ordinal scale-based implicit ratings approach = 협업 추천의 성능 향상을 위한 고객 행위 패턴 분석 : 서열 척도 기반의 암묵적 평가법
서명 / 저자 Analysis of customer behavior patterns for enhancing the collaborative recommendations : Ordinal scale-based implicit ratings approach = 협업 추천의 성능 향상을 위한 고객 행위 패턴 분석 : 서열 척도 기반의 암묵적 평가법 / Seok-Kee Lee.
발행사항 [대전 : 한국과학기술원, 2009].
Online Access 원문보기 원문인쇄





학술문화관(문화관) 보존서고

DGSM 09021

휴대폰 전송








서울 학위논문 서가

DGSM 09021

휴대폰 전송







Recommender systems are personalized information filtering techniques to help customers find the product they would like to purchase. These systems are achieving a widespread success in online marketplace. Among them, collaborative recommendation has been known to be the most successful recommendation technology. Collaborative recommendation system basically requires a customer profile to preserve the ratings about the preference of customers. The tremendous growth of product and customers nowadays makes it difficult for the systems acquire the direct ratings of preference from customers. Instead, most systems commonly employ implicit ratings in which customers’ preference is gathered without customer’s intervention. However, applying implicit ratings to collaborative recommendation poses some research issues that must be addressed. The first issue is the rating scale problem. As an alternative for ratings scales, cardinal scale is the more accurate scale type due to its high sensitivity. It has been widely used with explicit ratings helping customers to represent their preference closely to the actual things. However, when used in implicit ratings, cardinal scale may increase the estimation error by increasing the variance of estimated values. Therefore, the use of ordinal scale should be considered as an alternative for ratings scale in implicit ratings. The second issue is preference compromise problem. In implicit ratings, customer’s preference is often collected by analyzing the behavior histories recorded on the Web log data. A well-known approach for implicit ratings, Web usage mining (WUM) discovers customer behavior patterns from the web log and as a result, a great amount of preference information is collected. As individual information collected is partial and sometimes conflictive each other, they should be aggregated to become a complete preference of customers over all the items. Further, the preference should be represented with ordinal scale. A mechanism that makes ordinal scale-based preference by aggregating the partial and conflictive preferences is required. In this dissertation, we propose new several collaborative recommendation methodologies to address these research issues ? rating scale, preference compromise. In our methodologies, Web Usage Mining (WUM) technique is applied as an implicit ratings approach, to analyze customers’ behavior patterns and to implicitly collect the preference information. Subsequently, in order to make ordinal scale-based customer preference, consensus method which is a well-known theory in multi-criterion decision making is applied. According to the consensus methods applied, the methodologies are mainly categorized into the two types: distance-based consensus driven collaborative recommendation methodology (DIST-CF) and ad-hoc consensus driven collaborative recommendation methodology (ADhoc-CF). Distance-based consensus method and WUM technique are applied to DIST-CF. On the other hand, ad-hoc consensus method and WUM technique are applied to ADhoc-CF. The two types of experiments having supplementing purposes are carried out to evaluate and compare the quality of the methodologies. One is a live user experiment including hundreds of mobile customers participating in real-time, and the other is offline analysis with the real shopping mall’s data sets. Experimental results indicate that our suggested collaborative recommendation methodologies are commonly superior, compared to existing collaborative recommendation methodologies. Especially, DIST-CF is the most superior in its quality of recommendation.

추천 시스템 (Recommender System)은 고객으로 하여금 자신이 구매하고자 하는 상품을 쉽게 발견할 수 있도록 도와주는 개인화된 정보 필터링 기술이다. 다양한 종류의 추천 시스템들이 인터넷, 혹은 모바일 웹 공간에서 성공적으로 활용되고 있으며, 그 중에서도 협업 추천 (collaborative recommendation)이 가장 성공적인 상품 추천 기술로 알려져 있다. 협업 추천 기술은 기본적으로 사전에 분석된 고객의 상품에 대한 선호 정보를 저장하기 위한 수단으로 ‘고객 프로파일 (Customer Profile)’이라는 것을 필요로 한다. 고객의 선호도 정보는 직접 혹은 간접적인 방식에 의해 수집되어 이 고객 프로파일에 저장이 되는데, 최근 웹 상에서 판매되는 상품의 개수와 고객의 수가 폭발적으로 증가함에 따라 고객으로부터 직접 이들 상품에 대한 선호도를 얻기는 매우 힘들어 지고 있다. 대신에, 최근의 추천 시스템 대부분들은 고객의 쇼핑 즐거움을 저하시키지 않으면서 간접적으로 고객의 선호도를 파악할 수 있는 암묵적 평가법 (implicit ratings)을 주로 사용하고 있는데, 암묵적 평가법을 협업 추천 방식에 적용하는 것은 몇 가지 문제점을 노출 시킬 수 있다. 첫 번째는 평가 척도의 문제이다. 일반적으로 선호도 정보를 표현하기 위해 널리 사용되는 평가 척도에는 카디널 척도와 서열 척도가 있다. 이 중에서 카디널 척도 (cardinal scale)는 서열척도 보다 높은 민감도 (high sensitivity)를 가지고 있어서 선호도 정보의 표현에 있어서도 보다 정확한 척도이다. 특히 사용자가 직접 자신의 선호도 정보를 표현하는 명시적 평가법 (explicit ratings)과 함께 사용될 경우, 사용자의 실제 선호도를 최대한 정확하게 표현할 수 있는 장점이 있다. 암묵적 평가법에 기반한 기존의 협업 추천 시스템의 대부분도 카디널 척도를 평가 척도로 사용하고 있다. 그러나 카디널 척도의 이러한 높은 민감도 특성은 암묵적 평가법과 함께 사용될 경우에는 오히려 단점으로 작용할 수 있다. 선호도 예측을 위해 필요한 정보가 충분하지 못한 일반적인 암묵적 평가법 환경 하에서, 평가 척도의 높은 민감도는 시스템에 의해 간접적으로 생성되는 추정 선호도 (estimated preference)의 분산을 증가시킴으로써 결국 실제 선호도와 추정 선호도 간의 차이를 나타내는 추정 오차 (estimation error)를 증가시켜 추천의 품질을 저하시키는 문제가 나타날 수 있다. 따라서, 암묵적 평가법을 활용하는 협업 추천 시스템에서는 보다 덜 민감한 척도인 서열 척도를 활용하는 것을 보다 나은 대안으로 고려해 볼 필요가 있다. 두 번째 문제는 부분적이고 혹은 상호 배치되는 다량의 선호도 정보를 단일화 된 통합 선호도로 표현하는 문제이다. 암묵적 평가법에서 고객의 선호도 정보는 대개 일정 기간 동안의 고객의 구매 정보 혹은 웹 상에서 보였던 행동 정보의 분석에 의해 수집 된다. 대표적인 기법이 웹 로그로부터 고객의 행동 패턴을 수집하고 이를 분석하여 다량의 선호도 정보를 생성해 내는 웹 마이닝 (Web Usage Mining, WUM) 기술이다. 웹 마이닝의 결과로 많은 양의 선호도 정보가 수집이 되는데, 수집된 개개의 선호도 정보들은 특정 시점에서 몇 몇의 상품에 대한 부분적 선호도 정보만을 담고 있거나 혹은 시간이 지남에 따라 변하는 고객의 선호 성향에 따라 같은 상품에 대해서도 서로 다른 선호도를 표현하며 충돌하는 경우가 있다. 이러한 선호도 정보들을 대표적으로 표현할 수 있는 하나의 선호도 정보로 통합하고 아울러 서열척도 기반으로 표현해 줄 수 있는 어떤 메커니즘이 암묵적 평가법 기반의 협업 추천을 위해 필요하다. 본 논문에서는 이러한 문제점들을 해결 하면서 추천의 품질을 향상 시킬 수 있는 새로운 형태의 암묵적 평가법에 기반한 협업 필터링 방법론들을 제안한다. 본 논문에서 제안된 협업 추천 방법론들이 가지고 있는 기술적 특성은 다음과 같다. 첫째, 웹 마이닝 (WUM) 기술을 적용하여 고객의 행위 패턴을 분석하고 선호도 정보를 수집한다. 아울러, 모바일 웹 데이터의 분석에 활용할 수 있는 새로운 형태의 모바일 웹 마이닝 (mobile Web usage mining, mWUM) 기술도 개발, 적용 예를 보여준다. 둘째, 서열 척도 기반의 고객 프로파일 생성을 위해서 MCDM 관련 연구분야에서 서열 기반 정보의 통합에 널리 활용되었던 컨센서스 방법 (consensus method)를 수정, 적용한다. 적용되는 컨센서스 방법에 따라서 개발된 방법론들은 크게 두 개의 범주로 나뉠 수 있는데, 거리 컨센서스 방법에 기반한 협업 추천 방법론 (distance-based consensus driven collaborative recommendation methodology, DIST-CF)와 임시 컨센서스 방법에 기반한 협업 추천 방법론 (ad-hoc consensus driven collaborative recommendation methodology, ADhoc-CF) 이다. DIST-CF에서는 거리 컨센서스 방법 (distance based consensus method)과 mWUM 기술이 활용되었고, Adhoc-CF에서는 임시 컨센서스 방법 (ad-hoc consensus method)과 WUM 기술이 활용 되었다. 본 논문에서는 상호 보완적 목적을 가진 두 가지 형태의 실험이 방법론들의 품질 평가와 비교에 활용 되었다. 첫 번째 실험은 수백 명의 모바일 웹 고객들이 실시간으로 참여하는 live user experiment 이며, 두 번째 실험은 실존하는 쇼핑몰의 웹 로그 데이터를 분석하는 offline analysis 이다. 첫 번째 실험은 고객의 행동 패턴 분석을 통한 간접적인 선호도 정보 획득뿐만 아니라, offline analysis에서는 얻기 힘든 고객의 실제 선호도를 고객으로부터 직접 획득할 수 있는 장점을 제공한다. 획득한 실제 선호도를 시스템이 생성한 추정 선호도와 비교하여 추정 오차의 정도를 산출할 수 있고, 아울러 추정 오차와 추천 품질간에 존재하는 관계를 실제로 검증할 수 있다. 두 번째 실험은 개발된 추천 방법론들의 전체적 품질 비교는 물론, 추천 시스템의 품질에 영향을 줄 수 있는 파라미터들 (parameters) ? 이웃 고객의 수, 추천 상품의 수, 고객 프로필의 희박성 수준 등 ? 을 임의로 조절하면서 이들 파라미터들의 영향력을 평가해 볼 수 있는 장점을 제공하고 있다. 두 실험의 결과는 본 논문에서 제안된 협업 추천 방법론들이 현존하는 추천 방법론에 비해서 상대적으로 우수한 추천 품질을 제공하며, 그 중에서도 거리 기반의 컨센서스 방법을 활용하는 DIST-CF 방법론의 추천 품질이 가장 우수함을 입증해 주고 있다.


청구기호 {DGSM 09021
형태사항 vii, 124 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 이석기
지도교수의 영문표기 : Soung-Hie Kim
지도교수의 한글표기 : 김성희
Appendix : Interface of DIST-CF. - 2, Detailed F1 statistics over neighborhood size. - 3, Sensitivity and estimation error of scale
학위논문 학위논문(박사) - 한국과학기술원 : 경영공학전공,
서지주기 References : p. 112-118





이 주제의 인기대출도서