Product reviews are an important factor when considering a purchasing decision. Thus, people carefully read and analyze them. However, if the amount of reviews grows too large, customers have to spend a long time in selecting the goods they wish to buy. To solve this problem, in this paper we propose a recommender system with sentiment classification for product reviews. Using sentiment classification and a number of product reviews, we implement a recommender system that considers the two most widely used recommendation methods, collaborative and content-based filtering, by quantizing the sentiments included in the reviews. Also, to improve the performance of the proposed system, we analyze the product reviews to extract sentiment-related terms a semantic orientation, and suggest a heuristic weighting scheme. In our first experiment, we verify the weighting scheme and the extracted terms. As a result, the proposed sentiment classification system shows about 90% accuracy. A second experiment is for verifying the recommender system. The recommender system ranks products using the scores obtained from the weighting scheme and the number of reviews. In the experiment, the proposed system shows better results than recommendations based on consumer ratings.
온라인 쇼핑몰의 시장 규모가 커지고 거래 물품의 숫자가 기하 급수적으로 증가함에 따라 구매 의사 결정 과정에서 정보 과다 현상이 발생하게 되었다. 상품평은 구매 결정을 하는데 큰 영향을 주는 요인의 하나로 역시나 그 수가 많아지면서 온라인 구매에서의 정보 과다 현상에 한 역할을 하고 있다. 많은 구매자들이 상품평을 읽고 분석하는데 많은 시간을 들이고 있고, 판매자 또한 효과적으로 상품평을 관리하기 위해 노력하고 있다.
상품평은 특히 그 정보가 내재되어 있어, 쉽게 판단이 안 되고 정성적인 정보로 수치화 시킬 수 없어서 시스템에 적용이 어렵다. 그 대신 현재의 시스템은 사용자에게 상품평과 함께 점수를 매기도록 함으로써 그 값으로 대신하고 있다. 하지만 몇몇 상품평들의 경우 그 점수와 내용이 상이하여 혼돈을 오히려 혼돈을 야기시킨다.
본 논문에서는 정성적인 상품평의 감성 정보를 분류하여 정량화 시킨 값을 통해 추천해주는 시스템을 제안함으로써 이러한 문제를 해결해 보고자 한다.
우선 감성 분류 시스템의 구현을 위해서 본 논문에서는 상품평 분석을 통해 감성 어휘를 추출하고, 휴리스틱한 가중치를 적용하는 방법을 제안하였다. 감성 어휘의 추출을 위해서 상품평을 문장 단위로 나누고 주석 처리 하는 과정을 가졌으며 이러한 전처리 과정 후에 기계적으로 추출하였다. 추출 과정에서 잘 추출되지 않고 오류가 생기는 어휘에 대해서는 후처리 과정을 수행하여 문제를 해결하였다. 이를 통해 총 130개의 긍정 어휘와 224개의 부정어휘를 얻을 수 있었다. 휴리스틱 가중치 적용 방법은 감성 분류에 영향을 주는 세 가지의 factor를 정의하고, 이에 대한 함수를 만들어 적용시켰다. 제시한 함수의 검증을 위해 실험을 진행하였고, 이 과정에서 최대 87% 의 정확도를 보였다.
또한 상품 추천 시스템의 정확도를 검증하기 위한 실험을 수행하는데, 이때 상품평 분석의 경우 정확도는 약 93% 정도였으며, 추천 결과는 기존의 쇼핑몰에서 제공되는 상품 평가 점수와 비교하여 더 나은 결과를 보였다.