Intent classification refers to the process of identifying a set of intents of interest that appear in a given document.
This thesis considers the task of annotating travel-related reviews with the travel intents that best represent the reviewer's reason for visiting the place of interest (POI).
Fundamentally, this study falls within the field of text mining in that it extracts useful information from the textual data.
However, unlike many other related text mining tasks, studies on intent classification have just begun and have yet to gain much prominence.
Therefore this work investigates the feasibility of the task using various classifiers including recurrent neural networks with a domain-tailored word embedding model.
The utility of the learned model is tested on a location recommendation task.
In addition, by applying the model to a large unlabeled dataset, the paper presents some interesting findings regarding travel and tourism in the USA.
의도 분류(intent classification)란 주어진 문서 내에 등장하는 특정 의도들을 인지하는 과정을 말한다.
본 논문은 어느 장소를 방문하고 이에 대한 리뷰를 남긴 작성자가 어떤 주된 목적(여행 의도, travel intent)으로 그 장소를 방문하였는지 분류하는 방법을 다룬다.
본 연구는 주어진 문서로부터 의미있는 정보를 추출하는 텍스트 마이닝(text mining) 분야의 연구들과 맥락을 같이 하지만, 아직 리뷰 문서로부터 여행 목적을 분류하는 연구는 활발히 이루어지지 않고 있다.
따라서 본 논문에서는 순환 신경망(recurrent neural network)과 여행 및 관광 분야에 특화된 워드 임베딩(word embedding) 모델을 활용하여 문서 내 여행 목적 분류에 대한 가능성을 살펴본다.
또한 장소 추천 시스템(location recommender system)에 학습된 모델을 적용하여 그 유용성을 검증하고, 많은 양의 관광지 리뷰 데이터들을 분류하여 미국 내 여행 및 관광 트렌드를 수치적으로 분석한다.