서지주요정보
Toward advice mining: advanced conditional random fields for extracting advice-revealing text units = 조언 관련 텍스트 추출을 위한 진전된 조건부 랜덤 필드 방법
서명 / 저자 Toward advice mining: advanced conditional random fields for extracting advice-revealing text units = 조언 관련 텍스트 추출을 위한 진전된 조건부 랜덤 필드 방법 / Alfan Farizki Wicaksono.
저자명 Wicaksono, Alfan Farizki ; Wicaksono, Alfan Farizki
발행사항 [대전 : 한국과학기술원, 2013].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8025714

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 13062

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Web forums often contain explicit key learnings gleaned from people`s experiences since they are platforms for personal communications on sharing information with others. One of the key learnings contained in Web forums is often expressed in the form of advice. In this paper, we address the problem of advice-revealing text unit (ATU) extraction from online forums due to its usefulness in travel domain. We represent an advice as a two-tuple comprising an advice-revealing sentence and its context sentences. To extract the advice-revealing sentences, we propose to define the problem as a sequence labeling problem, using three different types of features: syntactic, contextual, and semantic features. We also improve the performance using Skip-Chain CRF in which our sentence generalization method is employed to construct the skip-edges. To extract the context sentences, we propose to use 2D-CRF model, which gives the best performance compared to traditional machine learning models. Finally, we present an integrated solution to extract advice-revealing sentences and their respective context sentences at the same time using our proposed models, i.e., Multiple Linear CRF (ML-CRF) and 2 Dimensional CRF Plus (2D-CRF+). The experiment results show that ML-CRF performs better than any other models for extracting advice-revealing sentences and context sentences.

웹 포럼들은 다른 이들과 정보를 공유하는 개인적인 매체로써 종종 사람들의 경험으로부터 모아진 주요 명시적 깨달음들을 포함한다. 웹 포럼에 포함된 주요 깨달음들은 조언의 형태로 표현되고는 한다. 본 논문에서는 여행 도메인에서 조언의 유용함을 바탕으로 온라인 포럼들로부터 조언 텍스트를 추출하는 문제에 대해 다룬다. 우리는 하나의 조언을 조언이 드러난 문장(Advice Revealing Sentence)과 그것의 컨텍스트 문장들로 구성된 2개조로 표현한다. 조언이 드러난 문장(Advice Revealing Sentence)들을 추출하는 것을 구문적, 맥락적, 의미적 세 특질들을 사용한 sequence labeling 문제로 정의하고, 이를 위하여 문장 상의 skip-edge들을 구성하기 위하여 사용된 Skip-Chain CRF를 사용한다. 컨텍스트 문장들을 추출하기 위하여 전형적인 기계학습 모델들에 비하여 가장 좋은 성능을 보인 2D-CRF 모델을 사용한다. 최종적으로 우리는 제안된 모델들인 Multiple Linear CRF (ML-CRF)와 2 Dimensional CRF Plus (2D-CRF+)을 사용하여 조언이 드러난 문장(Advice Revealing Sentence)들과 그것들의 컨텍스트 문장들을 동시에 추출하는 통합된 문제에 대한 해법을 제시한다. 우리는 ML-CRF가 조언이 드러난 문장(Advice Revealing Sentence)들과 컨텍스트 문장들을 추출함에 있어서 다른 모델들 보다 성능이 좋았음을 실험결과들을 통하여 알 수 있었다.

서지기타정보

서지기타정보
청구기호 {MCS 13062
형태사항 v, 40 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : Alfan Farizki Wicaksono
지도교수의 영문표기 : Sung-Hyon Myaeng
지도교수의 한글표기 : 맹성현
학위논문 학위논문(석사) - 한국과학기술원 : 전산학과,
서지주기 References : p. 36-38
주제 advice mining
conditional random field
text mining
조언 관련 텍스트 추출
조건부 랜덤 필드
텍스트 추출
QR CODE qr code