서지주요정보
Experiential knowledge mining from text = 텍스트로부터의 경험지식 마이닝
서명 / 저자 Experiential knowledge mining from text = 텍스트로부터의 경험지식 마이닝 / Yoonjae Jeong.
발행사항 [대전 : 한국과학기술원, 2015].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8028540

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 15024

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Recent advances in Internet and Web technologies have made it possible to share the information and knowledge for human activities and experiences. Capturing human experiences in the form of experiential knowledge in a variety of situations would help not only interpret user behaviors and intentions but also provide context-dependent solutions based on the collected past experiences. A key question is how to turn the vast amount of experience-related information embedded in text into a form that can be readily available with sufficiently detailed granularity. In this dissertation, we posit that experiential knowledge is obtained by aggregating individual experience instances. The knowledge is distilled by abstracting, generalizing, and grounding individual instances and aggregating them with tendency calculation. This research addresses the challenging issues for experiential knowledge mining and proposes a method to construct experiential knowledge base from a collection of natural language documents. In particular, we focus on two critical issues: identifying key constituents of an experience instance (i.e., event and contexts) and producing generalized knowledge from a set of related experience instances that have been conceptualized with ontology or concept taxonomy. In extracting events and the associated contexts, we note the importance of syntactic dependency and deep-level semantics. Based on this observation, we propose a method of using combined features based on dependencies that exist between an event and its syntactically related words. They also use deep-level lexical semantics. However, the approach utilizing deep-level lexical semantics and syntactic dependencies suffers from a limitation of requiring too large feature space. To resolve this problem, we propose a novel feature selection method using a semantic hierarchy of features. The final goal of this study is to aggregate individual experience instances sharing one or more constituents of experience tuples and attach a tendency value. Observing that simple co-occurrence statistics may not be appropriate in computing a tendency of a piece of knowledge, we propose novel measures for computing different aspects of tendency and their combinations for tendency calculation. We devised a tendency ranking model that adjust the weights of the measures depending on the shape of the concept taxonomy. The experimental results show the proposed model improves performance for retrieving the representative tendency for the given contexts or experiencers. Comparing to a baseline, the proposed model increases performance by about 3%, 23% and 29% for location, time and participant contexts, respectively. We also reach a conclusion through our analysis. Regardless of the structure of a taxonomy, the proposed model has enhanced or at least similar performance compared to the baseline.

최근 인터넷과 웹 기술의 발달은 인간 행위와 경험에 대한 정보와 지식을 공유하는 것을 가능하게 하였다. 인간의 경험을 경험 지식의 형태로 담아내는 것은 사용자의 행동과 의도를 해석할 이해할 뿐만 아니라 수집된 과거의 경험을 기반으로 맥락에 따른 해결방법을 제공할 수 있게 한다. 이 논문의 핵심 질문은 텍스트에 나타난 대량의 경험관련 정보를 쉽게 사용할 수 있도록 충분히 자세한 수준의 형태로 변화시키는 방법에 관련된다. 이 논문에서 우리는 경험 지식이 개개의 경험 실례를 수집하여 얻게 되는 것으로 가정한다. 경험 지식은 수집된 경험 실례는 추상화와 일반화 과정을 통해 정제된다. 이 연구는 경험 지식 마이닝의 연구 쟁점에 대해 이야기하며 자연언어 문서의 집합으로부터 경험 지식 베이스를 구축하는 방법을 제안한다. 특히 두 핵심 쟁점인 경험 실례의 구성요소의 인식과 온톨로지 또는 개념 텍소노미를 사용하여 추상화된 경험 데이터로부터 일반화된 지식을 생성을 다룬다. 이벤트의 인식과 분류에서 우리는 구문 의존성과 깊은 수준의 의미의 중요성에 주목한다. 그리고 이벤트와 구문적으로 관계된 단어 사이에 존재하는 의존성에 기반을 둔 결합 자질을 제안하였다. 그 자질은 또한 깊은 수준의 어휘 의미를 사용한다. 그러나 깊은 수준의 어휘 의미의 활용과 구문 의존성을 활용하는 접근 방법은 너무 큰 자질 공간을 요구하는 한계를 가지고 있다. 이 문제를 해결하기 위해 우리는 자질의 의미 위계를 활용하는 새로운 자질 선택 방법론을 고안하였다. 이 연구의 최종 목표는 하나 이상의 경험 튜플 구성 성분을 공유하는 개개의 경험 실례를 모아 경향성 값을 할당하는 것이다. 단순한 동시-발생 통계가 경험 경향을 계산하는데 부적절함을 보였고, 서로 다른 경향의 측면을 계산하는 척도와 이를 결합하는 방법론을 제안하였다. 우리는 개념 텍소노미의 모양에 따라 척도의 결합 가중치를 조절하는 경향 랭킹 모델을 고안하였다. 실험 결과는 제안한 모델이 주어진 맥락과 경험자에 대해 대표적인 경향을 검색하는데 있어, 향상된 성능을 가짐을 보여준다. 베이스라인과 비교하였을 때, 장소, 시간, 참여자 맥락에 대해 각각 3%, 23%, 29%의 성능 향상이 있었다. 또한 분석을 통해, 텍소노미의 구조에 상관없이 제안하는 모델이 베이스라인보다 향상되거나 적어도 유사한 결과를 보여준다는 결론에 도달하였다.

서지기타정보

서지기타정보
청구기호 {DCS 15024
형태사항 vii, 88 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 정윤재
지도교수의 영문표기 : Sung Hyon Myaeng
지도교수의 한글표기 : 맹성현
Including Appendix
학위논문 학위논문(박사) - 한국과학기술원 : 전산학부,
서지주기 References : p.
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서