서지주요정보
(A) study on noisy sentence classification compensating performance deviations of relation extractor = 관계추출기의 성능 편차를 보완하는 강화학습 기반의 오류 문장 분류기법에 대한 연구
서명 / 저자 (A) study on noisy sentence classification compensating performance deviations of relation extractor = 관계추출기의 성능 편차를 보완하는 강화학습 기반의 오류 문장 분류기법에 대한 연구 / Sooji Yoon.
발행사항 [대전 : 한국과학기술원, 2019].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8035036

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 19067

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Relation extraction is a work that inferring semantic relations of two entities identified in natural language text. The extracted relation is saved in the knowledge base in triple form. The knowledge base is widely used in the field of Natural Language Processing, such as Question-and-Answering systems and Information Retrieval. Therefore, research to augment Knowledge Base through various methods of relation extraction is essential. Distant Supervision data, used to train machine learning based relation extraction models, can be obtained by annotating a predefined Knowledge Base to the target corpus. With this method, we can easily obtain data, but it has the disadvantage of having many errors. In this paper, we propose an improved method in the methodology of handling error data through existing reinforcement learning based relation extractor. The existing reinforcement learning based relation extraction could not overcome the limitations of the performance of the relation extractor itself since it reflected the reward for its agent dependent on relation extractor. In this study, we propose to supplement the limits of performance of the relation extractor by adding reward independent to relation extractor to the agent. In addition, because of the characteristic of a defined knowledge base, there are cases where multiple relations are classified in distant supervision data. In this case, the agent cannot get the optimal reward at a specific state. To improve this, this study presents a way to obtain the optimal reward for each state by separating the state by relation.

관계추출이란 텍스트상에서 밝혀진 두 개체의 의미적 관계를 유추하는 작업으로, 추출된 관계와 두 개체는 삼항관계를 이루어 지식베이스에 저장된다. 지식베이스는 자연언어 처리의 응용 분야인 질의응답 시스템, 정보 검색 등에 널리 쓰이므로 다양한 관계추출법을 통해 지식베이스를 증축시키는 연구는 필수적이다. 기계학습 기반의 관계추출기를 학습하기 위해 사용하는 원격지도 학습데이터는 미리 정의된 지식베이스를 대상 말뭉치에 주석함으로써 얻을 수 있는데, 이러한 방법은 데이터를 쉽게 얻을 수 있으나, 오류가 많다는 단점이 있다. 본 논문에서는 기존의 강화학습 기반의 관계추출기를 통해 이러한 오류 데이터를 처리하는 방법론에서 개선된 방안을 제안하고자 한다. 기존의 강화학습 기반의 관계추출기는 원격지도 학습데이터의 오류를 판별하는 에이전트에 관계추출기에 의존적인 보상을 반영함으로써 관계추출기 자체가 가지고 있는 성능의 한계를 벗어나기 어려웠다. 본 연구에서는 관계추출기에 독립적인 보상을 에이전트에 부가함으로써 관계추출기가 가지고 있는 성능의 한계를 보완하는 방법을 제안한다. 또한 정의된 지식베이스의 특성에 따라 원격지도 학습데이터에 중복으로 관계가 주석되는 경우로 인해 에이전트가 특정 상황에 대해 최적의 보상을 구하지 못하는 문제가 발생하는데, 이를 개선하기 위해 본 연구에서는 관계별로 상황을 분리해줌으로써 각 상황에 대해 최적의 보상을 구하는 방법을 제시한다.

서지기타정보

서지기타정보
청구기호 {MCS 19067
형태사항 iv, 39 p : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 윤수지
지도교수의 영문표기 : Key-Sun Choi
지도교수의 한글표기 : 최기선
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 전산학부,
서지주기 References : p. 36-37
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서