Relation extraction task is a task to extract relation between entities from unstructured text. Due to the lack of labeled data, the majority of relation extraction studies are based on the Distant Supervision. However, it requires predefined relation types and relation instances from Knowledge Base, which causes problems in the scalability of the relation extraction. In order to solve this problem, we propose a PCNN based open relation extraction model trained through Question Answering data set and Open Information extraction with triplet loss. To this end, we hypothesize that queries and corresponding answer sentences share similar relations. Under this hypothesis, the proposed model learns the ability to extract arbitrary relations from (question,answer sentence) pairs of QA dataset. In the experiments, we showed that our hypothesis is valid, and that the proposed model has the ability to extract arbitrary relations without Distant Supervision dataset.
관계 추출은 비정형 혹은 정형 텍스트로부터 개념 간의 관계를 추출하는 것을 말한다. 레이블 데이터의 부족으로 인해, 대다수의 관계 추출 연구는 원거리 감독 기법에 기반하고 있다. 그러나 원거리 감독 기법에 기반한 관계 추출은 미리 정의된 지식 베이스의 관계 인스턴스를 필요로 하며, 이는 관계 추출 연구의 확장 성에 문제를 야기한다. 이러한 문제를 해결하기 위해, 본 논문에서는 질의응답 데이터셋과 개방형 정보 추출 시스템, triplet 손실 함수를 통해 학습된 PCNN 기반 개방형 관계 추출 모델을 제안한다. 이를 위해 우리는 질의와 그 정답을 포함하는 정답 문장은 비슷한 관계를 공유한다는 가정을 제시한다. 이 가정 아래, 제안 모델은 질의응답 데이터셋의 질의-정답 문장쌍으로부터 임의의 관계를 추출하는 능력을 학습한다. 실험을 통해, 우리는 우리의 가정이 유효하며 제안 모델은 원거리 감독 기법 없이 임의의 관계를 추출하는 능력을 가진다는 것을 보였다.