The goal of knowledge base completion task is to fill in the missing piece of information into an incomplete triple. Although it has been studied a lot to improve knowledge base completion performance for small and refined dense experimental data, it is difficult to apply to many knowledge bases, which are relatively sparse. In addition, existing studies only use knowledge bases without ontology structures. In this paper, we propose a novel knowledge base embedding model based on convolutional neural networks for sparse knowledge base completion. Our proposed model considers path information and knowledge base ontology information to fit the low density knowledge bases of hierarchical ontology structure. Experiments show that our model achieves the best performance for sparse knowledge base completion and improves overall performance in iterative learning process of our information extraction system.
지식베이스 완성 작업의 목적은 미완성인 지식베이스에서 빠진 정보, 삼항관계들을 채우기 위함이다. 개체의 수가 적고 고밀도인 실험용 데이터셋에 대해서 지식베이스 완성 성능을 높이는 연구들은 많이 이루어졌지만, 해당 연구들은 비교적 밀도가 낮고 개체의 수가 많은 실제 지식베이스에 대해서는 검증된 바 없다. 또한 기존 연구들은 온톨로지 구조를 가지고 있지 않은 지식베이스만을 기준으로 삼는다. 본 논문에서 제안하는 개체 및 관계 임베딩은 컨볼루션 신경망을 기반으로 하여 계층형 온톨로지 구조의 저밀도 지식베이스에 적합하도록 경로 정보 및 온톨로지 정보를 사용한다. 본 모델이 한국어 디비피디아 데이터셋에 대한 링크 예측 문제에서 기존 연구들에 비해 더 뛰어난 성능을 보이고, 나아가 지식 추출 시스템의 반복 학습 과정에서 전체 시스템의 성능을 향상시킬 수 있음을 보였다.