The purpose of entity linking is to find an entity which a mention in natural language text refers to in knowledge base. However, traditional entity linking research is not applicable when new entity is added, since it does not consider entities that not in knowledge base on evaluation. In this paper, we assume the situation when new entities are added to the knowledge base in real-time. We tried to expand targets of entity by using entity discovery and entity registration to add new entity that not present in knowledge base, and used entity linking to find added entity. We proposed mention embedding method using features of mention and context. We solved the problem by dividing knowledge base into main and cache knowledge base, and using supervised learning method and vector similarity method. Experiments showed that our model can find more entity than traditional entity linking system and links new entity well, resulting increase of F1 score on entity linking metrics.
개체 연결 태스크의 목적은 자연어 텍스트 내의 언급이 지식베이스 내의 어떤 개체를 가리키는지 찾는 것이다. 하지만 기존의 개체 연결 연구에서는 지식베이스에 없는 개체는 평가 대상으로 삼지 않아, 새로운 개체가 추가되는 상황에는 적합하지 않다는 문제가 있다. 본 논문에서는 실시간으로 지식베이스에 새로운 개체가 추가되는 상황을 가정한다. 개체 발견과 개체 등록을 활용하여 지식베이스에 없는 개체를 등록하고, 등록된 개체를 개체 연결을 통해 찾아내어 개체 연결을 할 수 있는 대상을 확대하고자 하였다. 언급과 언급 주변 문맥 특질을 통한 언급 임베딩을 제시하였다. 캐시 지식베이스의 도입을 통해 지식베이스를 분리하여 지도 학습 방식과 유사도 기반 방식을 함께 사용하여 문제를 해결하였다. 실험을 통해 본 논문에서 제시하는 모델이 기존의 개체 연결 모델보다 찾을 수 있는 개체가 많아졌고, 새로운 개체들을 잘 연결하여 전체적인 개체 연결의 성능이 향상됨을 보였다.