Entity Linking is a procedure of connecting a sentence with knowledge bases to find entity URIs from the sentence. There were the several former approaches on English, but the case is different on Korean - entities are not directly identified with capitals and knowledge base is relatively small. In this paper, Entity Boundary Detection is performed as a prerequisite, which detects entity boundary including Named Entity using POS-tags and entity surface forms. Then, Entity Linking module selects appropriate entity candidates using SVM supervised learning with features from the entity boundary information and semantic relations between the candidates. I analyze feasibility of the Entity Linking system by comparing f1-score with the other Entity Linking system in Korean, as well as the possibility to extend the domain to the other knowledge base.
개체연결이란 문장을 지식베이스와 연결하여, 그 문장 속에 존재하는 개체들의 통합 자원 식별자(URI)를 찾는 작업이다. 이 주제는 영어권에서 많이 연구되었지만, 한국어에서 개체 후보를 선정할 문법적 기준이 없고 지식베이스의 밀도도 낮아 같은 방법을 적용하기 어렵다. 본 논문에서는 개체 연결의 선행 과정으로 문장 자질과 지식베이스의 개체 표면형을 자질로 삼아 개체명을 포함한 넓은 범위의 개체-문자열을 발견하였다. 그리고 발견한 개체-문자열과 확장된 개체 후보간 관계 정보를 특징으로 삼은 서포트 벡터 머신(SVM) 지도 학습 모델로 모호성을 해소하였다. 그 결과 제안한 시스템은 개체 연결에 우수한 성능을 보였으며 다른 지식베이스로의 확장도 가능함을 확인하였다.