Knowledge graph embedding represents entities and relationships as feature vectors by defining a scoring function that reflects the structure of the graph. Most knowledge graphs do not contain additional information besides structural information; thus, most existing knowledge graph embedding models depend only on the structural information to generate embeddings. However, extra information can be provided for each entity in a knowledge graph, such as entity types in real-world applications. In this paper, we propose a knowledge graph embedding model that reflects the structure of a knowledge graph and entity-type information. A new loss function and negative sampling method are designed to reflect the entity-type information. We create the SMC datasets containing entity-type information based on the semiconductor manufacturing process to evaluate our model. Experimental results show that our model outperforms the other baseline models in the real-world semiconductor knowledge graphs.
지식 그래프 임베딩은 그래프의 구조를 반영한 점수 함수를 통해 개체와 관계를 특성 벡터로 표현하는 기술이다. 대부분의 지식 그래프는 구조적인 정보 이외에 추가적인 정보를 포함하고 있지 않아 임베딩을 생성할때 그래프의 구조적인 정보만을 사용한다. 하지만 실생활에 존재하는 어플리케이션들은 개체 타입 등 다양한 정보를 포함하여 지식 그래프로 변환할 수 있는 경우가 있다. 본 논문에서는 개체의 타입이 개체들에 대한 군집으로 해석될 수 있다는 점을 토대로, 개체 타입 정보를 사용하는 지식 그래프 임베딩 모델을 제시한다. 손실 함수와 네거티브 샘플링을 통해 타입을 반영하는 새로운 방법을 제시한다. 본 논문에서는 반도체 공정을 바탕으로 각 개체의 타입이 제공된 SMC 데이터 셋을 제작하여 링크 예측 실험을 진행하였다. 본 모델이 해당 데이터 셋에서 기존의 다른 지식 그래프 임베딩 모델을 뛰어넘는 성능을 기록하였다.