서지주요정보
Semi-automatic generation of knowledge graph by masked language model and improved skip-gram = 마스크 언어 모델과 개선된 스킵 그램 임베딩을 이용한 반자동 지식 그래프 구축
서명 / 저자 Semi-automatic generation of knowledge graph by masked language model and improved skip-gram = 마스크 언어 모델과 개선된 스킵 그램 임베딩을 이용한 반자동 지식 그래프 구축 / Byung-Il Yun.
발행사항 [대전 : 한국과학기술원, 2021].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8037949

소장위치/청구기호

학술문화관(문화관) 보존서고

DIE 21009

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

The knowledge graph is used in various fields such as search, knowledge inference, and natural language understanding. In particular, recently in the field of natural language understanding, it has been argued that external knowledge is required in addition to the learned language model in order for a machine to generate a more natural language. A knowledge graph is useful for storing and expressing this external knowledge. However, when a person directly builds such a knowledge graph, it consumes a lot of time and money, and it is difficult to immediately update the knowledge. To solve this problem, we propose a method of automatically/semi-automatically building a knowledge graph using natural language processing technology. A knowledge graph is a graph consisting of relationships between words. When expressing knowledge, the most preferentially expressed structure is a taxonomy, that is, a hierarchical structure. Therefore, we first conducted a study to explore the hypernym of words to automatically build a hierarchical structure. Our proposed method is an unsupervised method that does not require large-scale training data.Then, the non-hierarchical relationship is predicted. First, the static word embedding is improved to better express the relationship between words, and then the hidden relationship between words is predicted using the improved word embedding. After extracting the relationship of words in this way, it helps the process of building a knowledge graph. We build a knowledge graph directly from data, and compare it with a pre-built ontology to check whether it can be used in practice.

지식 그래프는 검색, 지식 추론, 자연어 이해 등 다양한 분야에서 사용된다. 특히 최근 자연어 이해 분야에서는 기계가보다 자연스러운 언어를 생성하기 위해서는 학습 된 언어 모델 외에 외부 지식이 필요하다는 주장이 제기되고 있으며, 지식 그래프는 이러한 외부 지식을 저장하고 표현하는 데 유용하게 사용되는 도구이다. 그러나 이러한 지식 그래프를 사람이 직접 작성하면 많은 시간과 비용이 소요되고 새로운 지식을 갱신하는 것이 어렵다. 이를 해결하기 위해 자연어 처리 기술을 이용하여 지식 그래프를 자동 / 반자동으로 구축하는 방법을 제안한다. 지식 그래프는 단어 간의 관계로 구성된 그래프이다. 지식을 표현할 때 가장 우선적으로 표현되는 구조는 분류, 즉 계층 구조이다. 따라서 먼저 계층 구조를 자동으로 구축하기 위해 단어의 상위어를 탐색하는 연구를 수행하였다. 우리가 제안한 방법은 대규모 학습 데이터가 필요없는 비지도 방법으로 단어의 계층적 관계를 예측한다. 그 후 정적 단어 임베딩을 개선하여 단어 간의 관계를 더 잘 표현하고 단어 간의 숨겨진 관계를 예측한다. 이런 식으로 추출된 단어 관계는 지식 그래프를 구축하는데 도움을 줄 수 있다. 우리는 이러한 방법을 통해 직접 지식 그래프를 구축하고 이를 기존의 방법으로 구축된 지식 그래프와 비교하며 실제 사용 가능성을 확인하였다.

서지기타정보

서지기타정보
청구기호 {DIE 21009
형태사항 iv, 84 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 윤병일
지도교수의 영문표기 : Hyo-Won Suh
지도교수의 한글표기 : 서효원
학위논문 학위논문(박사) - 한국과학기술원 : 산업및시스템공학과,
서지주기 References : p. 78-82
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서