서지주요정보
Multilingual projection techniques with DBpedia for knowledge enrichment = 지식 심화를 위한 디비피디아 다언어 투영 기법
서명 / 저자 Multilingual projection techniques with DBpedia for knowledge enrichment = 지식 심화를 위한 디비피디아 다언어 투영 기법 / Eun-kyung Kim.
저자명 Kim, Eun-kyung ; 김은경
발행사항 [대전 : 한국과학기술원, 2016].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8029868

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 16017

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Semantic link networks have been formed among data issued from various knowledge sources distributed around the globe through Linked Data, creating an environment that allows data reuse as well as information and knowledge sharing. However, there are limitations to extent of progress in Linked Data varies across languages due to the scale of relations among data grows rapidly as the fields that participate in Linked Data become diverse and as the specified ontologies become complex. This dissertation discusses a method for enriching knowledge by projecting multilingual Linked Data from DBpedia, the database that plays a key role in implementing Linked Data. First, parts that have maximal reusability for many different languages are extracted from DBpedia ontologies created solely from current English resources. Usability of ontologies is improved while meeting the demands of various languages by selecting essential semantic data among the languages. Second, this dissertation extends its research domain to compare the performance between technology based on dataset interfaces in various languages and technology based on individual languages. The proposed entity summarization method is achieved by projecting data extracted from multilingual datasets into a single joint space which is superior in performance to the state-of-the-art (at the time of this writing) technique for entity summarization that utilizes individual language-based approach that also requires additional external resources. In conclusion, this study demonstrates that projection of existing information among data in various languages can efficiently reveal the diversity and associations that are likely to be overlooked in the existing information extraction approach based on individual languages. Since multilingual projection-based information extraction complements the shortcomings of the individual language-based analysis, the multilingual method is expected to improve other extensive applications through combinations with various natural language processing technologies.

링크드 데이터를 통해 전세계에 분산된 서로 다른 지식 정보원에서 발행된 데이터 네트워크가 형성되었으나, 링크드 데이터에 참여하는 분야가 다양해지고 기술하는 온톨로지가 복잡해짐에 따라 이상적인 다언어 링크드 데이터 환경을 구성하는데 한계점이 존재한다. 본 논문에서는 링크드 데이터의 허브에 위치한 디비피디아로부터 다언어 사이의 지식 심화 방법을 다룬다. 다언어로부터 얻어진 다양한 지식을 공통의 공간으로 투영하는 방식을 통해 다언어 지식 사이에서 필수적인 정보를 선별하고 실효적으로 다언어 환경의 온톨로지 활용성을 향상시킨다. 또한 다수의 언어 지식으로부터 추출된 정보를 통합하여, 링크드 데이터에 존재하는 개체 정보 추출 기법을 향상시키는 방법을 제안한다. 제안된 방법은 기존의 독립된 언어 지식 정보 추출에서 간과할 수 있는 다양성 및 연관성을 효율적으로 확인할 수 있어 독립된 언어 기반 방식을 사용한 개체 요약의 최신 기법의 성능보다 우수하다. 결과적으로 다언어 투영 방식의 정보 추출이 독립된 언어 중심 분석의 단점을 보완할 수 있으므로 향후 다언어 투영 분석 방법이 다양한 자연언어처리 기술들과 결합하는 방식으로 더욱 포괄적인 응용 서비스에 기여할 수 있을 것으로 기대되며 다양한 언어로 작성된 데이터의 링크드 데이터 확산 계기를 마련한다.

서지기타정보

서지기타정보
청구기호 {DCS 16017
형태사항 iv, 81 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김은경
지도교수의 영문표기 : Key-Sun Choi
지도교수의 한글표기 : 최기선
Including Appendix
학위논문 학위논문(박사) - 한국과학기술원 : 전산학부,
서지주기 References : p. 74-78
주제 Semantic Web
Linked Data
Multilingual projection
Ontology
Entity summarization
시맨틱 웹
링크드 데이터
다언어 투영
온톨로지
개체 요약
QR CODE qr code