서지주요정보
개체명 인식 기반 질의 응답 URI spotting 연구 = Named entity-based URI spotting from natural language query
서명 / 저자 개체명 인식 기반 질의 응답 URI spotting 연구 = Named entity-based URI spotting from natural language query / 임경태.
저자명 임경태 ; Lim, Kyung-Tae
발행사항 [대전 : 한국과학기술원, 2014].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8026406

소장위치/청구기호

학술문화관(문화관) 보존서고

MWST 14001

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

This paper proposes that the progress state for DBpedia, which is the hub for Linked Data, can be divided into four different layers for Question Answering over Linked Data(QALD). By defining layers of DBpedia progress, we can answer the following questions: What the criteria of dividing layers are, what the requirements for being included in a layer are, and which layer each language belongs to. The division of the proposed four layers of DBpedia progress is carried out on two different viewpoints one is viewpoint of Natural Language Processing (NLP) for question answering system. It means that “what NLP component is necessary for this process” Another is viewpoint of DBpedia growth. The thesis will see the DBpedia growing layers and how it can be utilized. Furthermore, the analyzed results of QALD system, we can say that the DBpedia will have more layers. After evaluation of four layers by experiment which is URI spotting from QALD corpus, we show that DBpedia for 25 different languages can be classified based on our four layers definition. For each layer, we give examples of QALD questions that represent what kinds of data can be used to solve a question. Finally, based on the localization and development of the Korean DBpedia, we set a guideline of how to start building DBpedia for languages that are not supported yet, and how to further develop DBpedia for the previously classified 25 languages based on their current layer of progress.

본 논문은 Linked Data의 중심 역할을 하는 디비피디아의 발전 정도 및 활용 가능 범위를 4 단계 계층을 통해 제시한다. 우리는 디비피디아의 계층 정의를 통해 다음과 같은 질문에 답변을 제시한다. 레벨을 나누는 기준이 무엇인가?, 레벨에 포함되기 위한 요구사항은 무엇인가?, 각 디비피디아 언어가 어느 레벨에 속하는가?. 4단계의 계층 분류는 두 가지 다른 관점으로부터 연구 첫 번째로 자연어 처리 관점에서의 분류, 다시말해 이것은 QALD URI spotting 질의응답 실험으로부터 "어떠한 자연어 처리 과정을 통해 해당 질의가 해결되는가?" 두 번째로 디비피디아 데이터의 성장관점에서 "QALD 질의응답을 위해 어떠한 디비피디아 데이터를 가 필요한가"로 분류될 수 있다. 또한, 우리는 실험을 통해 QALD URI spotting을 통해 디비피디아에 더 많은 계층이 있을것이라는 점을 말할 수 있다. 우리는 25개 언어에 대한 디비피디아를 분석하여 앞서 정의한 4단계의 계층을 기준으로 분류를 시도 하였으며, 각 단계를 진행하면 어떤 QALD 질의 응답을 해결할 수 있고, 어느 분야에 사용할 수 있는지 구체적 사례와 어플리케이션을 소개한다. 그리고 디비피디아의 구축의 실례로서 한국어 디비피디아 구축 사례를 통해 실제 각 계층을 구축하는 방법을 소개함으로써 아직 구축하지 못한 언어엔 디비피디아를 구축하는 최선의 가이드를 제공하고 25개의 분석된 언어엔 다음 발전 방향을 제시할 좋은 기회가 될 것이다.

서지기타정보

서지기타정보
청구기호 {MWST 14001
형태사항 vi, 46 p. : 삽도 ; 30 cm
언어 한국어
일반주기 저자명의 영문표기 : Kyung-Tae Lim
지도교수의 한글표기 : 최기선
지도교수의 영문표기 : Key-Sun Choi
학위논문 학위논문(석사) - 한국과학기술원 : 웹사이언스공학전공,
서지주기 참고문헌 : p. 44-46
주제 링크드 데이터
디비피디아
유알아이 스포팅
퀄드
질의 응답
엔이알
개체명 인식
Linked Data
DBpedia
URI spotting
QALD
Question Answering
NER
Named Entity Recognition
QR CODE qr code