문서 기반 온톨로지 생성을 위한 문장 분해 및 유사도 측정 시스템 = Sentence decomposition and similarity measurement for text-based ontology building
서명 / 저자 문서 기반 온톨로지 생성을 위한 문장 분해 및 유사도 측정 시스템 = Sentence decomposition and similarity measurement for text-based ontology building / 최주원.
발행사항 [대전 : 한국과학기술원, 2009].
Online Access 원문보기 원문인쇄





학술문화관(문화관) 보존서고

MCS 09031

휴대폰 전송







Ontology is a logical form to represent and interchange knowledge and it is rapidly receiving attention as the semantic web has come into the spotlight. In this paper, it is the objective to translate natural language text into ontology: Understandable format for computers. But translating text into ontology is not easily accomplishable goal. In this paper, we designed two works. First, we suggest a sufficient condition and stable rules to translate text into ontology. After that, we convert the corpus which satisfies the sufficient condition into ontology. Second, we propose an automated process to annotate input text by using the pre-annotated corpus already translated into ontology. This automated method uses structural similarity between parts of sentences. It showed many advantages it doesn’t need many classifiers, it works with small amount of training data and it is possible to see the original example data. In the experiments, we present it is possible to translate text into ontology with almost no loss of meanings and high accuracy.

온톨로지는 지식을 컴퓨터가 처리가능 한 형태로 표현하고 교환하기 위한 포맷으로 시맨틱웹의 등장과 함께 주목받고 있다. 본 논문은 사람들이 일상생활에서 기록하는 자연언어 문서를 온톨로지 형태로 변환하여 컴퓨터가 해석하기 용이하게 만드는 것을 목표로 한다. 하지만 문서의 내용을 온전하게 온톨로지 형태로 표현하는 것은 쉽게 달성할 수 있는 목표가 아니다. 본 논문에서는 두 가지의 시스템을 제안한다. 첫째, 문장을 온톨로지로 변환할 수 있는 충분조건 및 변환 규칙을 제시한다. 또한 이 변환 규칙을 이용해, 이미 충분 조건을 만족하는 코퍼스를 온톨로지로 실제 변환하여 본다. 둘째, 이미 온톨로지로 잘 변환된 코퍼스가 있을 때, 이 코퍼스를 이용하여 새로운 입력 문장을 온톨로지로 변환하는 방법을 제시한다. 이 자동화 된 방법은 문장의 구조적 유사도를 이용하여 입력 문장을 어노테이션 하는 방식이다. 해당 방식은 많은 분류자(Classifier)를 필요로 하지 않고, 훈련 데이터가 많지 않은 경우에도 작동하며, 원문 추적이 쉽다는 장점이 있다. 실험 결과를 통해, 본 논문의 방법을 따르면 높은 정확도로 문장의 본래의 뜻을 거의 잃지 않고 문장을 온톨로지 형태로 변환할 수 있다는 것을 보인다.


청구기호 {MCS 09031
형태사항 viii, 55 p. : 삽화 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : Joo-Won Choi
지도교수의 한글표기 : 최기선
지도교수의 영문표기 : Key-Sun Choi
부록 수록
학위논문 학위논문(석사) - 한국과학기술원 : 전산학전공,
서지주기 참고문헌 : p. 47-48





이 주제의 인기대출도서