서지주요정보
Domain ontology based document summarization and query processing methodology = 도메인 온톨로지를 이용한 문서요약 및 질의어 처리 방법론 제안
서명 / 저자 Domain ontology based document summarization and query processing methodology = 도메인 온톨로지를 이용한 문서요약 및 질의어 처리 방법론 제안 / Jong-Seok Yoon.
발행사항 [대전 : 한국과학기술원, 2013].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8025115

소장위치/청구기호

학술문화관(문화관) 보존서고

MIE 13001

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Even though information-oriented society is coming and lots of documents are being created rapidly, we couldn’t meet a demand due to lacks of human resource and time. Over last half a century, previous research has tried to solve the problem by not only NLP but also other methodologies. But it looks like difficult to solve that due to language’s complexity and anomalism. Especially, they have been in troubles in understanding contents as well as restructuring key contents precisely. To solve these problems, we use an ontology. The ontology can make a system easy to restructure sentences and raise readability up by giving the system common format. An expert defines domain-ontology which is specification what contents should be summarized. After initial work, the system extracts key concepts and a relationship among concepts based on domain ontology and summarizes useful information to a user. A semantic model is created from an original document by syntactic and semantic analysis and it is transformed into sentences by rule based translation process. Besides, the system analyzes a query based on domain ontology. It makes the user possible to get an extended result.

정보화 사회가 도래하고 엄청난 속도로 문서의 양이 증가하고 있음에도 불구하고, 제한된 인력과 시간 때문에 그 수요를 따라가지 못하고 있다. 때문에 지난 반세기에 걸쳐, 기존 연구에서는NLP뿐 만 아니라 다양한 방법을 활용하여 문서 요약을 통해 문제를 해결하고자 하는 노력이 있었다. 하지만 언어의 복잡성과 변칙성 때문에 제대로 된 문서 요약이 어려웠다. 특히, 시스템이 문장을 이해하는 것뿐 만 아니라 문장을 재구성하는데 역시 어려움을 보여왔다. 이러한 문제를 극복하고자 논문에서는 도메인 온톨로지를 이용하여 요약하고자 하는 내용을 미리 정의하고, 이를 바탕으로 문서의 중요 컨셉과 컨셉 간의 관계를 추출하여 사용자에게 유용한 정보를 요약해 주는 방법론을 제시하였다. 요약하고자 하는 문서를 구문론적, 의미적 분석을 통해 요약할 내용을 추출하여 온톨로지 모델로 생성 한 후, 이를 문장으로 재구성하여 사용자에게 요약된 정보를 제공해 줄 수 있도록 하였다. 더욱이 정보 검색 시 도메인 온톨로지를 활용하여 쿼리를 분석함으로써 사용자가 원하는 정보를 제공하는 방법론을 추가하였다. 온톨로지를 사용함으로써 문장의 재구성을 원활히 하고, 문서 분석의 공통된 틀을 확립함으로써 결과값의 가독성을 높일 수 있다.

서지기타정보

서지기타정보
청구기호 {MIE 13001
형태사항 v, 41 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 윤종석
지도교수의 영문표기 : Hyo-Won Suh
지도교수의 한글표기 : 서효원
학위논문 학위논문(석사) - 한국과학기술원 : 산업및시스템공학과,
서지주기 References : p. 38-39
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서