서지주요정보
Burst analysis of text document for concept map creation = 컨셉맵 형성을 위한 텍스트 문서의 버스트 분석
서명 / 저자 Burst analysis of text document for concept map creation = 컨셉맵 형성을 위한 텍스트 문서의 버스트 분석 / Sun-Hee Lee.
발행사항 [대전 : 한국과학기술원, 2013].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8025727

소장위치/청구기호

학술문화관(문화관) 보존서고

MKSE 13012

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Concept maps are graphical representation showing the relationships among ideas, images, or words. It is proven that automatically generated concept maps help people understanding a document before reading. The network of concept map consists of nodes which represent concepts and links which represent relation between concepts. When automatically creating concept maps, a traditional approach captures the association relation between concepts using co-occurrence of words. This study is motivated from the assumption that the relation between two words are not fully captured using the co-occurrence method. Instead, the relation can be inferred from the occurrence pattern of words. To observe the occurrence pattern of words, the burst analysis of words is adopted in this study. There is often an intensive coverage of some topic within a certain period which we refer to as a bursty interval of a word. Instead of co-occurrence method, this study captures the relation between concepts by pairing two words using bursty intervals. The case study shows that the proposed method outperforms the co-occurrence method in illustrating flow of a story in a document. Since the co-occurrence method can still provide additional information about a document, the combination of the proposed method and co-occurrence method is suitable for illustrating a summary of a document.

컨셉 맵은 개념들, 혹은 단어들 사이의 관계를 그래프의 형태로 나타내는 표현 방법이다. 한 문서에 대해 자동적으로 생성된 컨셉 맵은 문서를 읽지 않고서도 문서의 내용을 이해하는데 도움이 된다는 연구 결과가 있어 왔다. 컨셉 맵은 단어를 나타내는 노드들과, 그 단어들간의 관계를 나타내는 링크들로 이루어져 있다. 컨셉 맵을 자동으로 생성하는 현재까지의 연구들은 단어들 간의 관계를 추출할 때, 단어들의 동시 출현 빈도수를 이용하는 co-occurrence 방법을 주로 사용해왔다. 본 연구는 co-occurrence 방법으로는 단어들 간의 관계를 정확하게 추출할 수 없다는 점에서 시작되었다. 본 연구에서는 단어들 간의 관계를 단어 출현 패턴을 분석하여 추출하였다. 단어 출현 패턴 분석을 위해, 버스트 분석을 활용하였다. 버스트란 한 단어가 문서 전체에서의 자신의 빈도수에 비해, 특정 구간에서 상대적으로 출현 빈도수가 매우 높은 것을 뜻한다. 특정 구간에서 그 단어의 출현 빈도수가 상대적으로 매우 높다면, 그 구간의 주제는 그 특정 단어에 관련된 주제일 가능성이 높다. 본 연구는 이러한 단어의 버스트 분석을 통해 단어의 출현 패턴을 분석하고, 그 패턴을 단어간의 관계를 추출하는데 사용하였다. 제시한 방법의 평가를 위해 두 개의 문서를 이용하여 사례 분석을 한 결과, 제안한 방법이 기존의 co-occurrence 방법보다 문서의 내용을 설명하는데 더 좋은 성능을 보였다. 버스트 분석을 통해 생성된 컨셉 맵에 co-occurrence 방법을 통해 생성된 정보를 보조적으로 제공한다면, 문서의 내용을 이해하는데 도움이 되는 컨셉 맵을 생성할 수 있을 것이다.

서지기타정보

서지기타정보
청구기호 {MKSE 13012
형태사항 iii, 66 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 이선희
지도교수의 영문표기 : Wan-Chul Yoon
지도교수의 한글표기 : 윤완철
학위논문 학위논문(석사) - 한국과학기술원 : 지식서비스공학과,
서지주기 References : p. 60-63
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서