Concept maps are graphical representation showing the relationships among ideas, images, or words. It is proven that automatically generated concept maps help people understanding a document before reading. The network of concept map consists of nodes which represent concepts and links which represent relation between concepts. When automatically creating concept maps, a traditional approach captures the association relation between concepts using co-occurrence of words. This study is motivated from the assumption that the relation between two words are not fully captured using the co-occurrence method. Instead, the relation can be inferred from the occurrence pattern of words. To observe the occurrence pattern of words, the burst analysis of words is adopted in this study. There is often an intensive coverage of some topic within a certain period which we refer to as a bursty interval of a word. Instead of co-occurrence method, this study captures the relation between concepts by pairing two words using bursty intervals. The case study shows that the proposed method outperforms the co-occurrence method in illustrating flow of a story in a document. Since the co-occurrence method can still provide additional information about a document, the combination of the proposed method and co-occurrence method is suitable for illustrating a summary of a document.
컨셉 맵은 개념들, 혹은 단어들 사이의 관계를 그래프의 형태로 나타내는 표현 방법이다. 한 문서에 대해 자동적으로 생성된 컨셉 맵은 문서를 읽지 않고서도 문서의 내용을 이해하는데 도움이 된다는 연구 결과가 있어 왔다. 컨셉 맵은 단어를 나타내는 노드들과, 그 단어들간의 관계를 나타내는 링크들로 이루어져 있다. 컨셉 맵을 자동으로 생성하는 현재까지의 연구들은 단어들 간의 관계를 추출할 때, 단어들의 동시 출현 빈도수를 이용하는 co-occurrence 방법을 주로 사용해왔다. 본 연구는 co-occurrence 방법으로는 단어들 간의 관계를 정확하게 추출할 수 없다는 점에서 시작되었다. 본 연구에서는 단어들 간의 관계를 단어 출현 패턴을 분석하여 추출하였다. 단어 출현 패턴 분석을 위해, 버스트 분석을 활용하였다. 버스트란 한 단어가 문서 전체에서의 자신의 빈도수에 비해, 특정 구간에서 상대적으로 출현 빈도수가 매우 높은 것을 뜻한다. 특정 구간에서 그 단어의 출현 빈도수가 상대적으로 매우 높다면, 그 구간의 주제는 그 특정 단어에 관련된 주제일 가능성이 높다. 본 연구는 이러한 단어의 버스트 분석을 통해 단어의 출현 패턴을 분석하고, 그 패턴을 단어간의 관계를 추출하는데 사용하였다. 제시한 방법의 평가를 위해 두 개의 문서를 이용하여 사례 분석을 한 결과, 제안한 방법이 기존의 co-occurrence 방법보다 문서의 내용을 설명하는데 더 좋은 성능을 보였다. 버스트 분석을 통해 생성된 컨셉 맵에 co-occurrence 방법을 통해 생성된 정보를 보조적으로 제공한다면, 문서의 내용을 이해하는데 도움이 되는 컨셉 맵을 생성할 수 있을 것이다.