서지주요정보
수사구조를 이용한 텍스트 자동요약 = Text summarization using rhetorical structure
서명 / 저자 수사구조를 이용한 텍스트 자동요약 = Text summarization using rhetorical structure / 이유리.
발행사항 [대전 : 한국과학기술원, 2000].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8010583

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 00044

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

등록번호

9006475

소장위치/청구기호

서울 학위논문 서가

MCS 00044 c. 2

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Summarization is a reductive transformation from source text to summary text through content reduction by selection or generalization on what is important in the source. Summary generation is, like Machine Translation, one of the ultimate goal of Natural Language Processing. However, conventional word frequency based methods are lacking in inter-sentential or discourse-structural analysis. On the other hand, information-extraction based methods owe their successes to the limitation of the domain and cannot be applied to varied documents. To realize a human-like summarization, we must establish a computational theory for analyzing the linguistic discourse struture and its practical procedure. Human builds up a composition through the logical process of thinking. Therefore the writing has a logical structure and can be expressed in relations between sentences. In this thesis, we present a summarization method using a rhetorical structure. The rhetorical structure represents relations between sentences. To analyze relations, we use rhetorical markers like connectives and phrases which are used to connect between sentences. To generate the structure corresponding entire text, we detect the structure like chapters and sections from a document which are tagged semi-automatically. The parsing process of rhetorical structures is divided into two level and generates the structure for a document. Finally we compute weight of sentences and select essential sentences as a summary. Experimental results show that our system performs better than a word-frequency based model and improves the recall about 6.7%.

요약이란 내용축약을 통하여 원문 텍스트로부터 요약문으로 변형하는 축약과정이다. 요약문 생성은 기계번역과 같이 자연 언어 처리의 궁극적인 목적 중의 하나이다. 그러나 기존의 단어 빈도수 기반 방법은 문장간 분석, 담화 분석이 결여되어 있다. 또한 정보 추출기반 방법은 한정된 도메인에서만 적용될 수 있으며, 다양한 텍스트에 적용되기 어렵다. 인간과 유사한 방법으로 요약문을 생성하기 위해서는 담화 구조에 대한 분석 이론이 선행되어야 한다. 일반적으로 인간은 논리적인 사고의 흐름을 가지고 글을 전개하게 된다. 그러므로 글은 논리적인 구조를 가지며, 이는 문장들간의 관계를로 표현될 수 있다. 본 논문에서는 수사구조를 이용한 요약문 생성 방법을 제안한다. 수사구조란 문장들간의 관계를 나타낸다. 이러한 관계를 분석하기 위해서 접속사나 접속어구와 갈은 어휘적인 표지들을 사용하였으며, 전체 텍스트에 대응하는 구조를 생성하기 위해서, 장이나 절과 같은 문서 구조 정보를 사용하였다. 수사구조 파싱과정은 두 단계로 이루어진다. 최종적으로 생성된 트리로부터 가중치를 계산하여, 중요 문장을 요약문으로 추출한다. 실험 결과는 단어 빈도수 기반 방법보다 약 6.7%의 재현율 향상을 보였다.

서지기타정보

서지기타정보
청구기호 {MCS 00044
형태사항 iv, 41 p. : 삽화 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : Yu-Ri Lee
지도교수의 한글표기 : 최기선
지도교수의 영문표기 : Key-Sun Choi
학위논문 학위논문(석사) - 한국과학기술원 : 전산학전공,
서지주기 참고문헌 : p. 40-41
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서