서지주요정보
Bidirectional incremental approach to efficient information extraction : applications to biomedicine = 능률적인 정보 추출을 위한 양방향 점진적 접근 방법 : 생물의료 분야에의 응용
서명 / 저자 Bidirectional incremental approach to efficient information extraction : applications to biomedicine = 능률적인 정보 추출을 위한 양방향 점진적 접근 방법 : 생물의료 분야에의 응용 / Jung-Jae Kim.
발행사항 [대전 : 한국과학기술원, 2006].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8017706

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 06021

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Information extraction refers to the task of extracting relevant information from texts. This dissertation targets at extracting information of relations between biomedical concepts, which are explicitly represented with known linguistic structures in biomedical texts. Such structures of a target relation involve a keyword and its semantic arguments, where the keyword indicates the semantic type of the target relation and the arguments indicate the related concepts. The information of relations thus has two types of locality, such that the information is expressed in the local context of the keyword, called spatial locality, and that the keyword has well-known syntactic relations with its arguments, called structural locality. These two types of locality have been in the past handled by pattern matching and partial parsing approaches, respectively, but not at the same time. In this dissertation, we address this problem with a novel approach that searches for the arguments both bidirectionally and incrementally from the keywords. The extraction process is divided into two steps. First, it uses a non-structured pattern that describes a context between a keyword and its arguments, to match an input sentence bidirectionally from the keyword. It then performs syntactic analysis incrementally on candidate arguments and, if necessary, on their sentential contexts as well, with a parser of a combinatory categorial grammar for rigorous syntactic verification of the candidates. The approach addresses the aforementioned spatial locality by utilizing non-structured patterns and the structural locality by employing a lazy evaluation parser that is customized for information extraction. The approach is highly efficient, evidenced with experimental results, because it can stop the extraction process at any step, when the syntactic analysis gives a negative piece of evidence for extracting relevant information. We also show the applicability of the approach with two different tasks in biomedicine: Biological interactions, which are useful for building up biological pathways, and protein-protein contrastive relations which are useful for refining protein pathways.

정보추출이란 텍스트 문서에서 관련 정보를 추출하는 작업으로, 본 박사학위논문에서는 생물의료 분야 문서에서 생물의료 개념 간의 관계 정보를 추출하는 것을 주제로 삼는다. 관계 정보는 주로 관계의 의미적 유형을 가리키는 키워드와 그 키워드의 의미적 논항들로 표현된다. 이러한 키워드와 논항들은 잘 알려진 구문적 관계를 가지고 표현되기 때문에, 기존의 많은 정보추출 기법들은 문장 구문 분석기를 이용하여 구문 분석 결과로부터 그러한 구문적 관계를 찾아내었다. 대부분의 경우에 추출하고자 하는 정보의 추출을 위해서는 문장의 구문 구조 중 일부만을 필요로 하기 때문에, 본 논문에서는 필요에 의해서만 요구되는 세부작업을 수행하는 언어 분석 모듈들을 이용하여 키워드로부터 양방향으로 추출하고자 하는 정보를 점진적으로 분석하는 방법을 제안한다. 본 논문에서 제안한 방법의 실행 과정은 크게 두 단계로 나누어진다. 첫 번째 단계에서는 키워드와 논항 사이에 들어갈 수 있는 어구들로 이루어지는 패턴을 키워드가 포함된 문장에서 키워드로부터 양방향으로 맞추어서 키워드의 논항 후보를 찾는다. 두 번째 단계에서는 찾아낸 논항 후보들의 키워드와의 문법적 관계를 CCG의 문장 분석기를 점진적으로 이용하여 분석한다. 이 문장 분석기는 전체 문장 분석을 정보추출의 관점에서 몇 가지 단계로 나눠져 있기 때문에 원하는 정보의 추출의 성공여부가 결정되는 단계에서 분석을 중단할 수 있다는 특징을 가지고 있다. 두 번째 단계의 이러한 특징이 제안한 방법의 모듈 단위의 점진성을 설명해주며, 첫 번째 단계의 패턴 매칭이 키워드로부터 양방향으로 진행된다는 특징이 단어 단위의 점진성을 설명해준다. 또한 제안한 방법의 적용성을 높이기 위해서 여러 정보추출 시스템에서 공유될 수 있는 언어분석 모듈들을 제안한다. 이 모듈들의 적용성을 설명하기 위해서 본 논문에서는 두 가지 응용 시스템을 보여준다. 한 시스템은 생물 상호작용 정보를 추출하는 시스템으로 생물 상호작용 네트워크를 구축하는데 사용되고, 또다른 시스템은 단백질 간의 대조정보를 추출하는 시스템으로 전문가가 기존의 단백질 상호작용 네트워크를 수정하는데 도움이 되는 정보를 제공하는데 사용된다.

서지기타정보

서지기타정보
청구기호 {DCS 06021
형태사항 vii, 101 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 김정재
지도교수의 영문표기 : Jong-Cheol Park
지도교수의 한글표기 : 박종철
수록잡지명 : "BioContrasts: extracting and exploiting protein-protein contrastive relations from biomedical literature". Bioinformatics, 22(5), 597-605(2006)
학위논문 학위논문(박사) - 한국과학기술원 : 전산학전공,
서지주기 Reference : p. 83-101
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서