서지주요정보
Literature mining for context-specific molecular relations based on multimodal representation = 상황 특이적 분자관계 추출을 위한 다중 표현 기반의 문헌 마이닝
서명 / 저자 Literature mining for context-specific molecular relations based on multimodal representation = 상황 특이적 분자관계 추출을 위한 다중 표현 기반의 문헌 마이닝 / Jaehyun Lee.
발행사항 [대전 : 한국과학기술원, 2020].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8035380

소장위치/청구기호

학술문화관(문화관) 보존서고

DBIS 20005

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Biological contextual information helps understand various phenomena occurring in the biological systems consisting of complex molecular relations. The construction of context-specific relational resources vastly relies on laborious manual extraction from unstructured literature. In this paper, we propose COMMODAR, a machine learning-based literature mining framework for context-specific molecular relations using multimodal representations. The main idea of COMMODAR is the feature augmentation by the cooperation of multimodal representations for relation extraction. We leveraged biomedical domain knowledge as well as canonical linguistic information for more comprehensive representations of textual sources. The models based on multiple modalities outperformed those solely based on linguistic modality. We applied COMMODAR to the 14 million PubMed abstracts and extracted 9,214 context-specific molecular relations. All corpora, extracted data, evaluation results, and the implementation code are downloadable at https://github.com/jae-hyun-lee/commodar.

생물학적 상황 정보는 인체와 같이 복잡한 생물학적 시스템에서 일어나는 다양한 현상들을 이해하는데 도움을 준다. 이러한 상황 정보가 포함된 상황 특이적인 분자 수준의 관계 정보를 담은 공공 데이터베이스들은 주로 문헌에서부터 노동 집약적인 수작업을 통해 추출한 정보들에 의존하고 있다. 그렇기 때문에 그 확장성에 있어서 한계를 가진다. 본 연구에서는 다중 표현 기반의 기계 학습을 이용하여 상황 특이적 분자관계 정보를 문헌에서 자동적으로 추출하는 방법을 제안한다. 다중 표현은 문헌 속의 언어학적 정보뿐만 아니라 문헌 외에서 얻은 생물 의학적 배경 지식을 함께 동원한다. 그래서 언어학적 정보만 사용한 모델에 비해 언어학적 정보와 생물 의학적 배경 지식을 함께 사용한 모델이 더 좋은 성능을 보였다. 본 연구에서 제안하는 다중 표현 기반의 모델을 이용하여 1,400만건의 펍메드 초록에서부터 9,214개의 상황 특이적 분자관계 정보를 추출했다. 모든 코퍼스, 추출한 분자관계 정보, 성능 평가 결과, 그리고 구현에 사용된 코드는 https://github.com/jae-hyun-lee/commodar 에서 접근가능하다.

서지기타정보

서지기타정보
청구기호 {DBIS 20005
형태사항 iv, 60 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 이재현
지도교수의 영문표기 : Kwang Hyung Lee
지도교수의 한글표기 : 이광형
수록잡지명 : "Literature mining for context-specific molecular relations using multimodal representations (COMMODAR)". BMC Bioinformatics, (2020)
학위논문 학위논문(박사) - 한국과학기술원 : 바이오및뇌공학과,
서지주기 References : p. 55-57
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서