서지주요정보
Computational identification of sequence variation and environmental condition in clinical depression from biomedical literature = 생물학 문헌을 통한 우울증에서의 염기서열 변화와 환경조건 자동 식별
서명 / 저자 Computational identification of sequence variation and environmental condition in clinical depression from biomedical literature = 생물학 문헌을 통한 우울증에서의 염기서열 변화와 환경조건 자동 식별 / Jinseon You.
발행사항 [대전 : 한국과학기술원, 2016].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8030129

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 16057

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Clinical depression is a complex disease, which is known to be influenced by various factors. As genetic and environmental factors are frequently referred to as the most influential in causing depression, there have been many studies that try to identify genes or proteins and environmental conditions associated with depression. While a number of text-mining (TM) systems identifying information about the genetic factors in the biomedical literature have consequently been developed, there is currently no TM system specifically targeted at extracting environmental conditions. As a result, biologists are provided only with incomplete information about depression by these TM systems, unable to help them to discover the etiology and treatment of depression. In the thesis, we propose a TM system that considers an interaction between genetic and environmental factors associated with depression. The system identifies not only relations between a sequence variation and depression but also changes in the relations according to environmental conditions. In order to develop the system, we split the system into two TM subsystems. The first system is applied to an existing system for extracting the relations between a sequence variation and depression from the biomedical literature. The system classifies whether the relations are positive or negative on a document level. Based on the dictionary with candidate terms for environmental conditions, the second system identifies the conditions in the biomedical literature containing the binary relations. Using the dependency of sentence, the system excludes terms wrongly classified as the conditions. The system is a first TM system considering a ternary relation among sequence variation, disease and condition. Through the system, we are able to provide more comprehensive information about depression than other systems. We expect that, as the system is applied to other diseases, biologists can easily identify diverse information associated with changes in symptoms of diseases including depression.

우울증은 대표적인 정신 질환 중 하나로 생물정보학에서는 우울증의 요인을 찾기 위한 다양한 시스템들을 개발하였으며 주로 유전자와 우울증의 관계에 주목하였다. 그러나 이러한 시스템들은 우울증과 관련해 단편적인 정보만을 제공한다는 문제가 있다. 본 연구에서는 생물학 문헌에서 유전적 요인인 염기서열 변화와 이와 상호작용하여 우울증의 정도를 조절하는 환경조건을 식별하는 텍스트 마이닝 시스템을 개발하고자 한다. 우울증의 3항 관계를 식별하는 시스템을 개발하고자 본 연구에서는 시스템은 크게 두 가지로 분리하여 진행하였다. 첫 번째는 우울증과 염기서열 변화의 관계를 식별하는 것으로 먼저 생물학 문헌에서 기존 시스템(tmVar, DNorm)을 이용하여 우울증과 염기서열 변화를 식별하고 기계 학습을 통해 이들의 관계를 식별하였다. 두 번째로는 환경조건을 식별하는 것으로 미리 구축한 환경조건 사전을 이용해 염기서열 변화와 우울증이 포함된 생물학 문헌에서 환경조건을 식별한다. 이후 문장 구조를 이용하여 식별된 환경조건 중 잘 못 식별된 용어는 제거하여 준다. 해당 시스템은 우울증에서의 3항 관계를 고려한 첫 번째 시스템이다. 우리는 해당 시스템이 우울증과 관련된 보다 포괄적인 정보를 제공함으로써 우울증 연구에 큰 도움이 되리라 기대한다.

서지기타정보

서지기타정보
청구기호 {MCS 16057
형태사항 iv, 27 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 유진선
지도교수의 영문표기 : Jong C. Park
지도교수의 한글표기 : 박종철
학위논문 학위논문(석사) - 한국과학기술원 : 전산학부,
서지주기 References : p. 23-24
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서