서지주요정보
Construction of phenotypic similarity network of rare diseases and candidate disease gene prediction using RWRHN = 희귀질환의 증상유사네트워크 구축과 RWRHN 방법을 사용한 질병유전자 예측
서명 / 저자 Construction of phenotypic similarity network of rare diseases and candidate disease gene prediction using RWRHN = 희귀질환의 증상유사네트워크 구축과 RWRHN 방법을 사용한 질병유전자 예측 / Boram Lee.
저자명 Lee, Boram ; 이보람
발행사항 [대전 : 한국과학기술원, 2017].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8030495

소장위치/청구기호

학술문화관(문화관) 보존서고

MBIS 17006

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Recent studies such as text-mining against huge biomedical databases, devising ontology similarity measure, and predicting candidate disease genes using various methods has been applied on the rare disease field. In this study, we aim to devise and compare models of prioritizing candidate rare disease genes. Disease phenotype, which is defined as an every possible observation from patient to diagnose primarily, plays an important role in inferring novel disease related genes recently. Therefore we compute pairwise phenotypic similarity of rare diseases using 3 similarity measures which are Wang, Resnik, and Cosine. The rare disease ontology was extracted from OMIM and Orphanet databases. Next we construct rare disease similarity network where nodes are rare diseases and edges are connected when the similarity value of two disease nodes are higher than cutoff. To group phenotypically similar diseases, we use two strategy which is collecting neighboring disease of query disease and clustering on the rare disease similarity network. Phenotypically similar diseases of query disease is further used as an input to predict potential disease genes. We construct heterogeneous network which consists of physical protein-protein interaction network (PPI) from BioGrid, phenotypic rare disease similarity network, and bipartite disease gene association network obtained from HPO database. In the gene prediction step, we iteratively simulate the random walker on the heterogeneous network using RWRHN algorithm, and the resulting probability of potential candidate rare disease genes to be related to the query diseases are prioritized. We evaluate 6 rare disease gene prediction model which is from a combination of 3 ontology similarity measure and 2 disease grouping methods by employing 10-fold cross validation and by calculating ROAUC. Finally we analyze factors that influence the performance of 6 models.

많은 인구에서 나타나는 일반적인 질병들에 대해서는 지금껏 연구가 많이 이루어져왔으나, 희귀질환의 경우 질병을 치료하는데 필수적인 지식들이 충분하지 않고, 치료법이 개발된 질병의 수가 많지 않다. 최근, 희귀질환에 대한 연구가 시작되었으며, 그러한 연구에는 거대한 생의학적 데이터베이스에 대한 텍스트마이닝 방법으로 질병과 관련된 온톨로지 용어들을 추출하고, 질병 관련 용어들의 관련성을 비롯한 여러 가지 생물 분자들에 관련된 데이터들을 이용하여 희귀 질환의 특성을 이해하기 위한 네트워크 분석 등이 있다. 그러한 흐름의 일환으로, 이 연구에서는 잠재적인 희귀질환 유전자 후보를 예측하기 위한 모델들을 고안하고 비교한다. 질병의 증상은 어떤 질병에 걸린 환자들에게서 관찰되는 기본적인 신체적 현상들이며, 증상의 조합은 어떤 질병인지 진단을 내릴 때, 가장 일차적이고 중요한 근거가 되므로, 모든 질병 짝들에 대해, 두 질병이 증상에 관하여 얼마나 유사한지를 측정한다. 이 때 사용된 용어 유사 측정법은 레스닉 (Resnik), 왱 (Wang), 코사인 (Cosine) 의 총 3가지 측정법이다. 증상에 대한 질병 유사도는 희귀 질환 유사도 네트워크에 사용되었으며, 이 네트워크는 희귀질환 노드로 이루어져 있으며, 각 희귀질환 노드는 해당 질환의 증상에 대한 질병 유사도가 특정 기준치 이상일 때 연결된다. 다음으로 증상에 대한 질병 유사도 네트워크에 대해서 네트워크 기반 클러스터링 알고리즘 중 하나인 마르코프 클러스터링 알고리즘을 사용함으로써, 증상이 매우 유사한 질병들을 클러스터 단위로 구성한다. 이 희귀질환 클러스터 정보는 희귀질환 유전자 예측 시에 사용된다. 잠재적인 희귀질환 유전자를 예측하기 위해서 혼성 네트워크를 구성하고, 이 네트워크에 확률적인 희귀질환-질병 상관도를 계산해주는 알고리즘인 혼성네트워크 기반 랜덤 워크 알고리즘을 적용한다. 이 때, 혼성네트워크는 단백질-단백질 물리적 상호작용 네트워크와, 증상에 대한 질병 유사도 네트워크, 유전자와 희귀질환과의 연관성을 나타내는 양분 그래프로 구성된다. 혼성 네트워크 상에서 매 단계에서의 랜덤 워커가 각 노드를 방문하는 확률을 계산함으로써 얻어지는 노드-노드 간 연관도로부터 쿼리 질병과 연관성이 큰 질병 유전자를 예측한다. 3가지의 유사도 측정 방법과 2가지 질병 그룹화 방법의 6가지 조합으로 구성된 유전자 예측 모델을 비교하기 위해, 10-배 교차 검증을 시행하고, 각 검증에서부터 얻어지는 수신자 조작 특성 곡선과, 곡선하 면적을 계산하였다. 마지막으로 모델의 성능에 영향을 미치는 요인들을 분석한다.

서지기타정보

서지기타정보
청구기호 {MBIS 17006
형태사항 iv, 30 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 이보람
지도교수의 영문표기 : Dong Sup Kim
지도교수의 한글표기 : 김동섭
학위논문 학위논문(석사) - 한국과학기술원 : 바이오및뇌공학과,
서지주기 References : p. 27-28
주제 Rare disease
phenotypic similarity disease network
heterogeneous network integration
random walk with restart algorithm
disease gene prediction
희귀질환
증상 유자 질환 네트워크
혼성네트워크 통합
재시작 랜덤워크 알고리즘
질병 유전자 예측
QR CODE qr code