서지주요정보
Prediction of damaging effects of missense variants using an ensemble approach with a disease gene network = 질환 유전자 네트워크 및 앙상블 방법을 이용한 과오 돌연변이의 영향 예측
서명 / 저자 Prediction of damaging effects of missense variants using an ensemble approach with a disease gene network = 질환 유전자 네트워크 및 앙상블 방법을 이용한 과오 돌연변이의 영향 예측 / Hong-Hee Won.
발행사항 [대전 : 한국과학기술원, 2011].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8022908

소장위치/청구기호

학술문화관(문화관) 보존서고

DBiS 11009

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Cancer is a genetic disease. The alterations of tumor-suppressor genes, oncogenes and stability genes can bring acquired cancer capabilities such as self-sufficiency in growth signals, insensitivity to anti-growth signals, evading apoptosis, sustained angiogenesis, limitless replicative potential, and tissue invasion and metastasis. `Driver` mutations contribute to such growth advantage on the cancer cells and have been positively selected during the evolution of the cancer while `passenger` mutations do not contribute to cancer development but occur in the cells along with driver mutations during cell division. With a few exceptions, a single gene alteration rarely causes cancer. Instead, it is widely believed that cancer might develop when several mutations of the genes contributing to cancer are accumulated. With the recent developments in high-throughput DNA sequencing technology more novel mutations are expected to be discovered. In particular, mutations are more frequently observed in cancer tumors due to the occurrence of many passenger mutations during the process of carcinogenesis or tumor progression as well as driver mutations. A multitude of protein-coding sequence variations (CVs) in the human genome have been revealed as a result of major initiatives including the Human Variome Project, 1000 Genomes Project, and the International Cancer Genome Consortium. This naturally has led to debate on how to accurately assess the functional consequences of CVs. Therefore, prioritizing a variant according to its potential deleterious effect and relevance to disease phenotypes is becoming increasingly essential. Although many computational methods have been developed for this aim, the prediction performance still needs to be improved. Previous methods did not use cancer gene information and gene-gene interactions, even though carcinogenesis may be attributed to the enrichment of mutations of several genes in certain important pathways and mutations of interacting proteins are likely to lead to similar disease phenotypes. Although different mutations may show a similar amount of change in the corresponding protein, the functional effects of the mutations can be diverse in the context of clinical phenotype or disease according to the relative importance of the target gene. One simple way to determine the importance of a certain gene regarding a pathological condition could be to utilize the protein`s interactions with known disease genes. It was previously shown that mutations of interacting proteins are likely to lead to similar disease phenotypes. By merging a network of known cancer genes with human protein-protein interactions and calculating a level of closeness with cancer genes, we sought to measure the importance of a particular gene with regard to possible association with cancer. In this work, we constructed a disease gene network and proposed an ensemble approach to integrating diverse sources to interpret and predict the functional effect of missense variants on the network. The method utilizes predicted scores of existing predictors, protein-protein interactions, known cancer genes in OMIM, and tissue expression profiles. The results showed successful improvement of prediction accuracy, and we demonstrated the utility of the method by applying it to somatic mutations obtained from colorectal and breast cancer tissues. The genes with the predicted deleterious mutations were found to be significantly enriched in many KEGG pathways related to carcinogenesis (corrected P < 0.05). In addition, the breast cancer specific network increased the prediction accuracy for breast cancer mutations. This study suggests that mutations affecting a certain phenotype such as cancer may occur in important pathways and should be interpreted in the context of the phenotype-related network or pathway. The integrative approach will hold promise for identifying the causal genetic variation of cancer based on each patient`s genetic profile and offer a basis for personalized treatment for human cancers.

암은 유전성 질환이다. 종양 억제 유전자(tumor-suppressor gene), 종양 유전자(oncogene), 안정성 관련 유전자(stability gene) 등의 유전적 변형(alteration)은 성장 신호에 있어 자기충분성(self-sufficiency in growth signal), 항성장 신호에 대한 둔감성(insensitivity to anti-growth signal), 세포사멸 회피(evading apoptosis), 혈관신생 지속(sustained angiogenesis), 무한 복제 잠재성(limitless replicative potential), 조직 침윤(tissue invasion), 전이(metastasis)와 같은 암의 특징을 야기할 수 있다. `운전자` 돌연변이(driver mutation)는 암 세포에 그러한 성장 이점을 기여하고 암의 진화 동안에 양성 선택(positively selected)되는 반면 `승객` 돌연변이(passenger mutation)는 세포 분화시 운전자 돌연변이와 함께 발생하지만 암의 성장에는 기여하지 못한다. 소수의 예외를 제외하고, 한 개의 단일 유전자 변이는 거의 암을 유발하지 않는다. 대신, 암에 기여하는 다수의 유전자 돌연변이가 축적되었을 때 암이 발생한다고 생각된다. 고효율 DNA 염기서열 기술의 발전은 인간 유전체의 DNA 염기서열을 빠른 시간 내에 대량으로 분석하는 것을 가능하게 함에 따라 수많은 새로운 돌연변이가 발견될 것으로 예측된다. 특히, 돌연변이는 암종양에서 더욱 빈번하게 관측되는데, 이는 정상세포를 암세포로 전이시키는 운전자 돌연변이뿐만 아니라 발암과정(carcinogenesis)에서 많은 승객 돌연변이가 발생하기 때문이다. 또한, Human Variome Project, 1000 Genomes Project, International Cancer Genome Consortium 등의 주요 프로젝트의 주도로 인해 인간 유전체의 단백질 코딩 서열 상의 대량의 변이가 발굴되고 있다. 이러한 대규모 발굴은 자연스럽게 발굴된 변이의 기능적 결과를 어떻게 정확하게 평가하는지에 관한 논의로 이어져왔다. 따라서, 변이가 미치는 잠재적 효과와 질환 표현형과의 연관성에 따라 변이를 빠르고 정확하게 구분하는 것은 매우 중요한 문제가 되었다. 이를 위하여 많은 예측 방법들이 개발되었지만, 여전히 예측 성능의 개선이 요구된다. 발암은 특정한 중요 생체경로에 속한 유전자들의 돌연변이의 집적에 기인하고 상호작용하는 단백질의 돌연변이는 유사한 질환 표현형에 영향을 미칠 가능성이 높음에도 불구하고, 기존의 방법들은 발암유전자 정보나 유전자 상호작용을 고려하지 않았다. 서로 다른 돌연변이가 각각의 해당 단백질에 유사한 정도의 변화를 일으킨다 하여도, 대상 유전자의 상대적 중요도에 따라서 임상적 표현형이나 질환의 맥락에서 돌연변이의 기능적 효과는 다양할 수 있다. 병리학적 상태와 관련하여 특정 유전자의 중요도를 결정하기 위하여 이미 알려진 질환 유전자와의 단백질 상호작용을 이용할 수 있는데, 상호작용하는 단백질의 돌연변이는 유사한 질환 표현형을 야기할 가능성이 높다는 것이 알려져 있다. 따라서, 알려진 암 유전자와 인간 단백질 상호작용을 결합하고 암 유전자와의 근접성을 계산함으로써 암과의 잠재적 연관성에 관한 특정 유전자의 중요도를 측정하고자 한다. 본 연구에서는 과오 돌연변이(missense variant)의 기능적 효과를 해석하고 예측하기 위하여 질병 유전자 네트워크를 구성하고, 다양한 자료를 통합하기 위한 앙상블 방법을 제안하였다. 제안된 방법은 기존 예측 방법의 예측치, 단백질 상호작용, OMIM에 등록된 암 관련 유전자, 조직 발현 프로파일 자료 등을 활용하였다. 실험 결과는 예측 정확도의 우수한 개선을 보여주었고, 직장암과 유방암 조직에서 발굴한 돌연변이에 제안된 방법을 적용함으로써 그 유용성을 검증하였다. 제안된 방법에 의해 유해한 영향을 끼칠 것으로 예측된 돌연변이를 포함한 유전자들은 발암과 관련되었다고 알려진 KEGG 경로에서 통계적으로 유의하게 집적되어 있었다(corrected P < 0.05). 또한, 유방암 특이 네트워크의 적용은 유방암 돌연변이의 예측 성능을 개선하였다. 본 연구는 암과 같은 특정 표현형에 영향을 미치는 돌연변이들은 표현형과 연관된 네트워크나 생체경로 상에서 해석되어야 함을 시사한다. 제안된 통합 분석 방법은 개별 환자의 유전 프로파일에 기반하여 원인이 되는 유전자 변이를 발굴함으로써 암의 개인 맞춤 치료를 위한 기초를 제공할 것이다.

서지기타정보

서지기타정보
청구기호 {DBiS 11009
형태사항 viii, 81 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 원홍희
지도교수의 영문표기 : Do-Heon Lee
지도교수의 한글표기 : 이도헌
수록잡지명 : "Comparative analysis of the JAK/STAT signaling through erythropoietin receptor and thrombopoietin receptor using a systems approach". BMC Bioinformatics, v.10. Suppl.1, S53(2009)
학위논문 학위논문(박사) - 한국과학기술원 : 바이오및뇌공학과,
서지주기 References : p.64-78
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서