서지주요정보
Identifying context-specific bio-networks through pathway activity profiling = 경로 활성도 프로파일링을 통한 상황 특이적 바이오 네트워크 발굴
서명 / 저자 Identifying context-specific bio-networks through pathway activity profiling = 경로 활성도 프로파일링을 통한 상황 특이적 바이오 네트워크 발굴 / Yeeok Kang.
저자명 Kang, Yeeok ; 강이옥
발행사항 [대전 : 한국과학기술원, 2015].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8028181

소장위치/청구기호

학술문화관(문화관) 보존서고

MBIS 15014

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Proteins play major roles in various cellular functions and biological activities so the expressions of proteins turn on or off depend on their contexts such as tissue localizations and disease states. Therefore, generic biological networks which do not consider any contexts have some limitations to reflect the real state of biology on its network. Indeed, identifying context-specific bio-networks is very important for studying context-specific biological activities or mechanisms. For constructing context-specific bio-networks, proteins which express in that context must be discovered. However, there are few previous study for detecting proteins that express in specific contexts. Some of previous researches used direct measurements of protein abundance in some healthy contexts or cancer types. Many of researches focus on improving correlation between mRNA and protein expression levels for inferring protein abundance through mRNA expression levels. There is rare previous researches to predict expressed proteins in several biological contexts. To solve these problems, we suggested approaches that identifying proteins that express in specific contexts through pathway activity profiling on the assumption that higher activities of a pathway, higher probability of protein expression of member genes because all proteins must express to function together in the pathway. The decision tree classifier with three features was suggested. These features, which are pathway activity profiles, mRNA expression levels and translation rates provide gene characteristics in specific contexts. mRNA expression levels were calculated from microarray data which covered large-scale biological contexts. Translation rates were suggested in the previous work for improving correlations between mRNA and protein expression levels. The classifier was generated by the training set containing 8 healthy contexts and evaluated by 3 healthy contexts and 6 cell lines. As results, the suggested classifier predicted expressed proteins in specific context even if that context was not considered in training. According to results of prediction from the suggested model, context-specific networks can be constructed. We used a protein-protein interaction network as a backbone and extracted the context-specific network which nodes are predicted proteins that express in the context. In this suggested approaches, expressed proteins in specific contexts can be predicted by using mRNA data and predicted proteins are valuable resource for construction of context-specific bio-networks.

단백질들은 생체 내에서 생체활성에 대해서나 분자들 사이에서 주요한 역할을 하고 있다. 이러한 단백질들은 그들이 위치한 조직이나 질병 상태 같은 상황에 따라서 발현이 되기도 하고, 되지 않기도 한다. 따라서 어떠한 상황도 고려하지 않은 포괄적인 네트워크를 분석하는 것은 실제 그 상황을 네트워크에 정확히 표현되지 않는 문제로 인하여, 특정 상황을 고려 해야 하는 연구에 대해서는 한계점을 가진다. 즉, 상황 특이적 바이오 네트워크를 발굴하는 것이 매우 중요하고, 그것은 많은 연구에 도움이 될 것이다. 이런 상황 특이적 바이오 네트워크를 발굴하기 위해서는 특정 상황에서 발현하는 단백질들을 알아야만 한다. 특정 상황에서는 그 상황에 필요한 단백질들이 발현 될 것이고, 이 단백질들을 이용하여 바이오 네트워크를 발굴한다면, 상황 특이적인 생물학적 상태를 그대로 반영한 네트워크를 찾을 수 있을 것이다. 하지만 상황 특이적 바이오 네트워크를 발굴하고자 하는 이전 연구들은 거의 존재하지 않다. 단백질의 발현 여부를 예측하는 연구는 크게 두 가지로 나눌 수 있다. 첫 번째 방법은 직접적인 실험을 통해 protein의 양을 측정하는 것이다. Mass-spectrometry나 immunohistochemistry 등 실험을 통하여, 해당 상황에서 각 단백질들의 발현량을 측정하여 해당 상황에서 발현되는 단백질들을 알아낸다. 하지만 지금까지 이 실험은 질병에 걸리지 않은 조직들과 몇 가지 암에 대해서만 진행이 되었다. 두 번째 방법은 mRNA 발현량을 통해 해당 단백질의 양을 추론하는 것이다. mRNA가 단백질로 만들어진다는 기존 가정 의해서 mRNA을 통해 단백질의 양을 추론하여 사용한다. mRNA를 측정할 수 있는 실험은 대표적으로 microarray와 RNA sequencing이 있다. mRNA를 측정하는 실험들은 다양한 상황에 대해서 수행되어 왔기에 다양한 상황에 대해 단백질 발현량을 예측하고자 할 때에는 적합하다. 하지만 mRNA 발현량과 단백질 발현량 사이의 관계는 정확히 밝혀지지 않았기 때문에 정확한 예측이 어렵다. 따라서 이 연구에서는 특정 상황 별 발현되는 단백질을 예측 하기 위해 경로 활성도 프로파일링을 수행 및 적용하였다. 이 연구에서는 한 경로의 활성도가 높아지면, 그 경로에 속한 유전자들이 역할을 하기 위해서 모두 필요하며, 그 유전자들의 활성도도 높아지므로, 유전자들에 해당하는 단백질이 발현이 될 확률이 높아진다는 가정을 세웠다. 이는, 어떤 경로에 속한 유전자들은 질병 상태나 그들이 위치한 조직 상태 혹은 다른 자극에 의해서 단체적인 행동을 보이므로, 유전자 각각을 분석하는 것보다 경로 수준에선 분석이 그들의 상황에서의 생물학적 활동들에 대한 더 직관적이고 안정적인 정보를 제공하기 때문이다. 따라서 경로 활성도 프로파일들은 상황 별 단백질 발현이 될 지 안 될지에 대한 확률 정보를 제공한다고 할 수 있다. 이 가정을 기반으로, 우리는 상황 별 발현되는 단백질들을 예측하는 분류 모델을 만들고, 예측된 단백질들을 이용하여 상황 특이적인 네트워크를 만드는 방법을 제안하였다. 결정 나무 모델을 이용한 분류기가 구축되었으며, 이때 사용된 정보는 경로 활성도 프로파일뿐만 아니라, mRNA 발현량과 이전 연구에서 제시한 mRNA별 번역 비율 값이 사용 되었다. 이 연구에서 특정 상황 별 발현 단백질을 예측하기 위해 제안된 모델에 대해 성능 평가를 진행한 결과, 이 모델은 모델 구축 과정에서 고려되지 않은 3개의 건강한 조직과 6개의 cell line, 총 9가지 상황 별 발현되는 단백질 예측을 잘 한다는 것이 확인 되었다. 그 후, 상황 특이적 바이오 네트워크를 발굴하는 과정을 거쳤다. 이때 사용된 바탕이 되는 네트워크는 단백질-단백질 상화작용 네트워크이다. 단백질-단백질 상호작용 네트워크를 기반으로 특정 상황에서 발현된다고 예측된 단백질들을 추출하여 해당 상황 특이적 바이오 네트워크 발굴을 완료 하였다. 이렇게 이 연구에서 제시된 과정을 통하여, mRNA 데이터만 있으면 상황 특이적인 네트워크를 발굴할 수 있고, 이 네트워크는 여러 가지 상황을 고려한 네트워크를 필요로 하는 많은 연구에 이용 될 수 있을 것이다. 특히, 질병이나 약물 메커니즘 연구를 위해 사용될 수 있을 것이며, 컴퓨터를 사용한 새로운 약물 예측 같은 연구 분야에도 사용될 수 있는 가능성을 가지고 있다.

서지기타정보

서지기타정보
청구기호 {MBIS 15014
형태사항 v, 47 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 강이옥
지도교수의 영문표기 : Kwang Hyung Lee
지도교수의 한글표기 : 이광형
Including Appendix
학위논문 학위논문(석사) - 한국과학기술원 : 바이오및뇌공학과,
서지주기 References : p.
주제 Context-specific bio-network
Protein expression
Pathway activity profiling
mRNA expression
translation rate
상황 특이적 바이오 네트워크
단백질 발현 여부
경로 활성도 프로파일링
mRNA 발현량
번역 비율
QR CODE qr code