Translation of Genome-wide expression into biological meaningful data is still challenging. Recent efforts have interpreted microarray data by using prior knowledge such as pathways. Even though pathway based gene expression analysis is widely used, all pathway level analysis methods utilize conventional pathways. However, it is not a proper to interpret microarray using conventional pathways, since conventional pathways consist of various interactions of signalling proteins and regulatory molecules. Therefore, we propose a new concept of pathways, Transcriptional Regulation Pathways (TRP), specifically design to capture the context specific transcriptional regulations for pathway level analysis in disease expression profiles. TRP consists of two parts, TF target genes and subset of pathway genes. Among TF target genes in database, we choose target genes whose expression correlates with TF by ARACNe which utilizes MI (Mutual Information). We select pathway member genes transcribed by TF in other pathways. Among those genes, we choose genes verified by ARACNe and Mapper algorithm which computationally searches for binding sites in promoter regions. We use Tian’s method for pathway level analysis. The results from Tian’s method provide that TRP shows better performance than normal pathways in the classification of Type 2 Diabetes and Lung cancer expression profiling. Our new proposed concept utilizes the trait of gene expression profiling so that it gives disease phenotype related pathways in pathway level analysis and good performance in cancer classification.
손쉽게 대량의 mRNA 정보를 얻을 수 있는 장점 때문에 마이크로어레이 데이터가 질병연구에 널리 사용되고 있다. 초기의 연구는 다르게 발현 되는 개개의 유전자들을 분석하여 질병을 이해하려고 하였지만 복잡한 질병의 특성상 해석 및 분석에 어려움이 많았다. 최근에는 생물학적으로 해석이 용이한 단백질 연결 네트워크 또는 생물학적 경로를 이용하여 마이크로어레이 데이터를 해석하려는 노력을 하고 있다. 많은 알고리즘들이 생물학적 경로를 기반으로 마이크로어레이를 연구하고 있는데, 이 모든 분석방법들은 기존의 우리가 알고 있는 일반 생물학적 경로를 사용하여 분석하고 있다. 하지만 생물학적 경로는 다양한 신호 전달 단백질들과 조절 물질들이 상호작용하고 있어서 이러한 생물학적 경로를 mRNA 양으로 해석하기에는 어려움이 있다고 생각하였다. 그래서 mRNA 창문으로 볼 수 있는 새로운 생물학적 경로가 필요하다고 생각하였고 본 연구에서는 전사조절경로(Transcriptional Regulation Pathways)라는 개념을 만들었다. 전사 조절 경로를 구성하기 위해서, 먼저 전사 조절인자를 갖는 생물학적 경로를 수집하였고, 이러한 257개의 일반적인 생물학적 경로를 질병 상황 특이적으로 전사조절경로로 재구성 하였다. 전사조절경로는 크게 전사 되는 유전자들과 생물학적 경로 안에 의 유전자로 이루어진다. 전사 되는 유전자들은 해당 생물학적 경로상에 전사 조절 인자와의 질병 상황 특이적인 의존도를 고려하여 이미 알려진 전사 되는 유전자들로부터 선택하였다. 생물학적 경로 안에 유전자들은, 먼저 전사 조절 인자가 붙는 위치를 예측해 주는 프로그램을 이용하여 조절 인자를 확인하였다. 그 다음 다시 그 전사 조절 인자와 생물학적 경로상의 유전자들의 의존도를 계산하여 전사조절 경로의 유전자를 결정하였다. 이렇게 구성된 전사조절 경로들을 경로 활성화 분석 알고리즘을 이용하여 이형 당뇨병과 폐암에서 분석한 결과 질병의 표현형에 따른 경로들을 잘 찾아 주었다. 저자들은 본 연구에서 고안한 전사조절경로를 정량적으로 비교하기 위해 활성화 행렬을 만들었고 이 활성화 행렬을 이용하여 분류기를 실행시켰다. 그 결과 전사 조절 경로를 사용하는 것이 일반 생물학적 경로를 이용하는 것보다 월등한 결과를 보여 주었다.