서지주요정보
Dynamic modularity of functional categories associated with protein complexes in cellular processes = 세포기작에서 단백질복합체와 연관된 기능카테고리의 동적 모듈화에 대한 연구
서명 / 저자 Dynamic modularity of functional categories associated with protein complexes in cellular processes = 세포기작에서 단백질복합체와 연관된 기능카테고리의 동적 모듈화에 대한 연구 / Choong-Hyun Sun.
저자명 Sun, Choong-Hyun ; 선충현
발행사항 [대전 : 한국과학기술원, 2010].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8022045

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 10033

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

A living cell is a complex and dynamic system, where gene or protein activities, and its interactions (gene-gene, protein-protein, and protein-gene) exhibit various expression profiles and spatial compartmentalization in the level of transcription, post-transcription, post-translation. Understanding how the phenotypes and behaviors of cells are controlled is one of the major challenges in biological research. The responses of cells to genetic perturbations or environmental cues are controlled by functional modules. For the purpose of identifying the perturbed activities of functional modules, integrative method using gene expression profiles is often used in the field of bioinformatics. It is reported that functional module-based approaches represent more efficient performance than individual gene-based approaches. Previous study using Gene Ontology and KEGG pathways, however, create large list of annotations that make it difficult to derive consolidated information and often include over-generalized terms. The majority of Gene Set Enrichment Analysis (GSEA) approaches identify the differentially expressed functional modules under different conditions. Differential expressions-based approaches are not always significant change of functional modules. To improve these limitations, we need to employ the concrete and informative functional modules. In addition, functional module-based approaches must consider the differential expressions as well as the modular changes of functional modules. In this thesis, we developed two methods for understanding cellular processes under certain conditions: the composite function enrichment and the dynamic functional modularity analysis. The composite function enrichment using $\emph{apriori}$ association rules infers significant association between well characterized annotation terms such as functional modules. The interrelationship of annotation terms can be more clearly delineated by integrating protein complexes with biological pathways and Gene Ontology terms. The composite annotation sets of correlated functions and cellular processes for a given gene set can be identified in a more comprehensive and specified way by the employment of protein complex data together with GO and KEGG pathways as annotation resources. The dynamic modularity analysis (DFMA) identifies significant functional modules reflecting the dynamic change of correlated activities and differential expressions that are correlated with gene expression profiles under different conditions. A wide variety of functional modules covers protein complexes, Gene Ontology categories, KEGG pathways, transcription factor regulation, and microRNA regulations. DFMA of functional modules is performed by using the average difference of mutual information considering non-linear correlation of gene expression profiles. The dynamic modularity activities of functional modules emphasize the importance of modular correlation as well as the differential expression of ones. Applied to two glioblastoma expression datasets, the DFMA analysis results identified various patterns of both dynamic modularity (loss or gain of expression correlation) and differential expression (over- or under-expression of gene expression profiles) of functional modules. For examples, MCM complex, SNARE complex, and Condensin I-PARP-1-XRCC1 complex show significant dynamic modularity that can have complementary relationship with significant differential expression pattern. Main interest of our method is to identify altered organization and information flow of functional modules. This suggests that there is a wealth of unexploited information in these and other similar data sets available in human, and calls for reanalysis of sufficiently powered studies when more comprehensive gene-pair data is available.

살아있는 세포는 유전자, 단백질 활동, 그리고 이들의 상호작용 (유전자간, 단백질간, 단백질-유전자간 상호작용) 에 의해서 전사, 전사후, 번역후 수준에서 다양한 세포의 발현 패턴 및 세포 내 배치를 보여주는 복잡하고 다이나믹한 시스템이다. 세포의 표현형 및 행동이 어떻게 조절되는지를 이해하는 것은 생물학 연구의 큰 목표 중의 하나이다. 환경적 요인 혹은 유전자적 변동 (genetic perturbation)에 의한 세포의 반응은 세포의 기능 모듈 (functional module)에 의해서 조절이 된다. 기능모듈들의 변동된 행동을 동정하기 위해서는 유전자 발현 데이터 (gene expression profiles)를 이용한 통합방법이 이용되고 있고 기능모듈 기반의 방법이 개별 유전자 기반의 방법보다 더 효과적이라고 알려져 있다. 그러나 한가지 방법으로 Gene Ontology와 KEGG pathway를 이용한 이전 연구는 너무 많은 annotation list를 제공하거나 과도하게 일반화되어 있는 경향이 있다. 또 다른 방법으로 유전자셋 강화 방법 (gene set enrichment analysis)은 다른 조건하에서 기능모듈의 차별적 발현 (differential expression)만을 동정한다. 차별적 발현이 된 기능모듈만이 항상 의미 있는 기능모듈은 아니다. 이런 한계점을 개선하기 위해서는 더 구체적이고 정보적인 기능모듈이 필요할 뿐 아니라 기능모듈의 모듈적인 변화 또한 고려되어야 한다. 본 학위논문에서, 우리는 어떤 조건 하에서 발현된 유전자 혹은 단백질들이 작용하는 세포기작을 더 잘 이해하기 위한 두가지 방법론인 조합 기능 강화법 (composite function enrichment analysis) 과 다이나미 기능 모듈 분석법(the dynamic functional modularity analysis) 을 개발하였다. Apriori 알고리즘을 이용한 Composite function enrichment analysis은 기능모듈과 같은 특성화가 잘된 annotation terms 간의 중요한 연관성을 도출한다. Annotation terms간의 상화관계는 생물학적인 pathways와 Gene Ontology terms과 단백질 복합체 (protein complex)을 통합하여 보다 더 분명한 생물학적인 기능정보를 제공한다. 주어진 유전자 셋에 대한 세포기작 및 상관된 기능들의 composite annotation set이 단백질 복합체에 의해서 더 종합적이고 특이적으로 동정될 수 있게 한다. The dynamic modularity analysis (DFMA) 방법은 특정 조건 하에서 유전자 발현 데이터와 상관관계가 있는 차별된 발현뿐만 아니라 기능모듈의 다아나믹 변화를 나타내는 중요한 기능모듈을 동정한다. 이 방법은 단백질 복합체, Gene Ontology categories, KEGG pathways, 전사조절자의 의한 조절셋, and microRNA 에 의한 조절셋 등과 같은 다양한 종류의 기능 모듈들에 대해서 상호정보(mutual information)을 평균 차이값을 이용하여 분석된다. 기능모듈들의 다이나믹 모듈행동은 모듈화 상관성과 차별화된 발현 모두를 고려하여 분석한다. 본 논문연구에서는 두 개의 뇌암 유전자 발현 데이터셋을 이용하여 DFMA에 적용하였고 그 결과는 기능모듈의 모듈변화 (loss or gain of expression correlation) 분석은 차별화된 발현 (differential expression of functional modules)과 다른 결과를 보여주었다. 그 예로, RC complex during G2/M phase of cell cycle 단백질 복합체와 WINAC 단백질 복합체는 differential expression에서 동정되지 않았던 통계적으로 의미 있는 모듈변화를 보여주었다. 이들 단백질 복합체는 세포주기 (cell cycle)를 조절하는 기능을 수행하는 것들로 이 기능모듈의 변화로 인한 세포의 암화가능성을 고려해 볼 수 있다. 또한, SNARE complex 단백질 복합체는 두 뇌암 데이터셋에서 동시에 의미 있는 모듈변화를 보여준 복합체로 동정되었다. 이 단백질 복합체는 신경세포들의 막 융합 (membrane fusion)에 기능을 수행하는 역할을 담당하고 있다. 본 논문에서 제안한 방법은 인간 유전체 및 단백질체 연구에서 아직 중요하게 언급되지 않은 중요한 기능모듈을 제시하며 보다 종합적으로 유사한 유전체 발현 데이터 연구를 가능하도록 할 수 있음을 보여준다.

서지기타정보

서지기타정보
청구기호 {DCS 10033
형태사항 vi, 114 p. : 삽도 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 선충현
지도교수의 영문표기 : Gwan-Su Yi
지도교수의 한글표기 : 이관수
수록잡지명 : "COFECO: Composite Function Annotation Enriched by Protein Complex Data". Nucleic Acids Research, 37, W350-W355(2009)
수록잡지명 : "DynaMod: Dynamic Functional Modularity Analysis". Nucleic Acids Research, 38, in press(2010)
학위논문 학위논문(박사) - 한국과학기술원 : 전산학과,
서지주기 References: p. 96-107
주제 protein complex
dynamic modularity
microarray
enrichment
functional module
단백질 복합체
동적 모듈화
마이크로어레이
강화
기능모듈
QR CODE qr code