서지주요정보
Protein functional sites prediction based on the evolutionary information = 진화정보를 이용한 단백질 기능 잔기 예측에 관한 연구
서명 / 저자 Protein functional sites prediction based on the evolutionary information = 진화정보를 이용한 단백질 기능 잔기 예측에 관한 연구 / Byung-Chul Lee.
저자명 Lee, Byung-Chul ; 이병철
발행사항 [대전 : 한국과학기술원, 2009].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8020737

소장위치/청구기호

학술문화관(문화관) 보존서고

DBiS 09007

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

It is common belief that a few residues in a protein are important for its function and structure. Furthermore, these sites are usual targets to the protein engineering modifying or improving the functions of the protein. All proteins belong to a protein family, which have similar structure and sequence homology. From this concept, highly conserved sites are considered to be important as a result of natural selection. If those sites are mutated, the fitness of the protein dramatically drops, and protein sequences may be extincted in a gene pool. In other cases, hypervariability is observed in the bindining interface residues of the proteins which have diverse binding parters. Besides conservation and hypervariation, correlated mutation has been another important evolutionary information. Diverse studies have shown that correlated mutation (CM) is an important molecular evolutionary process. However, attempts to find the coevolving residue pairs under the structural and/or functional constraints are complicated by the fact that a large portion of covariance signals found in multiple sequence alignments are from correlations due to sharing common ancestry and stochastic noises. In this thesis, we develop a method to verify the functional sites from sequence information. Motivated by the correlated mutation, the residue-residue coevolution network (RRCN) analysis is developed. RRCN is an network whose nodes are residues and links are set when the coevolutionary interaction strengths between residues are sufficiently large. After constructing the RRCN, we identify residues that have high degree of connectivity and residues that play a central role in network flow of information. These residues are likely to be functionally important residues. Since this method is based on the coevolution and network analysis, the development of more accurate CMA algorithm is required. Assuming that the background noises can be estimated from the coevolutionary relationships among residues, we propose a new measure for the background noises named the normalized coevolutionary pattern similarity (NCPS) scores. By subtracting NCPS scores from the raw CM scores and combining with entropy factor, we show that our new scores effectively detect the residue pairs under the structural constraints and is successfully applied to double mutant cycle experiments and protein-protein interaction. These results sugget that coevolution would be a valuable tool to study protein functions and sequences.

같은 패밀리에 속하는 단백질들은 비슷한 구조와 기능을 가지게 되는 것이 보통이다. 중립진화이론에 따르면 자연선택에 따라 구조 또는 기능에 좋지 않은 영향을 미치는 돌연변이들은 사라지게 되지만 보통의 돌연변이들은 적응도(fitness)에 큰 영향을 미치지 못하기 때문에 남아있게 된다. 이러한 자연선택압력차이의 결과로 다중서열상에서 보존된 지역이 나타나게 된다. 이와 별도로 또다른 자연 선택의 결과로서 다양한 상호결합을 하는 단백질의 경우에는 보존지역과는 반대로 극심한 변화가 나타나게 된다. 이러한 보존과 극심한 변화와 함께 공진화(coevolution) 역시 같은 패밀리에 속하는 단백질에서 나타나는 중요한 진화정보가 된다. 이제까지의 많은 연구들에서 공진화가 중요한 정보라는 것이 밝혀져왔다. 하지만 구조적인 또는 기능적인 진화압력때문에 나타나는 공진화를 밝히는 것은 실제적으로 쉽지 않다. 왜냐하면 다중서열정렬에서 관찰되는 공진화 현상은 앞에서 말한 진화압력때문만이 아니라 계통수에서 나타나는 공통조상을 공유하는 데서 오는 신호들과 임의로 나타나는 공진화신호들이 합쳐서 나타나기 때문이다. 이 연구의 목적은 단백질에서 나타나는 고유의 기능잔기들과 서열정보로부터 계산 하는 공진화점수들을 어떻게 분석하고 그 결과 어떤 상관관계를 가지는지를 밝히는 것이다. 공진화에 대한 기존방법을 이용하여 네트워크를 구성하고 이를 통해 단백질서열정보로부터 기능잔기들과의 상관관계를 밝히고자 하였다. 이를 위하여 단백질 잔기를 네트워크의 노드로 하고 공진화분석에서 나오는 점수를 네트워크의 링크로 하는 Residue-residue Coevolution Network (RRCN)을 구성하였다. RRCN을 구성한 뒤에 degree와 information centrality 등의 네트워크성질을 분석하였다. 그 결과 이들 네트워크성질들이 단백질 기능잔기와 연관이 있는 것을 보일 수 있었다. 이 논문에서 제시한 RRCN방법은 공진화분석과 네트워크 분석이 기본이 되기 때문에 좀 더 정확한 공진화분석방법이 필요하다. 그리고 공진화와 기능잔기와의 심층적인 상관 관계 분석을 위하여 기존에 사용되는 공진화분석방법에서 나타나는 계통수신호와 임의신호 등을 제거하는 공진화잡음제거방법 또한 제시하고 corrected correlated muation 방법 (CMc)이라 명하였다. 이렇게 제시한 방법을 통해 단백질 상호작용이나 이중점돌연변이 실험에서 나온 에너지 변화가 기존의 공진화분석의 결과보다 더 잘 설명이 되는 것을 볼 수 있었다. 단백질 서열로부터 공진화라는 진화정보를 통해 네트워크를 구성하여 단백질 기능 잔기와의 상관관계를 분석하는 연구를 통하여 공진화는 단백질의 기능을 연구하는데 중요한 정보라는 것을 다시 한 번 확인 할 수 있다.

서지기타정보

서지기타정보
청구기호 {DBiS 09007
형태사항 xii, 93 p. : 삽도 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 이병철
지도교수의 영문표기 : Dong-Sup Kim
지도교수의 한글표기 : 김동섭
수록잡지정보 : "Analysis of the residue??residue coevolution network and the functionally important residues in proteins". Proteins: Structure, Function, and Bioinformatics, v.72.no.3, pp.863-872(1986)
학위논문 학위논문(박사) - 한국과학기술원 : 바이오및뇌공학과,
서지주기 References : p. 81-89
주제 coevolution;covariation;correlated mutation analysis;multiple sequence alignment;protein
공진화;분자진화;단백질;서열분석;다중서열정렬
QR CODE qr code