서지주요정보
Analysis of evolutionary association between protein residues = 단백질 잔기 사이의 진화적 연관성 분석
서명 / 저자 Analysis of evolutionary association between protein residues = 단백질 잔기 사이의 진화적 연관성 분석 / Chan-Seok Jeong.
발행사항 [대전 : 한국과학기술원, 2012].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8023406

소장위치/청구기호

학술문화관(문화관) 보존서고

DBiS 12003

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

The cooperative mechanism between interconnected residues plays a critical role in protein functions, but the evolution of proteins has been studied primarily by focusing on evolutionary changes at an individual position such as substitution and conservation. Therefore, the detection of coevolving residues is increasingly important for identifying evolutionary association between individual residues and studying various biological functions of proteins. In this thesis, I develop a novel correlated mutation analysis method that shows substantially better prediction accuracy than all other methods. More importantly, the prediction accuracy of the novel method is insensitive to the quality of the multiple sequence alignments from which the correlated mutation scores are calculated. Thanks to this desirable property, not only it shows a good performance even for multiple sequence alignments automatically generated by sequence homology methodologies, but also its performance is consistently high on the columns of MSAs containing a high fraction of gaps, which greatly extends the applicability of the correlated mutation analysis. Additionally, I incorporate coevolution information for protein sequence alignment by representing correlated mutation information as paralleled form. When combined with conventional sequence profile, coevolution information improves alignment quality significantly better than predicted secondary structure information, which should be beneficial for target-template alignment in protein structure prediction. Last, I comprehensively investigate the distribution of coevolving residues for intrinsically disordered proteins, and reveal that the degree of coevolved residues significantly decreases in disordered regions regardless of the sequence propensity, and the degree distribution of coevolved and conserved residues exclusively differs in each functional category. Consequently, I accomplish the significant algorithmic improvement for the detection of coevolving residues and demonstrate the usefulness for both existing and newly-explored applications. The reliable and robust detection of evolutionary association between protein residues can effectively contribute to various biological studies.

단백질의 생물학적 기능에 있어서 단백질을 구성하는 아미노산 잔기 사이의 상호 작용은 매우 중요한 역할을 한다. 그러나 현재 많이 사용되는 단백질 서열 분석 방법들은 잔기 사이의 상호 연관성을 고려하지 않고 아미노산 치환이나 보존 양상만을 분석하는데 초점이 맞춰져 있다. 비록 잔기 사이의 진화적 연관성을 측정하기 위한 몇몇 방법이 개발되었지만, 기존의 방법들은 입력 데이터의 품질에 의해서 분석 정확도가 크게 영향을 받으며 응용성이 크게 떨어진다는 문제점이 있다. 그러므로 이 학위논문은 단백질 잔기 사이의 진화적 연관성 분석을 위한 효과적인 방법을 새롭게 제시하고 생물학적으로 중요한 응용연구들와 함께 그 유용성를 실증하고자 한다. 우선 단백질 잔기 사이의 진화적 연관성을 분석하기 위한 공진화 측정 방법을 개발하였다. 새로운 분석 방법은 서열 프로파일 정보를 이용함으로써 기존의 방법보다 공진화 측정의 정확성과 견고성을 상당히 개선하였다. 다음으로 공진화 정보를 표현하기 위한 선형예측 기반 표현 방법을 개발하고 이를 서열 정렬에 응용하였다. 기존의 공진화 정보는 단백질에 따라서 다른 차원수의 정보로 표현되기 때문에 서로 다른 단백질의 공진화 정보를 비교하기가 불가능하였으나, 선형예측 변환을 적용함으로써 서로 다른 단백질의 공진화 정보를 비교 가능한 동일한 차원수의 계수 정보로 표현할 수 있었다. 이를 단백질 서열 정렬에 적용한 결과, 공진화 정보는 서열 정렬 정확도를 의미있게 개선하였고 특히 서열 유사도가 낮은 단백질들을 비교하는데 효과적이었다. 마지막으로 잔기 사이의 진화적 연관성 정보가 알려지지 않았던 근본적으로 무질서한 단백질(intrinsically disordered protein, ID 단백질)에 대해서 체계적인 공진화 분석을 수행하였다. 그 결과, ID 단백질은 구조가 잘 정의되는 단백질과 비교했을 때 공진화 빈도가 낮게 나타남을 확인하였고, 공진화 정도와 ID 단백질의 기능 사이에 유의미한 관련이 있음을 알아냈다. 결과적으로 이 학위논문은 단백질 잔기 사이의 진화적 연관성을 분석하고 응용하기 위한 효과적인 계산적 방법들을 제시하였고 이를 바탕으로 새로운 응용연구들을 탐구하였다. 새롭게 개발된 방법은 기존의 분석 방법들보다 우수한 성능을 나타내고, 특히 입력 데이터의 품질에 의한 영향을 받지 않기 때문에 자동화된 분석 시스템을 구축하고 대용량 데이터를 분석하는데 효과적으로 이용될 수 있다. 또한 제시된 응용연구들은 잔기 사이의 진화적 연관성 분석이 단백질의 생물학적 기능 연구에 있어서 실질적으로 유용함을 보여주고 있다. 따라서 이 학위논문은 다양한 생물학 및 생물정보학 연구에 있어서 의미있게 기여할 수 있을 것이다.

서지기타정보

서지기타정보
청구기호 {DBiS 12003
형태사항 xiii, 115 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 정찬석
지도교수의 영문표기 : Dong-Sup Kim
지도교수의 한글표기 : 김동섭
수록잡지명 : "Linear predictive coding representation of correlated mutation for protein sequence alignment". BMC Bioinformatics, v.11 S2, S2(2010)
Appendix : 1, CMAT standalone software. - 2, CMAT web server.
학위논문 학위논문(박사) - 한국과학기술원 : 바이오및뇌공학과,
서지주기 References : p. 99-110
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서