서지주요정보
Molecular scale simulations of protein folding for post-genomic applications = 단백질 폴딩 현상에 대한 분자 수준의 해석 연구
서명 / 저자 Molecular scale simulations of protein folding for post-genomic applications = 단백질 폴딩 현상에 대한 분자 수준의 해석 연구 / Seung-Yup Lee.
저자명 Lee, Seung-Yup ; 이승엽
발행사항 [대전 : 한국과학기술원, 2005].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8016547

소장위치/청구기호

학술문화관(문화관) 보존서고

DCBE 05011

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

From sequence information, protein chains are organized into native topology to maintain biological functions. To understand protein folding mechanism remains the essential challenge in structural biology although numerous studies have been performed. It may result from the fact that protein residue motions are strongly governed by incredibly complicated physicochemical interactions directly generated by sequence information. However, if fundamental questions how sequence information codes native state topology and which interaction plays a critical role in determining folding pathways are fully solved, we will make the great progress on many fields: to predict unknown structures from sequence, to design proteins from given structures, and to synthesize new medicine which has a specific biological function. The funnel-like energy landscape theory suggested that naturally evolved protein chains are organized into secondary and tertiary structures compatible to native state via their energy landscape similar to funnel shape toward native basin with rugged surfaces. Of interest, it is found that native interactions existing in native topology substantially contribute to the folding kinetics, stability, and mechanisms of small proteins; many theoretical, computational, and experimental data have supported the importance of native interactions. Nevertheless, several proteins of which folding mechanisms are greatly determined not by native topology but by sequence-specific interactions. In this study, the folding mechanisms of 3 proteins which are mainly governed by different factors are investigated by using molecular scale over-damped Langevin simulations where physical effective energy function (EEF) weakly buttressed to $G\bar{o}-like$ energy is employed to fully realize the folding native contact map of TSE (transition state ensemble) shows that folding nuclei of protein G are mainly distributed in the C terminal β hairpin while protein L conspires to have folding nuclei in the N terminal β hairpin. In addition, there is no significantly populated contact between residues in the α helix. Since the formation of α helix is strongly related to subtle difference of free energy, physical EEF is needed to correctly reflect the asymmetric formation of one β hairpin which stabilizes other parts and the late formation of a helix. The native contact maps of two proteins exactly show the same structural heterogeneity predicted in experimental φ value data. By evaluating roles of two different energy functions, it is concluded that two different energy terms are needed to completely realize the features of folding funnel because physical EEF is not accurate enough to be responsible for overall folding propensities yet. It is also found that the burial of hydrophobic residues plays a critical role in determining the overall folding reaction of protein G whereas both local secondary structure propensity and hydrophobic interaction substantially contribute to the folding mechanism of protein L. The non-native α/β transition occurred in the folding of β-lactoglobulin is not observed here. The folding mechanism of α spectrin SH3 domain is also investigated to validate the suggested hybrid model; the structural formation and folding propensities are successfully reproduced here. The folding nuclei are distributed in the distal β hairpin and diverging β turn, which makes two parts formed early and stable once ordered. This result is completely consistent with the prediction of simple $G\bar{o}-like$ model and experimental data. Moreover, the importance of hydrophobic interaction is confirmed by performing reduced model simulations. Although the folding mechanism of α spectrin SH3 domain is strongly robust on native topology, it is observed that the physical EEF which is balanced as a major role suffices to correctly distinguish the folding pathway of this structurally related protein among conformational folding space. The hybrid model provides useful tools for investigating folding mechanism of small proteins which is mainly determined either by complicated sequence-specific details or by native interactions.

포스트 게놈 시대를 맞이해 많은 양의 생물학적 정보가 여러가지 다양한 방법을 통해 빠른 속도로 밝혀지고 있는 반면에, 얻어진 정보를 분석하고 응용하는 연구는 그 속도를 따라가지 못하고 있다. 특히 단백질에 관한 연구의 경우, 막대한 양의 네이티브(native)와 뮤턴트(mutant)상태에 대한 시퀀스(sequence)정보와 구조는 밝혀지고 있지만, 시퀀스 정보가 어떤 상호작용으로 단백질의 네이티브 구조를 형성하게 하는 것에 대해서는 최근까지의 많은 노력에도 불구하고 밝혀진 것이 미비하다. 단백질 구조를 형성하는 과정인 폴딩 현상(protein folding)은 단백질 분자간의 상호작용과 단백질 기능에 직접적인 연관관계가 있기 때문에 이를 해석하고 이해하는 것은 새로운 기능을 가지는 단백질 제조, 알려져 있지 않은 단백질 구조 디자인, 나아가서는 신약 개발등과 같은 분야를 위해서도 필수적이므로 많은 연구가 진행 중이다. 단백질에 관련된 현상은 실험적인 방법만으로는 얻을 수 있는 정보가 제한적이기 때문에 보다 정확하게 단백질 분자의 거동을 관찰하기 위해서는 계산학적 방법이 반드시 필요하다. 에너지 랜드스케이프(energy landscape)이론에 따르면 단백질은 울퉁불퉁한 폴딩 에너지 길을 따라 여러 불안정한 상태를 거쳐 최종적으로 안정된 네이티브 구조를 형성한다. 흥미롭게도 최근의 이론적, 실험적 연구를 통하여 단백질의 3차구조에 존재하는 네이티브 상호작용(native interactions)이 작은 단백질의 폴딩 키네틱스(kinetics), 안정성(stability), 그리고 메커니즘(mechanisms)에 가장 중요한 역할을 한다는 것이 밝혀졌다. 하지만 단백질의 폴딩 작용이 네이티브 상호작용만으로는 설명이 되지 않고 시퀀스 효과가 큰 영향을 미치는 새로운 단백질이 발견되었다. 시퀀스 효과는 매우 복잡한 물리 화학적 작용으로 이루어져 있으므로 이를 정확하게 고려해 주는 것은 어렵지만 이러한 단백질의 거동을 예측하기 위해서는 시퀀스 정보가 만들어내는 작용에 대한 해석은 반드시 필요하다. 본인의 박사 학위 연구에서는 시퀀스 상호작용의 영향을 강하게 받는 2종류의 단백질 (IgG binding domain of protein G and protein L)과 네이티브 상호작용의 영향을 받는 1종류의 단백질 (α spectrin SH3 domain) 의 폴딩 현상을 over-damped Langevin dynamics를 사용하여 분자수준의 해석 연구를 수행했다. Protein G와 Protein L은 네이티브 상태에서 같은 대칭구조를 가지고 있지만 폴딩 메커니즘은 반대이다. 특히 구조 대칭성이 폴딩 과정동안 전혀 지켜지지 않는 것이 실험을 통해서 발견되었는데 이 단백질의 폴딩 현상은 대부분의 단백질 폴딩 현상을 예측 할 수 있는 네이티브 상호작용만을 고려한 해석으로 예측 할 수 없다. 그러나, α spectrin SH3 domain의 폴딩 메커니즘 및 키네틱스는 네이티브 상호작용으로 해석이 가능하다. 따라서 본 연구에서는 서로 다른 시퀀스 효과 및 네이티브 상호작용으로 인해 안정한 구조로 폴딩이 이루어지는 서로 다른 단백질에 대해서 폴딩 현상을 자세하게 조사하였다. 시퀀스 효과를 직접적으로 고려하기 위한 물리화학적 에너지(physical EEF)가 폴딩을 결정하는 중요한 인자로 고려되었고, 네이티브 상호작용을 위한 $G\bar{o}-like$ 에너지는 주어진 시간 내에 폴딩 현상을 완료시키고 폴딩 에너지 길에 셀 수 없이 존재하는 키네틱 함정(kinetic trap)을 피하기 위해서 가장 최소한의 영향을 미치도록 역할이 조정되었다. 물리화학적 에너지 함수는 단백질 데이터베이스에 저장되어 있는 구조데이터를 이용해서 구했다. 이를 위해서 구조정보를 처리할 수 있는 데이터 해석기법, 단백질 폴딩 현상을 모사할 수 있는 적절한 모델의 구성과 해석 방법 개발, 그리고 다양한 분자 수준의 계산학적 기법을 사용하였다. 특히 열역학적인 특성을 계산하기 위해서 병렬 프로그래밍을 이용한 온도 REM(replica exchange method)을 사용했다. 단백질 폴딩 현상은 외부 환경 특히 온도에 큰 영향을 받는다. 따라서 본 연구에서도 적합한 폴딩 온도를 찾기 위해서 많은 계산을 수행했다. Protein G의 경우 낮은 온도 ($T = 0.65T_F$) 에서는 단백질 분자가 폴딩 되는 과정 동안 자주 잘못된 폴딩 루트(route)로 빠지는 것이 관찰되었다. 이는 잘못된 폴딩 구조도 네이티브 상태와 구조가 거의 유사하기 때문이다. 그에 비해서, 높은 온도 ($T = 1.2T_F$) 에서는 단백질 분자가 과도한 엔트로픽(entropic) 에너지를 가지게 되어 네이티브 상태로 도달하지 못한 채 부분적인 폴딩/언폴딩을 반복하였다. 적당한 폴딩 온도란 주어진 시간 내에 네이티브 상태로 폴딩이 될 뿐 아니라 폴딩 루트에 존재하는 키네틱 함정을 효과적으로 빠져 나올 수 있을 만큼의 충분한 에너지를 가질 수 있게 하는 온도이다. 다양한 조건에서 많은 계산 결과 위의 조건을 만족시키는 적정한 폴딩 온도를 각각의 단백질에 대해서 찾을 수 있었다. Protein G의 폴딩에서는 C terminal β hairpin 이 먼저 형성되고 일단 형성이 되면 안정적인 상태를 유지하는 것이 관찰되었다. RMSD 값을 통해서도 C terminal β hairpin 이 먼저 형성이 되고 폴딩 되는 과정 중에도 안정하다는 것이 예측되었다. 이런 비대칭적 폴딩 경향은 실험적인 φ value analysis예측의 경향성과 일치한다. β hairpin은 2개의 β strands가 turn에 의해서 결합되어 있는 형태인데, 2개의 β turn의 안정성을 계산해 본 결과 C terminal β turn이 훨씬 더 구조적 변동 없이 안정적으로 폴딩된다는 것이 계산되었다. 즉 C terminal β hairpin이 N terminal β hairpin보다 빨리 생성되고 안정적으로 되는 것에는 β turn의 역할이 크다는 것을 확인했다. 또한 네이티브 상태에서 중간에 위치한 α helix는 폴딩되는 과정동안 불안정한 상태를 유지하여 늦게 네이티브 상태로 도달하는 것이 예측되었다. 이는 실험적으로 예측한 것과 정확하게 일치하는 것이다. Protein G와 비슷한 네이티브 구조를 가지는 protein L 폴딩의 경우에는 protein G의 경우와 정반대의 폴딩 경향성이 계산되었다. Protein L의 경우에는 먼저 형성되어서 안정적인 구조를 유지하는 것이 C terminal β hairpin이 아니라 N terminalβ hairpin이다. 이는 실험적인 방법에서 예측한 것과 정확하게 일치한다. 이 경우에도 N terminal β turn이 중요한 역할을 하는 것이 관찰되었다. 실제로 네이티브 상호작용만을 고려하는 $G\bar{o}-like$ 모델을 사용해서 해석할 경우 비슷한 네이티브 구조를 두 단백질이 공유하기 때문에 서로 비슷한 네이티브 상호작용이 발생되기 때문에 이와 같이 서로 반대되는 단백질 폴딩 현상을 구분해 내기가 어렵다. 또한 이런 차이점은 두 단백질을 구성하는 아미노산 사이의 서로 다른 상호작용의 영향이 크기 때문에 이런 단백질의 폴딩 현상을 구분해 내기 위해서는 시퀀스 효과를 반영 할 수 있는 물리화학적 에너지 함수가 필수적으로 고려되어야 한다는 것을 확인할 수 있다. α helix의 경우는 protein G와 마찬가지로 폴딩되는 과정동안 여러가지 불안정한 구조를 가지다가 아주 늦게 네이티브 구조를 형성하는 것이 관찰되었다. 두 단백질에서 관찰되는 이런 불안정안 α helix의 거동도 미묘한 자유에너지의 차이로 발생된다고 알려져 있는데 이를 위해서도 네이티브 상호작용뿐 아니라 물리화학적인 에너지 함수에 대한 고려가 반드시 필요하다. 온도 REM과 WHAM을 이용해 자유에너지와 나머지 열역학적 계산을 수행 한 결과 두 단백질 모두 two-state 폴딩 특징을 나타내는데, protein G의 경우 아직까지 완전히 그 존재가 밝혀지지 않은 intermediate와 연관이 있을 수 있는 표시가 자유에너지 계산에서 나타났다. 이 계산을 기초로 하여 전이상태(transition state)의 구조를 계산하였는데, 실험적인 φ value 결과와 정확히 일치하였다. 즉 네이티브 구조와 디네이쳐(denatured) 구조 사이를 규정짓는 전이상태에서는 protein G 와 protein L 모두 두개의 β hairpin중 하나만 잘 형성이 되고 나머지는 불안정한 상태를 보인다. 전이상태에서 잘 형성이 되어서 나머지 부분들의 형성을 유도하고 안정화 시켜주는 부분이 protein G에서는 C terminal β hairpin이고 protein L에서는 N terminal β hairpin이다. 위의 두 단백질의 폴딩 현상과는 다르게 네이티브 상호작용을 강하게 받는 α spectrin SH3 domain의 경우에도 본 폴딩 해석 결과 우선적으로 생성되어 안정화되는 부분은 distal β hairpin과 diverging β turn이다. 이는 폴딩 nuclei가 이 부분에 집중적으로 분포되어서 먼저 형성된다고 한 실험적 결과 및 $G\bar{o}-like$ 모델에서 예측한 결과와 정확하게 일치한다. 따라서 시퀀스 효과를 위해서 고려된 물리화학적 에너지 함수가 네이티브 상호작용의 영향을 강하게 받는 α spectrin SH3 domain 의 폴딩 경향과 특성도 정확하게 예측 해 낸다는 것을 확인하였다. 또한 이 단백질의 폴딩에서 중요한 역할을 차지한다고 알려진 소수성 단백질 분자들의 상호작용(hydrophobic interaction)의 중요성도 다시 확인하였다. 또한 물리 화학적 에너지와 네이티브 상호작용의 폴딩 현상에 대한 기여도에 관해서도 계산하였고, 마지막으로 protein G와 protein L의 폴딩에 가장 영향을 미치는 물리화학적 작용을 계산해 본 결과 protein G의 경우는 소수성 단백질 분자들의 상호작용이 가장 큰 역할을 하고 protein L의 경우는 소수성 상호작용뿐 아니라 시퀀스에 따른 구조적 제한(secondary structure propensity)도 폴딩 현상에 큰 영향을 준다는 것을 확인하였다.

서지기타정보

서지기타정보
청구기호 {DCBE 05011
형태사항 [ii], xiii, 162 p. : 삽도 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 이승엽
지도교수의 영문표기 : Do-Hyun Kim
지도교수의 한글표기 : 김도현
수록잡지명 : "Roles of physical interactions in determining protein folding mechanisms: molecular simulation of protein G and alpha spectrin SH3". Proteins: structure, function, and bioinformatics, v.55, pp. 128-138(2004)
학위논문 학위논문(박사) - 한국과학기술원 : 생명화학공학과,
서지주기 Includes references
주제 Molecular scale simulation
protein folding
sequence analysis
protein G/L
alpha spectrin $SH_3$
분자시뮬레이션
단백질 폴딩
시퀀스 분석
protein G/L
alpha spectrin $SH_3$
QR CODE qr code