서지주요정보
In silico method to design a new protein that exhibits higher thermostability and functional specificity = 높은 열안정성과 기능적 특이성을 주는 새로운 단백질을 설계하는 in silico 방법
서명 / 저자 In silico method to design a new protein that exhibits higher thermostability and functional specificity = 높은 열안정성과 기능적 특이성을 주는 새로운 단백질을 설계하는 in silico 방법 / Hae-Jin Kim.
발행사항 [대전 : 한국정보통신대학교, 2007].
Online Access 원문보기 원문인쇄

소장정보

등록번호

DM0000945

소장위치/청구기호

학술문화관(문화관) 보존서고

ICU/DS07-15 2007

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Protein engineering is the application of science, mathematics, and economics to the process of developing useful or valuable proteins. It is a young discipline, with much research currently taking place into the understanding of protein folding and protein recognition for protein design principles. Computational protein design algorithms seek to identify amino acid sequences that have low energies for target structures. While the sequence-conformation space that needs to be searched is large, the most challenging requirement for computational protein design is a fast, yet accurate, energy function that can distinguish optimal sequences from similar sub-optimal ones. Using computational methods, a protein with a novel fold has been designed, as well as sensors for un-natural molecules. Here we propose a new computational method named TargetStar as $\It{in silico}$ system for the protein design. Then we validate the prediction accuracy of the TargetStar through the statistical analysis on the results of TargetStar analysis. Finally we apply our TargetStar to the design of a new protein that gives higher thermostability and functional specificity. The proposed system TargetStar is an $\It{in silico}$ system that predicts the thermal stability of an input amino acid sequence. TargetStar defines five energy functions and their energy parameters that can assess the fitness of a given amino acid sequence to the native structure against decoy (non-native) structures. TargetStar views a protein as a system. To predict the thermal stability of a protein sequence, TargetStar implements an approximate partition function of a protein (i.e. a system) from the concept of partition function in statistical physics using the defined energy functions, and it calculates specific heat using the approximate partition function. All the macroscopic properties of a system such as the energy and specific heat can be calculated in terms of a partition function. To validate the prediction accuracy of TargetStar, we calculated respective $T_{f}$ values for 289 orthologous protein pairs from four hyperthermophiles and five mesophiles. Each protein pair contains one hyperthermophilc protein from the hyperthermophile and one mesophilic protein from the mesophile. Because hyperthermophiles contain intrinsically more thermostable proteins than the counterparts of mesophiles, we assumed that $T_{f}$ of the hyperthermophilic protein is higher than that of the mesophilic protein in each orthologous protein pair. Based on our assumption, 221 orthologous pairs satisfied the expected result among 289 orthologous pairs. According to the evaluation, hyperthermophilic and mesophilic proteins are distinguished from each other in terms of relative thermal stabilities with 77% prediction accuracy. To identify the industrial applicability of TargetStar, we applied TargetStar to design a new protein that exhibits higher thermostability and functional specificity at the same time based on the ankyrin repeat motif. Protein stability, especially thermostability is very useful in biotechnology and its real applications while proteinprotein interaction is important to find out a new function of a target protein. One of the most commonly occurring repeats is the ankyrin (ANK) repeat, a 33-residue sequence motif found in proteins with diverse functions, such as transcription initiation, cell cycle regulation, cytoskeletal integrity, ion transport, and cell-cell signaling. Ankyrin repeat proteins mediate innumerable protein-protein interactions in virtually all phyla. Ankyrin repeat is a good template or building block for protein engineering and design studies. We retrieved and analyzed 28,000 ankyrin sequences from the PFAM database, and searched for the template sequence that will give higher thermostability by using the in silico thermostability prediction system. From the results of thermostability analysis, we screened to pick up a template sequence. We combined a certain protein function into the template ankyrin repeat sequence to design an ankyrin repeat protein with a desired functional specificity and thermostability. This idea is based on a fact that all ankyrin repeat proteins are characterized by consecutive homologous structural units (repeat). As a target function, we selected human tumor suppressor p16, one of the smallest ankyrin repeat proteins with a known structure. The p16 consists of four ankyrin repeats and interacts with Cdk6, Cdk4, NFkB and Tax. The specific residues of p16 having a central role in Cdk6 binding were previously determined by X-ray crystallography. Therefore, we constructed a four ankyrin repeat protein (S1_4ANK) using the template sequence and performed sequence alignment of p16 and S1_4ANK using T-coffee. From the substitution of the corresponding residues of S1_4ANK by the specific residues of p16, we made a final candidate sequence that is expected to give the function in Cdk6 binding as well as higher thermostability. As a further study, we hope to verify the result of our in silico protein design through the biochemical experiments. We expect that the biological experiments will show that the designed ankyrin repeat protein has functional specificity to bind specifically with Cdk6 as well as 30% higher thermostability than that of the related work.

단백질-단백질 상호작용은 표적 단백질의 새로운 기능을 찾아내는데 아주 중요 하고 단백질 열안정성은 생명공학의 실제 응용에 아주 유용하다. 더 높은 열안정성 또는 기능적 특이성을 제공하는 새로운 단백질을 설계하기 위하여 컨센서스 (concensus) 기반 단백질 공학 기법이 많이 사용되어왔다. 지금까지 단백질 설계 연구에서는 33 개의 잔기로 이루어진 반복 서열 모티프인 안키린 리피트(ankyrin repeat)를 많이 사용했으며, 수없이 많은 단백질-단백질 상호작용을 중재한다. 안키린 리피트는 단백질 공학과 설계 연구를 위한 좋은 모형 또는 건축 블록이다. 본 연구에서는 먼저 내열성 단백질 설계를 위한 새로운 계산적인 방법인 TargetStar 를 제시하고 TargetStar 의 내열성 단백질 설계를 위한 예측이 얼마나 정확한지를 검증하였고, 마지막으로 TargetStar 와 단백질-단백질 상호작용 정보를 이용하여 더 높은 열안정성과 기능적 특이성을 제공하는 새로운 단백질 설계함으로써 TargetStar 의 응용 가능성을 제시하였다. TargetStar 는 입력으로 들어온 아미노산 서열의 열적 안정성을 예측하는 생물정보($\It{in silico}$) 시스템이다. TargetStar 는 5 개의 에너지 함수와 이들의 에너지 매개변수를 정의하고 이들을 통해 주어진 아미노산 서열이 가짜(비자연) 구조에 대비해서 자연상태 구조에 얼마나 적합한지를 평가한다. TargetStar 는 하나의 단백질을 하나의 시스템으로 본다. 하나의 단백질의 열적 안정성을 예측하기 위하여 TargetStar 는 정의된 에너지 함수를 이용하여 통계물리학의 분배함수(partition function) 개념을 적용하여 단백질(즉, 하나의 시스템)의 근사분배함수(approximate partition function)를 구현한 다음 그 근사분배함수를 이용하여 비열(specific heat)을 계산한다. 통계물리학에서는 분배함수만 있으면 특정 시스템의 에너지와 비열과 같은 모든 거시적 양 들은 계산해 낼 수 있다. TargetStar 의 예측 정확도를 검증하기 위하여 본 연구에서는 4 개의 초고온성 미생물(hyperthermophiles)과 5 개의 중온성 미생물(mesophiles)로부터 나온 289 개의 오소로구스(orthologous; 종분화 동안 공통 조상의 유전자로부터 유래된, 서로 다른 종에서 상동성을 가지는 서열) 단백질 쌍들을 위한 각각의 접힘 전이 온도(folding transition temperature) 값 $T_{f}$를 계산하였다. 각 단백질 쌍은 초고온성 미생물에서 나온 하나의 초고온성 단백질과 중온성 미생물에서 나온 중온성 단백질을 가진다. 초고온성 미생물들은 태생적으로 중온성 미생물의 단백질 보다 열적으로 안정된 단백질을 더 많이 가지고 있기 때문에 본 연구에서는 초고온성 단백질의 접힘 전이 온도 $T_{f}$ 는 각 오소로구스 단백질 쌍에 있는 중온성 단백질의 접힘 전이 온도 보다 높다고 가정하였다. 이러한 가정에 근거하여 289 개의 오소로구스 쌍들 가운데 221 개의 오소로그스 단백질 쌍들이 기대한 결과를 만족하였다. 이러한 결과로부터 TargetStar 는 단백질의 아미노산 서열만 가지고도 상대적 열적 안정성의 관점에서 초고온성 단백질과 저온성 단백질을 77%의 정확도로 구분할 수 있다는 것을 확인하였고 이 결과는 내열성 단백질 설계를 위한 생물정보학적 가능성을 열어주었다. 또한 본 연구에서는 TargetStar 의 산업적 응용성을 알아보기 위하여 안키린 리피트 단백질을 기반으로 더 높은 열안정성과 기능적 특이성을 주는 새로운 단백질을 실제로 설계하였는데, 열안정성을 높이는 일은 TargetStar 를 이용하였고, 기능적 특이성을 높이는 일은 PPI 방법을 사용하였다. 이렇게 설계된 단백질이 실제로 원 하는 특성을 보이는지 확인하기 위한 생물학 실험도 진행되고 있어 추후 연구에서77%의 예측 정확도를 입증할 실험 결과가 나올 것으로 기대된다.

서지기타정보

서지기타정보
청구기호 {ICU/DS07-15 2007
형태사항 xi, 115 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 김해진
지도교수의 영문표기 : Dong-Soo Han
지도교수의 한글표기 : 한동수
학위논문 학위논문(박사) - 한국정보통신대학교 : 공학부,
서지주기 References : p. 103-112
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서