서지주요정보
MINERVA Plus: a prediction server for hot spots in protein binding interfaces = 미네르바 플러스: 단백질 상호작용면의 핫스팟 예측 서버
서명 / 저자 MINERVA Plus: a prediction server for hot spots in protein binding interfaces = 미네르바 플러스: 단백질 상호작용면의 핫스팟 예측 서버 / Seong-Taek Oh.
저자명 Oh, Seong-Taek ; 오성택
발행사항 [대전 : 한국과학기술원, 2012].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8023641

소장위치/청구기호

학술문화관(문화관) 보존서고

MBiS 12002

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Hot spots are a small number of residues in protein-protein interaction (PPI) interfaces that contribute to the majority of binding energy of PPI. Identifying the hot spots is important for finding suitable targets for per-turbing PPIs with small molecules or peptides as well as with designed proteins. Due to the rising importance of finding these hot spots, several experimental techniques for the identification of hot spots such as alanine scanning mutagenesis and alanine shaving and residue grafting have been developed. However, because these techniques require extensive experimental efforts, developing computational methods for predicting the hot spots become increasingly important. In this research, we develop a hot spot prediction method and server, MINERVA-plus, by extending the previous hot spot prediction method, MINERVA. We used the same training and test datasets of the MINERVA owing to comparing other methods which used the same datasets. In addition to the features that were used in MINERVA, we included several other features by employing different feature selection methods which have not been used in MINERVA. The performance of our model was first evaluated through 10-fold cross-validation with 65 hot spot residues out of 265 interface residues, and then the validation was performed with an independent test dataset from the BID database. When we compared the performance of our model to those of MINERVA and other computational hot spot prediction methods, we found that our model showed better predictive performance measures than MINERVA and other top prediction methods such as PCRPi and KFC2. We also found that the important features that have major discriminating power were structural features such as solvent accessible surface areas, protrusion index, and residue depth index. MINERVA-plus Server is available at http://bcbl.kaist.ac.kr/MINERVAplus/.

본 연구의 초점은 바인딩 에너지 상에서 대부분의 작용역할을 하는 작은 잔기들, 핫스팟을 예측하는 것이다. 이러한 연구는 단백질간 상호작용에 있어서 작은 분자들이 어떻게 작용 및 분포하는지를 규명하고, 단백질 구조를 디자인하거나 새로운 약물을 발견하는 데에 있어서 중요한 영향을 끼치므로 매우 중요하다. 이러한 핫스팟을 예측하는 것의 중요성이 대두됨에 따라, 몇 가지 실험적 방법들이 개발되었으나, 이러한 방법들은 실험적으로 엄청난 노력과 시간을 요하는 일이기 때문에 합당한 해결책이 되지 못한다. 이에 핫스팟을 예측하는 계산적인 방법이 보다 합리적이며 필요하기에 이 연구를 수행하게 되었다. 본 연구에서는 기계학습방법을 이용한 예측 모델을 제시하는데, 특히 support vector machine (SVM)이라는 알고리즘을 사용한다. 학습과 분류의 데이터로써 MINERVA 방법에서 사용한 것과 동일한 데이터를 사용하였는데, 이는 동일한 데이터를 사용한 다른 방법들과 비교하기 위함이다. 또한 MINERVA에서 사용한 핫스팟을 예측하는 데에 중요한 특징정보들도 사용하였으며, 이 외에 부가적인 특징정보들도 추가하고 다양한 특징추출 방법들을 사용하여 중요한 특징정보들을 확인하고, 보다 정확한 예측모델을 생성하도록 발견된 주요한 특징정보들을 이용하였다. 본 계산모델의 성능은 먼저 10-fold cross-validation 기법을 가지고 265개의 상호작용 잔기들 중에서 65개의 핫스팟 잔기로 구성된 학습데이터를 통해 평가되었고, 추후 BID데이터베이스에서 얻은 독립적인 테스트 데이터를 가지고 성능을 검증하였다. 그리고 기존에 개발된 MINERVA 방법 및 다른 계산모델들에 대해서 성능 비교작업을 수행하였다. 본 계산 모델은 정확도(accuracy), F1, MCC 항목에서 MINERVA 방법보다 보다 나은 성능을 보여주었으며, 이 성능은 PCRPi와 KFC2와 같은 최상위 예측모델의 성능에 근접하고 있다. 본 연구의 주요한 결론은 기존의 MINERVA 예측방법보다 좀 더 개선된 예측방법(MINERVA Plus)을 개발한 것과 이를 예측 서버(MINERVA Plus Server)로 구현한 것이다. 또한 본 연구결과가 나타내는 바는 핫스팟을 예측함에 있어서 solvent accessible surface area, protrusion index, residue depth index와 같은 단백질의 구조적인 특징정보들이 가장 큰 예측 능력을 좌우한다는 것이다. 추후 MINERVA Plus Server는 http://bcbl.kaist.ac.kr/MINERVAplus/ 웹사이트를 통해 서비스가 제공될 것이다.

서지기타정보

서지기타정보
청구기호 {MBiS 12002
형태사항 vi, 64 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 오성택
지도교수의 영문표기 : Dong-Sup Kim
지도교수의 한글표기 : 김동섭
학위논문 학위논문(석사) - 한국과학기술원 : 바이오및뇌공학과,
서지주기 References : p. 57-60
주제 protein-protein interactions
hot spot identification
machine learning method
support vector machine (SVM)
hot spot prediction server
단백질간 상호작용
핫스팟 예측
기계학습
서포트벡터머신
핫스팟 예측 서버
QR CODE qr code