서지주요정보
Comprehensive analysis of ubiquitination system and ubiquitination sites in yeast = 효모에서의 유비퀴티네이션 시스템과 유비퀴티네이션 위치에 대한 종합적 분석
서명 / 저자 Comprehensive analysis of ubiquitination system and ubiquitination sites in yeast = 효모에서의 유비퀴티네이션 시스템과 유비퀴티네이션 위치에 대한 종합적 분석 / Won-chul Lee.
저자명 Lee, Won-chul ; 이원철
발행사항 [대전 : 한국과학기술원, 2008].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8019030

소장위치/청구기호

학술문화관(문화관) 보존서고

MBiS 08007

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Ubiquitination is an important biological process related to the regulation and degradation of diverse cellular proteins. The ubiquitination of a substrate is carried out by sequential reactions of E1 ubiquitin-activating enzyme, E2 ubiquitin-conjugating enzyme, and E3 ubiquitin-protein ligase. To represent the comprehensive ubiquitination system in budding yeast, Saccharomyces Cerevisiae, I collected by literature search all the substrate information as well as E2, E3, and DUB (DeUBiquitinaion) enzymes which participate in the ubiquitination process. It results in construction of a database, SCUD (Saccharomyces Cerevisiae Ubiquitination Database). As for the ubiquitination mechanism, most studies have been restricted to the identification of the substrate motifs required to interact with E3 enzymes. Here, I focused on ubiquitination sites and developed a ubiquitination site prediction method with Support Vector Machine (SVM) which utilized the primary and tertiary information of the substrate proteins. It reaches 70% accuracy on average by 5-fold cross validation. I also carried out the identification of ubiquitination motifs with Motif-x, a motif-finding program. In addition to the motifs derived from all the substrate sequences, I tried to extract the motifs from the substrate sequences grouped by different ubiquitin transfer mechanisms or E2 enzymes which react upon them. The SCUD database will be useful to research on the ubiquitination systems of other higher organisms. Moreover, the studies on ubiquitination sites present several sequence patterns as well as the possibility of ubiquitination site prediction. It will guide future ubiquitination site analyses with more experimentally verified data available. Protein phosphorylation is one of the important processes in the cell signaling pathway. A variety of protein kinase families are involved in this process and each protein kinase family phosphorylates different kinds of substrate proteins. Many methods to predict protein kinase-specific phosphorylated sites or different types of phosphorylated residues (Serine/Threonine or Tyrosin) have been developed. Here, I employed Support Vector Machine (SVM) to attempt to predict protein kinase-specific phosphorylation sites. 10 different kinds of protein kinase families (PKA, PKC, CK2, CDK, CaM-KII, PKB, MAPK, EGFR) were considered in this study. I defined 9 residues around a phosphorylated residue as a deterministic instance from which protein kinases determine whether they act on. The subsets of PSI-BLAST profiles were converted to numerical vectors to represent positive or negative instances. When SVM training, I took advantage of multiple SVMs because of the unbalanced training sets. Representative negative instances were drawn multiple times, and generated new training sets with the same positive instances in the original training set. When testing, the final decisions were made by the votes of those multiple SVMs. Generally, RBF kernel was used for all the SVMs, and several parameters such as gamma and cost factor were tested. My approach achieved more than 90% specificities throughout the protein kinase families, while the sensitivities recorded 60% on average.

유비퀴티네이션은 세포 내 다양한 단백질의 degradation 및 기능/안전성 조절, 세포 내 위치를 결정짓는 단백질의 번역 후 변형 과정중의 하나이다. 이 연구에서는 여러 조 중 가장 많은 부분이 알려진 효모의 유비퀴티네이션 과정을 대상으로, 유비퀴티네이션 시스템과 유비퀴티네이션 위치에 대한 종합적 분석을 수행하였다. 이를 위해 먼저 유비퀴티네이션 과정에 관여한다고 알려진 모든 효소에 대한 정보를 수집한 다음, 각 효소가 작용하는 기질들을 문헌검색을 통하여 찾아서 SCUD (Saccharomyces Cerevisiae Ubiquitination Database) 라는 데이터베이스를 구축하였다. 한편, 유비퀴티네이션 위치에 대해서는 기계학습을 통한 예측방법을 개발하고 유비퀴티네이션 모티프들을 도출해내는 두 가지 접근방법을 사용하였다. 예측방법은 Support Vector Machine (SVM)과 기질 단백질의 서열정보 및 용매 접근 가능성 정보를 이용하였고, 평균적으로 약 70%의 정확도를 보여주었다. 유비퀴티네이션 모티프는 먼저 모든 기질 단백질을 대상으로 도출하여 보았고, 기질 단백질이 유비퀴티네이션 될 때 작용하는 서로 다른 메커니즘이나 효소의 종류에 따라 기질 단백질을 구분하여 모티프를 추출해 보았다. SCUD 데이터베이스는 앞으로 다른 종들의 유비퀴티네이션 시스템을 연구할 때 도움이 될 것이고, 유비퀴티네이션 위치에 대해 접근해 보았던 방법들은 유비퀴티네이션 위치 주변에 특정 경향이 존재하고 위치 예측 또한 가능하다는 것을 보여주었다. 단백질 인산화는 세포 내의 신호전달 및 다양한 기능을 수행하는 단백질 번역 후 변형과정이다. 이 인산화 과정은 다양한 종류의 키나아제에 의하여 수행되는데 각기 다른 키나아제는 기질 상의 특이적 신호에 따라 기질을 인식해서 인산화를 하게 된다. 이 연구에서는 다중 Support Vector Machine (SVM)을 이용하여 키나아제 특이 인산화 위치를 예측하는 노력을 해 보았다. 먼저 알려진 기질의 수가 충분한10개의 키나아제 (PKA, PKC, CK2, CDK, CaM-KΙΙ, PKB, MAPK, EGFR)를 선택한 다음, 기질 단백질의 PSI-BLAST Profile을 이용하여 키나아제 별 training set을 구성하였다. 한편, 각 training set에서 negative instance의 개수가 positive instance의 개수보다 월등히 많음으로 인해 생기는 negative overweighting 문제를 해결하기 위하여 다중 SVM 방법을 사용하였다. Negative instance 들을 BLOSUM62 점수를 사용하여 유사성에 의해 여러 개의 그룹으로 나눈 후 각 그룹에서 하나의 negative instance를 뽑아 새로운 negative instance set을 만드는 과정을 여러 번 반복하여 여러 개의 training set을 만들고 이를 바탕으로 다중 SVM을 구성하였다. 그리고 마지막 판단은 다중 SVM의 투표로 결정하는 과정을 사용하였다. 이 방법은 무엇보다 specificity를 향상시키는데 효과가 있었고, 모든 키나아제에 대해서 60%의 sensitivity 를 유지하는 가운데 90% 이상의 specificity를 보여주었다.

서지기타정보

서지기타정보
청구기호 {MBiS 08007
형태사항 vi, 61 p. : 삽도 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 이원철
지도교수의 영문표기 : Dong-sup Kim
지도교수의 한글표기 : 김동섭
학위논문 학위논문(석사) - 한국과학기술원 : 바이오및뇌공학과,
서지주기 Reference : p. 60-61
주제 ubiquitination;ubiquitin;ubiquitination site;yeast ubiquitination;
유비퀴티네이션;유비퀴틴;유비퀴티네이션 위치;효모 유비퀴티네이션;
QR CODE qr code