서지주요정보
Analyzing protein motif combinations using a data mining technique = 데이터마이닝 기법을 이용한 단백질 모티프조합 분석
서명 / 저자 Analyzing protein motif combinations using a data mining technique = 데이터마이닝 기법을 이용한 단백질 모티프조합 분석 / Hye-Jin Kam.
발행사항 [대전 : 한국과학기술원, 2004].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8015682

소장위치/청구기호

학술문화관(문화관) 보존서고

MBiS 04002

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

It is apparent that some regions in a protein have been more conserved than others during evolution. These regions are called `motif's that have representative features of functions and structures. From a view of function, to understand activities of a motif combination is also, sometimes even more, important as those of a single motif. Motifs act as a `functional module' in combination, and give more complicated and specified function to a protein. Therefore, searching fully informative NRFC (Non-Redundant Frequently Co-occurring) motif combinations and analyzing the biological meanings of them are needed for understanding functions of proteins. I proposed an expert system MOCHA (MOtif Co-occurrence cHaracteristics Analysis) for biological interpretation about NRFC combinations. The 76.5% of the searched NRFC motif combinations were previously unknown. NRFC combinations are full of functional information in proteins or protein families. With MOCHA system, three kinds of information can be obtained from NRFC combinations: (1) as a ``functional module'', (2) as a information provider for un-annotated motif(s) and (3) as a reflection of the complexity of an organism. MOCHA system is reachable through Would Wide Web at http://mocha.kaist.ac.kr.

단백질 서열의 유사도를 비교하여, 기능이 알려지지 않은 단백질의기능을 유추하는 방법이 기존에 많이 이용되어 왔다. 그러나, 두 개의 homolog 단백질 사이에서의 서열 유사도는 평균적으로 40% 정도라고 알려져 있으며, 유사도가 20% 이하인 경우들도 다수 발견됨에 따라서 단백질에는 그 기능을 유지하기 위해 중요한 정보를 담고 있다고 생각되는 특이한 부분이 존재한다고 생각하게 되었다. 이 논문에서는 이러한 부분을 모티프(motif)라고 부르기로 하며, 모티프들은 단백질의 구조와 기능에 중요한 역할을 한다는 일반적인 합의 위에서 진행되었다. 개개의 모티프의 기능을 연구하는 것만큼, 혹은 그 이상으로, 모티프의 조합에 대한 분석은 단백질의 기능 연구에 중요하다. 이는, 단백질을 구성하는 모티프들은 서로 조합을 이루어 기능적 단위체 (functional module)을 만들어 단백질의 전체적인 기능에 기여하기 때문이다. 이 논문에서는, 단백질조합의 여러 형태 중 가장 풍부한 정보를 담고 있는 비중복 동시 출현 모티프조합(NRFC (Non-Redundant Frequently Co-occurring) motif combination)을 발견하고 통합 정보시스템인 MOCHA (MOtif Co-occurring cHarateristic Analysis)를 구축하여 결과 모티프조합들을 분석하였다. 그 결과, 발견된 모티프조합의 76.5%이상이 기존에 알려져 있지 않은 새로운 모티프조합인 것으로 확인되었으며 이들 모티프조합을 통해 생물학적으로 의미있는, 단백질의 기능적 정보를 얻을 수 있었다. MOCHA 시스템은 다음의 주소(http://mocha.kaist.ac.kr)로 웹을 통해 접근 가능하다.

서지기타정보

서지기타정보
청구기호 {MBiS 04002
형태사항 vii, 29 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 감혜진
지도교수의 영문표기 : Kwang-Hyung Lee
공동교수의 영문표기 : Do-Heon Lee
지도교수의 한글표기 : 이광형
공동교수의 한글표기 : 이도헌
수록잡지명 : "Interpretation of association networks among protein sequence motifs". Genomics & informatics, 1,(2003)
학위논문 학위논문(석사) - 한국과학기술원 : 바이오시스템학과,
서지주기 Reference : p. 27-29
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서