서지주요정보
Identification of domain pattern in human proteins using association rules = 어소시에이션 룰 학습을 이용한 인간 단백질의 도메인 패턴 추출
서명 / 저자 Identification of domain pattern in human proteins using association rules = 어소시에이션 룰 학습을 이용한 인간 단백질의 도메인 패턴 추출 / Suk-Hoon Jung.
저자명 Jung, Suk-Hoon ; 정석훈
발행사항 [대전 : 한국정보통신대학교, 2007].
Online Access 원문보기 원문인쇄

소장정보

등록번호

DM0000855

소장위치/청구기호

문지도서관2층 학위논문

ICU/MS07-50 2007

SMS전송 소장위치

도서상태

이용가능

대출가능

반납예정일

초록정보

In this paper, we introduce a formulated method to evaluate significance of each domain combination, which exploits association rules, and report an overview of domain combination by identifying domain pattern and analyzing their functional annotations. As proteins have evolved toward specific functions, domains, fundamental functional units, have high tendency to form patterns. Domain patterns must be significant domain combinations that have biological reasons to be assembled. Introduced method measures co-occurrence frequency and mutual dependency of domains in a domain combination, so it is useful to estimate whether a given domain combination is meaningful or not. Also we devised functional cohesiveness measure, which makes use of GO term annotation of domains, to investigate biological meaning of domain patterns. Based on the methods, we extracted domain patterns in human proteins and investigated functional annotations of them. From the results, we drew conclusionS that domains in human proteins form patterns whose members are highly affiliated to one another, and that extracted patterns tend to be associated with molecular function and biological process.

본 논문은 각각 도메인 조합의 중요도를 측정할 수 있는 어소시에이션 룰 기반 계산 기법을 소개하고, 이를 이용하여 도메인 패턴을 찾아 그 기능을 분석함으로 도메인 조합의 생물학적 의미를 논한다. 단백질의 도메인은 진화와 삼차 구조 및 생물 기능의 기본 단위이다. 단백질이 특정 기능을 위해 발전되어 왔으므로 도메인 또한 기능을 위한 특정 조합 패턴을 가질 가능성이 크다. 즉 도메인 조합 패턴은 도메인들이 서로 모여야 할 생물학적 이유가 있는 구조체일 것이다. 소개되는 기법은 도메인 조합 내의 멤버 도메인들이 같은 단백질에서 함께 자주 발견되는 정도와 서로에 대한 의존도를 측정하므로 주어진 단백질 조합이 어느 정도의 의미가 있는지를 산출한다. 또한 각각 단백질 조합 및 패턴의 생물학적 의미를 밝히기 위해 유전자 Gene Ontology 를 이용한 기능 응집도도 측정 방법론을 소개한다. 이 두 방법론을 이용하여 인간 단백질의 도메인 패턴을 추출하였으며, 그에 대한 생물학적 의미 또한 분석하였다. 그 결과 인간 단백질에는 서로 의존도가 높고 자주 나타나는 도메인 패턴이 존재하며, 그러한 패턴들은 Gene Ontology 의 molecular function 및 biological process 와 상호 관련도가 높음을 밝혀 냈다.

서지기타정보

서지기타정보
청구기호 {ICU/MS07-50 2007
형태사항 vi, 71 p. : 삽도 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 정석훈
지도교수의 영문표기 : Dong-Soo Han
지도교수의 한글표기 : 한동수
학위논문 학위논문(석사) - 한국정보통신대학교 : 공학부,
서지주기 References : p. 66-71
주제 Bioinformatics
Protein domain
Domain Pattern
Domain Combination
Association Rules
생물정보학
단백질의 도메인
도메인 패턴
도메인 조합
어소시에이션 룰
QR CODE qr code