서지주요정보
다차원적으로 기능에 연루된 SNP 셋을 이용한 질병 위험 예측 = Disease risk estimation based on the multi-dimensional functional implication of SNP sets
서명 / 저자 다차원적으로 기능에 연루된 SNP 셋을 이용한 질병 위험 예측 = Disease risk estimation based on the multi-dimensional functional implication of SNP sets / 유혜지.
저자명 유혜지 ; Yu, Hye-Ji
발행사항 [대전 : 한국과학기술원, 2012].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8023643

소장위치/청구기호

학술문화관(문화관) 보존서고

MBiS 12004

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Complex disease, such as type 2 diabetes (T2D), is caused by the interactions be-tween multiple genetic and environmental factors. Genome-wide association studies (GWAS) has been focused on the genetic association of single disease markers which often lacks the power to uncover the relatively small effect sizes on disease susceptibility and ignores all pri-or knowledge about disease pathology. Recent studies are trying to consider multiple genes and loci in the analysis of GWAS data. However, there exists the curse of dimensionality problem because of the astronomical computations. The other recent studies were based on the pathway-based approaches, which use prior biological knowledge on gene function to facilitate more powerful analysis. Our goals are to enhance genetic prediction of disease risk for T2D from efficiently reduced number of single nucleotide polymorphisms (SNPs) and to find new biological insights of disease pathogenesis for T2D by using extended functional gene sets. We analyzed the SNPs in 1,999 T2D patients and 3,004 healthy controls from WTCCC studies and selected 2,960 SNPs with T2D susceptibility. From the selected SNPs, 31 genes were identified as significantly related loci with T2D and 89% prediction accuracy with a com-bination of 104 SNPs were achieved by using the random forest (RF) with backward elimination method, which is improved predictive accuracy than one with the known T2D loci. After the gene set enrichment analysis with finally selected subset of SNPs, 65 T2D related gene sets were enriched. By using proposed method, more comprehensive implication of disease pathology and identification of good candidates for further study can be acquired.

제 2형 당뇨와 같은 복합질병은 다수의 유전적, 환경적 요인에 의한 상호작용에 의하여 발병된다. 전장유전체연관성연구는 단일 질병 마커의 유전적 연관성에 초점을 두어 왔는데, 이는 질병 감수성에 대하여 상대적으로 작은 효과 크기를 갖고 있어 낮은 파워를 보이며, 질병 병리학에 대한 모든 사전 지식을 무시한다. 때문에 최근 연구들은 다수의 유전자와 유전자위를 전장유전체연관성연구에 고려하기 위한 시도를 하고 있지만, 천문학적인 계산에 의한 차원의 저주 문제가 존재한다. 다른 접근법으로는 더욱 강력한 분석을 위하여 유전자 기능에 대하여 생물학적 경로 기반의 분석을 수행하는 것이다. 본 연구의 목표는 효과적으로 SNP의 수를 줄임으로써 제 2형 당뇨에 대한 유전적 질병 위험 예측을 향상 시키고, 확장된 기능적 유전자 세트를 이용함으로써 제 2형 당뇨에 대한 질병 발생의 새로운 생물학적 통찰을 한다. WTCCC study로부터 1,999명의 제 2형 당뇨 환자와 3,004명의 정상인에 대한 SNP 정보를 분석하여 제 2형 당뇨 감수성과 연관된 2,960개의 SNP을 선택하였으며, 선택된 SNP들로부터 31개의 유전자가 제 2형 당뇨와 유의하게 연관되어 있음을 확인하였다. 또한, 앞서 선택된 SNP들에 대하여 랜덤포레스트 변수 제거법을 수행하여 104개의 SNP 조합으로 89%의 예측 정확도를 얻었으며, 이는 기존에 알려진 제 2형 당뇨의 예측력 보다 향상된 결과이다. 최종적으로 선택된 SNP의 부분집합에 대하여 유전자 세트 enrichment 분석 결과, 65개의 제 2형 당뇨 연관 유전자 세트를 얻었으며, 이로부터 새로운 제 2형 당뇨 연관 후보군을 확인하였다. 제안된 방법을 이용함으로써 더욱 종합적인 질병 병리학에 대한 이해와 추후 연구를 위한 좋은 후보군 발굴이 가능하다.

서지기타정보

서지기타정보
청구기호 {MBiS 12004
형태사항 viii, 76 p. : 삽도 ; 30 cm
언어 한국어
일반주기 저자명의 영문표기 : Hye-Ji Yu
지도교수의 한글표기 : 이관수
지도교수의 영문표기 : Gwan-Su Yi
학위논문 학위논문(석사) - 한국과학기술원 : 바이오및뇌공학과,
서지주기 참고문헌 : p. 68-74
주제 제 2형 당뇨
전장유전체연관성연구
단일염기다형성
랜덤포레스트
Type 2 diabetes
GWAS
SNP
Random Forest
QR CODE qr code