Current single SNP based GWAS are insufficient to dissect the origin of the complex diseases. Recent studies apply pathway-based analysis as a new paradigm for GWAS to overcome their limitations, but there still exist unavoidable generation of the false positive noises according to the characteristic of LD block. In this study, we propose the way to eliminate the false noises and provide more reliable method to estimate the altered pathways, through considering functional deleterious SNP effects. Only consider functionally significant SNPs as the candidates of the pathway-based analysis, the resulted pathways reflect truer altered activity than the current approaches. We verify this result quantitatively through the classification, and show that our proposed approach has better classification performance than the conventional methods even though the current application coverage is limited.
개인의 전유전체 데이터를 손쉽게 얻을 수 있게 됨에 따라, 단일염기변이와 질병간의 관계를 밝히고자 여러 연구가 진행되어 왔다. 여러 요인이 다발적으로 영향을 미치는 복합 질병을 개별 단일염기변이로 해석하고자 하는 접근이 한계를 보이자, 최근 유전자 기반 또는 회로 기반의 전유전체 연관성 연구라는 새로운 접근 방법이 대두되었다. 그러나 최근의 방법 또한 염색체의 연관불균형(Linkage disequilibrium)의 특성에 따라 실제 변이에 영향을 받는 회로 예측에 오류를 범하고 있다. 본 연구에서는 단일염기변이 중 유전자 활동에 영향을 직접적으로 미칠 수 있는 기능적 변이(functional SNP)를 정의하고, 이 정보를 이용함으로써 기존의 방법에 따른 오류를 최소화하여 실제로 변이에 영향을 받는 회로들을 예측하고자 하였다.
기능적 변이 여부를 판단하기 위해 F-SNP이라는 웹 프로그램을 이용, 단백질 형성, 접합 조절, 전사 조절, 단백질 변역 후 처리 등 4가지 주요 항목에 대해 단일염기변이의 유해성을 판단하고 일정 기준 이상의 변이들만 기능적 변이로써 추출하였다. 이를 바탕으로 유의한 회로 정보를 얻은 뒤, 기존의 방법들과의 결과 비교를 위해 유전자 발현 데이터의 교차 검증을 통한 분류 분석을 시행하였다. 그 결과 기존의 기법들에 비해 본 연구에서 제시된 접근법이 분류기의 종류와 관계없이 향상된 결과를 나타내었다. 이를 통하여 현재 제시된 방법이 기존 연구들에 비하여 실제적으로 변이에 영향을 받는 유전자 및 회로를 더 잘 반영함을 간접적으로 확인하였다.