Genome-wide association studies (GWAS) prove the highly polygenic architecture of complex diseases or traits; therefore, single-locus-based methods are usually unable to detect all involved loci, especially when individual loci exert small effects. Moreover, the majority of associated SNPs reside in non-coding regions, making it difficult to understand their phenotypic contribution. In this work, we studied epistatic interactions associated with three common diseases using the Korea Association Resource (KARE) data: type-2 diabetes mellitus (DM), hypertension (HT) and coronary artery disease (CAD). We showed the epistatic SNPs were enriched in enhancer as well as DNase I footprints (The ENCODE Project Consortium 2012), which suggested that the disruption of the regulatory region where transcription factors bind may be involved in the disease mechanism. Accordingly, to identify affected genes of the SNPs, we employed whole-genome multiple-cell-type enhancer data by Maurano et al. and Andersson et al., which discovered using DNase I profiles and enhancer RNA databases defined by Cap Analysis Gene Expression (CAGE) tags in the FANTOM5 project. Assigned genes were significantly enriched in known disease associated gene sets, which were explored based on the literatures, suggesting this approach is useful for detecting relevant affected genes. In our knowledge-based epistatic network, the three diseases share many associated genes and are also closely related with each other through many epistatic interactions. These findings elucidate the genetic basis of the close relationship between DM, HT and CAD.
최근 전장 유전체 연관성 분석 (GWAS) 을 통해 복합 질환의 원인 변이를 밝혀낸 연구가 상당수 진행되었다. 이는 single-locus-based 방법으로 질환의 polygenic architecture는 설명할 수 없으며, 또한 밝혀진 질병 연관 SNP가 주로 non-coding 지역에 속하기 때문에 phenotype 변화에 어떻게 영향을 주는지 정확히 알 수 없다. 본 연구에서는 Korea Association Resource (KARE) 데이터에서 3가지 복합 질환 - 당뇨(DM), 고혈압(HT), 관상동맥질환(CAD) - 에서 epistatic interaction pair를 발굴하여, 그 결과 epistatic SNP들이 enhancer 지역 및 DNase I footprint 지역에 주로 분포함을 밝혔다. 이로써 epistasis에 참여하는 SNP가 genome 상의 조절 지역을 바꾸어 질병 매커니즘에 기여한다고 할 수 있다. 또한, 기존에 연구된 enhancer-promoter pair를 통해 non-coding SNP의 실제적으로 연결된 정확한 타겟 유전자를 찾을 수 있었다. 또한 이렇게 발굴된 각 질병의 원인 epistasic SNP의 타겟 유전자들이 그 질병과 관련이 있다고 알려진 gene set 에 enrich 되어 있었다. 마지막으로 모든 결과를 통합하여 각 질병의 알려진 관련 gene set 과, 양쪽 gene을 타겟하는 SNP 간의 epistasis 관계를 나타낸 epistatic network 를 구성하였다. 이렇게 구성된 network는 epistasis 발굴 및 그에 따른 enhancer-target gene mapping 방법이 세 복합질환의 매커니즘과 그 관련성을 설명할 수 있는 새로운 관점을 제시한다.