Non-coding SNP that identified via GWAS which represent genetic methods in disease research is not possible to functional study. Epigenetics known to help understanding the difference in variation of trait that are unexplainable by genetic only. In this thesis, I conducted the identification of disease-associated variants and their targets based on interplay between genetics and epigenetics. At the system level, first, I performed the deep sequencing for open chromatin across the genome of yeast strains and monozygotic twins. While individual OCRs were associated with a handful of specific genetic markers, gene expression levels were associated with many regulatory loci for yeast strains. In twin study, the difference of chromatin accessibility depends on the genotype of a nearby locus. Based on these findings, epigenetic differences can control regulatory variations through interactions with genetic factors. From previous understanding, I performed the analysis of the cause of disease not solve by GWAS using allelic analysis. This approach showed approximately two times greater sensitivity than QTL mapping. In addition, I conducted the random forest analysis for homozygote problem that cannot analyze the allelic imbalance and small sample size.
비암호 부위에 존재하는 SNP는 질병 연구에서 유전학적 방법으로 알려진 GWAS 분석으로는 기능적인 연구가 불가능하다. 후성유전학은 DNA 서열만을 대상으로 하는 유전학이 단독으로 설명하기 어려운 형질 차이에 대한 이해를 돕는다. 본 논문에서는 유전학과 후성유전학의 상호작용을 기반으로 하여 질병 관련 유전 변이와 목적 유전자를 발굴하여 질병의 병인에 대해 시스템 차원의 연구를 수행하였다. 유전학과 후성유전학의 상호작용에 대한 이해를 위해 효모종과 쌍둥이에서 열린 염색질 지역을 대상으로 차세대 염기서열 분석을 하였다. 효모종에서는 개별 열린 염색질 지역은 소수의 유전자 마커와 연관이 있는 반면, 유전자 발현은 많은 조절 지역과 연관이 있었다. 쌍둥이 분석에서는 염색질 접근도 차이가 주변부의 유전형과 상호연관성이 있었다. 효모종과 사람의 연구를 통해 후성유전적 변이가 유전형과 상호작용함을 알 수 있었다. 위의 결과를 바탕으로, GWAS 분석으로 해결할 수 없었던 질병의 병인에 대한 분석을 수행하였다. 대립 유전자 불균형 분석을 통해 eQTL 분석보다 2배정도의 민감도를 보였다. 또한, 동형접합체를 분석하지 못하는 유전자 불균형의 단점을 해결하고 적은 수의 개체를 이용하여 분석 가능하도록, 기계학습기법인 랜덤포레스트로 학습하고 예측하였다.