Biomarkers that are identified from a single study often appear to be biologically irrelevant or false positives. Meta-analysis techniques allow integrating data from multiple studies that are related but independent in order to identify biomarkers across multiple conditions. However, existing biomarker meta-analysis methods tend to be sensitive to the dataset being analyzed. In this thesis, we propose a meta-analysis method, iMeta, which integrates t-statistic and fold change ratio for improved robustness. For evaluation of predictive performance of the biomarkers identified by iMeta, we compare our method with other meta-analysis methods. As a result, iMeta outperforms the other methods in terms of sensitivity and specificity, and especially shows robustness to study variance increase; it consistently shows higher classification accuracy on diverse datasets, while the performance of the others is highly affected by the dataset being analyzed. Application of iMeta to 59 drug-induced liver injury studies identified three key biomarker genes: Zwint, Abcc3, and Ppp1r3b
바이오마커란 특정 질병으로 인해 발생되는 유전자의 변이, 그로 인한 단백질, 대사물질 발현의 차이 등을 이용해 질병의 상태를 측정하고 평가할 수 있는 지표를 말한다. 바이오마커를 발굴하는데 문제점은 단일 연구에서 발굴된 후보 바이오마커가 다른 연구에서는 재현되지 않는 일이 빈번히 일어나는 것이다. 이것은 각각의 실험마다 생물학적 또는 실험적 노이즈로 인한 데이터의 이질성이 존재하기 때문에 필연적으로 발생하는 현상이다. 바이오마커의 신뢰도 제고를 위한 방법으로 여러 연구의 결과들을 통합하는 메타분석을 고려해 볼 수 있다. 메타분석이란 유의한 조건하에서 수행된 독립적인 실험의 결과를 수평적으로 통합하는 통계적 방법론을 말한다. 본 학위논문에서는 바이오마커 발굴을 위해 서로 다른 특징을 지닌 통계량의 장점을 조합함으로써 효과적인 메타분석 방법을 개발하였고, 이를 바탕으로 약물로 인해 초래되는 간독성 전사체데이터에 적용하여 세 개 유전자가 바이오마커로서 이용될 수 있음을 시사하였다.