서지주요정보
Discovery of context-specific patterns for biomedical information = 바이오의료 정보를 위한 상황특이적 패턴 발굴기술
서명 / 저자 Discovery of context-specific patterns for biomedical information = 바이오의료 정보를 위한 상황특이적 패턴 발굴기술 / Se-Joon Lee.
저자명 Lee, Se-Joon ; 이세준
발행사항 [대전 : 한국과학기술원, 2013].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8025450

소장위치/청구기호

학술문화관(문화관) 보존서고

DBIS 13010

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Biomedical information is combined information between biological information and medical information. This biomedical information covers varying levels of units from the molecule level to the phenotype level. The introduction of omics data, including genomics, transcriptomics, proteomics, and metabolomics, made an integrated systematic analysis possible on biological phenomena. Hence, current biomedical information means multi-level relation data from numerous experiments. Electronic medical records data about patients’ information and other text data on biomedical literature are also included as biomedical data. Biomedical relations occur at specific conditions. According to recent research, each phase of a cell shows a different pattern of activated relations and every disease has various patterns of activated and deactivated relations. In addition, each gene expression shows context-specific patterns according to the kind of drugs used. Thus, understanding the variety of patterns under different conditions is essential to infer actual phenomena. Biomedical information needs an especially deep understanding of the dynamics of biomedical patterns under different conditions to derive effective treatments in various conditions. Previously, research aimed to discover biomedical patterns under specific conditions, but this research was not accurate enough to predict biomedical patterns under various conditions. A more accurate and automated methodology is needed to figure out context-specific patterns. Furthermore, an automated context interpretation method for given biomedical patterns should be developed. To ameliorate this situation, we suggested a methodology that discovers specific patterns in a specific context, as well as an automated context interpretation method for given patterns. We considered the context of disease and usages of drugs from primary biomedical information including experimental and reported text data to investigate relations between contexts and patterns. Firstly, we discovered a disease-specific pattern of genes using experimental biomedical information. To discover specific gene patterns of a generation of disease, we inferred disease-specific gene patterns that showed specific patterns between disease and normal statuses. In this work, we linked protein-protein interaction data and gene relation patterns under specific diseases using correlations among gene expressions. We showed that our model-based gene patterns can classify disease context accurately, outperforming the previous model in terms of discovering disease-specific gene patterns. Furthermore, our model could discover undetected markers using previous methods. Secondly, we discovered a relationship between biological processes, especially those affected by drugs, and side effects based on gene expression patterns generated by drug treatments. In this research, from gene expression patterns generated by drug treatments, we discovered drug-related gene functions by using gene set enrichment analysis and gene ontology. We detected statistically significant relationships among the biological processes of genes, drugs, and side effects to recognize the relationship between the phenotype-level effects of drugs and the molecular-level effects of drugs on biological processes. Lastly, we developed a context discovery method for given biological patterns. This research collected context terms described in the literature and compared similarity to infer a relationship between two patterns. Considering the pattern context similarity in drug-disease relation and gene-disease relation can be used to more accurately discover drug-disease patterns than previous methods. Furthermore, we endeavored to interpret context information for inferred patterns.

바이오 의료 정보란 생명현상을 나타내는 바이오 정보 중 의료정보로 사용될 수 있는 모든 정보를 이야기 합니다. 이러한 바이오 의료 정보는 분자 수준에서 질병과 같은 표현수준에 이르기까지 다양한 수준의 정보로 구성되어 있습니다. 유전체, 전사체, 단백체, 대사체 등의 오믹스 데이터의 출현은 생명현상을 단편적인 부분으로만 분석하는 것이 아니라 시스템 수준으로 분석 가능하게 해주었습니다. 그러므로 현재 바이오 의료 정보는 분자 수준에서 현상 수준까지의 다양한 수준의 정보로 구성된 실험 기반의 패턴 정보라고 할 수 있습니다. 또한 환자들의 정보를 담고 있는 전자의료기록 데이터와 다양한 의료 정보가 담겨있는 문헌 데이터와 같은 텍스트 기반 데이터도 최근 각광을 받고 있는 주요한 바이오 의료 정보입니다. 생물학적 패턴은 상황 특이적입니다. 세포의 각 주기마다의 활성화 되는 네트워크의 패턴이 다르고, 질병마다 발현되거나 발현되지 않는 네트워크의 패턴이 다릅니다. 또한 어떤 약을 처방했느냐에 따른 반응의 유전자들의 패턴도 상황 특이적입니다. 이러한 상황 특이적인 패턴은 생명현상을 깊이 이해하는 주요한 열쇠입니다. 특히 바이오 의료 정보에서는 질병의 치료나 건강증진을 위해 생물학적 패턴이 어떤 상황에서 특이적으로 동작하는지를 알아야 합니다. 기존의 연구들은 상황특이적인 패턴을 실험 데이터로부터 발굴하려는 연구들을 해왔습니다. 그러나 좀 더 정확하고 자동화된 상황특이적인 패턴을 발굴하는 기술의 개발이 필요합니다. 그리고 더 나아가서 주어진 패턴으로부터 어떤 상황으로부터 이 패턴이 나왔는지를 자동으로 해석하는 기술도 필요합니다. 본 연구에서는 특정 상황의 실험데이터로부터 특이하게 나타나는 패턴을 발굴하는 기술뿐만 아니라 특정 패턴이 어떤 상황으로부터 나왔는지를 해석할 수 있는 기술을 연구하였습니다. 본 연구는 이러한 모델들을 질병 상황, 약을 투여한 상황의 정보를 기반으로 바이오 의료의 주요 데이터군인 실험 데이터와 문헌 데이터로부터 연구하였습니다. 먼저, 질병 상황의 바이오의료 정보로부터 특이적인 패턴을 발굴하였습니다. 질병에 특이적인 유전자 발현의 패턴을 발굴하기 위하여 상관정보를 활용한 질병상황과 정상 상황에서의 특이적인 패턴을 보이는 유전자 네트워크를 발굴하는 기법을 개발하였습니다. 본 연구에서는 단백질 - 단백질 상호작용 정보와 질병에 따라 변하는 유전자 발현정보를 연계하고 유전자 발현정보들의 상관관계를 이용하여 질병에 유의하게 나타나는 유전자의 관계 패턴을 발굴하고 발굴된 유전자 관계 패턴이 질병을 얼마나 유의하게 분류할 수 있는지를 연구하였습니다. 연구 결과 상황특이적인 유전자 관계 패턴이 기존 방식보다 좋은 성능을 보임을 보였고, 기존의 방식으로 찾을 수 없었던 마커들도 찾을 수 있음을 보였습니다. 또한 약을 처방했을 상황의 유전자 발현 패턴을 기반으로 약이 특이하게 영향을 주는 세포 기능과 약의 부효과와의 패턴을 발굴하였습니다. 본 연구에서는 약 처방시의 유전자의 발현 패턴을 기반으로 순위기반 유전자 집합 점수기법을 통해 약에 유의미하게 반응하는 유전자들의 기능을 발굴하였고, 이의 응용으로 약의 부효과와 약이 세포에 미치는 기능과의 관련성을 알아보기 위하여 유전자의 생물학적 기능-약-부효과 간의 통계적 유의성을 가지는 패턴을 발굴하였습니다. 마지막으로, 패턴이 나타날 수 있는 상황 정보를 발굴하는 기술을 개발하였습니다. 본 연구는 문헌데이터를 기반으로 특정 패턴이 일어나는 상황을 나타내는 상황 단어들을 발굴하고 해당 단어들의 유사성으로부터 두 패턴이 얼마나 관련성이 있는지를 연구하였습니다. 본 연구에서는 문헌상에 나타나는 약-유전자, 유전자-질병의 패턴에서 각각의 상황 단어의 유사성을 고려한 패턴이 기존 모델보다 약-질병의 관계를 정확하게 발굴할 수 있음을 보였습니다. 그리고 더 나아가서 발굴된 패턴의 가능한 상황정보들을 해석할 수 있는 기술을 개발하였습니다.

서지기타정보

서지기타정보
청구기호 {DBIS 13010
형태사항 ix, 101 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 이세준
지도교수의 영문표기 : Kwang-Hyung Lee
지도교수의 한글표기 : 이광형
공동지도교수의 영문표기 : Do-Heon Lee
공동지도교수의 한글표기 : 이도헌
수록잡지명 : "Building the process-drug-side effect network to discover the relationship between biological processes and side effects". BMC Bioinformatics, v. 11. Suppl 2, (2011)
수록잡지명 : "Discovering context-specific relationships from biological literature by using multi-level context terms". BMC Medical Informatics and Decision Making, v. 12. Suppl 1, (2012)
학위논문 학위논문(박사) - 한국과학기술원 : 바이오및뇌공학과,
서지주기 References : p. 91-96
주제 context-specific patterns
diseases
drugs
biomedical information
상황특이패턴
질병

바이오의료정보
QR CODE qr code