Computational environment for modeling and simulation of biological systems in large or genome-scale have been developed and used for deciphering the characteristics of metabolic networks. In chapter 2, the integration of proteomics data has been accomplished for comprehensive protein analysis at the whole proteome level and comparative analysis of the protein expression levels under different genetic and environmental conditions. Thus, this database serves as a unique and valuable source for studying proteins and proteomes of Escherichia coli under various genetic and environmental conditions. In chapter 3, database has been designed for systematic integration of redundant and heterogeneous metabolic data. A rational database schema and related parser normalize and integrate the metabolic data sources scattered over different site into the unified data structure. Finally, it can be a fundamental source for construction of genome-scale metabolic model and simulation for metabolic flux analysis. In chapter 4, data structure designed for the formal representation and effective exchange of metabolic flux models has been developed. It provides the explicit description of stationary states of a metabolic system by defining environmental/genetic conditions of the system as well as basic information on metabolites and reactions. In chapter 5, a software package is developed for managing information on the genome-scale metabolic network model and for quantitatively analyzing metabolic fluxes. This renders it possible to implement quantitative in silico simulation of metabolic network for understanding the metabolic status and for devising the metabolic engineering strategies. In chapter 6, the application of developed computational environment is performed on in silico genome-scale reconstruction and analysis of the Clostridium acetobutylicum ATCC 824 metabolic network.
Consequently, this integrated environment provides a more systematic approach in design of the model and metabolic engineering strategies for strain improvements.
전통적인 대사 공학은 세포내의 유전자나 조절 기작을 조작하여 원하는 산물을 과생산하는 데에 크게 기여해 왔다. 그러나 세포 시스템의 복잡성으로 인하여 이는 많은 한계를 가져왔다. 그러나 시스템 생물학의 등장과 더불어 전통적인 대사 공학은 시스템적 방법론과의 결합을 통하여 체계적인 세포의 개량이 가능해졌다. 이는 복잡한 생물 시스템의 해석에 수학적 모델링과 전산학적 예측을 도입하여 이루어지게 되었다. 인위적으로 세포 내 대사회로를 바꾸기 위해 특정 유전자를 제거하거나 새로운 유전자를 도입하였을 때의 영향을 미리 예측함으로써 조작할 대사회로, 유전자 그리고 최적화된 배양환경을 제시할 수 있어 실제 wet 실험에 드는 시간, 노력과 비용을 획기적으로 줄일 수 있게 되었다. 따라서 이러한 방법론을 위하여는 수 많은 생물학적 정보와 이를 모델링할 수 있는 도구 그리고 모사를 할 수 있는 생물정보학적 환경들이 요구된다. 이를 위하여 2장에서는 다양한 유전적, 환경적 조건에 따른 단백질의 발현 수준을 비교 분석할 수 있고, 전체 단백체 수준에서의 단백질에 대한 이해를 도울 수 있도록 단백질 데이터베이스를 구축하였다. 3장에서는 다양한 대사체 정보를 정규화하고 체계적으로 통합하여 유전자 수준의 대사 네트워크 모델을 구축할 수 있는 기반 데이터베이스를 구축하였다. 4장에서는 대사 네트워크를 모델링하고 효율적으로 교환할 수 있는 대사흐름분석 언어를 개발하였다. 이를 통하여 대사 네트워크와 이의 유전적 환경적 조건을 모델링할 수 있게 되었다. 5장에서는 유전자 수준의 대사 네트워크 모델을 구축하고, 내부 대사 흐름을 분석할 수 있는 통합 전산 환경을 개발하였다. 이를 통하여 다양한 조건하에서의 대사 흐름을 예측하고, 이를 바탕으로 대사 공학을 위한 전략을 수립할 수 있도록 하였다. 6장에서는 개발된 통합 환경을 이용하여 부탄올 생산 미생물인 Clostridium acetobutylicum의 유전자 수준의 대사네트워크를 모델링하였다. 특히 이 균주의 acidogenic과 solventogenic phase하의 내부 대사 흐름을 예측하고 다양한 분석을 수행하였다.
따라서 이러한 통합환경을 이용하여 C. acetobutylicum의 경우와 같이 유전자 수준의 대사 네트워크를 모델링하고 이를 체계적으로 개량할 수 있는 방법론과 전략에 획기적인 기여를 하게 될 것이다.