Bioconversion of $CO_2$ has received much attention to replace fossil fuels. Of the biocatalysts, phylogenetically diverse anaerobic acetogenic bacteria (acetogens) are considered to be the most efficient platform to produce biochemical with the capability to convert synthesis gas ($H_2$/CO/$CO_2$) into acetyl-CoA, an important central metabolite, via the reductive acetyl-CoA pathway, knowns as Wood-Ljungdahl pathway (WLP). Despite the advantages of acetogens in commercial application, a systemic understanding of acetogens at transcriptional and translational level is limited. Recently, genome sequencing of acetogens has profoundly examined, but only a few RNA sequencing (RNA-Seq) study has reported, which demonstrated need for more omics studies to identify engineering target to optimize acetogens. In this study, to systemically comprehend an acetogen at a molecular level during the autotrophic growth condition, first, a genome sequence of the syngas fermenting Eubacterium limosum ATCC8486 was completed and determined transcription start site (TSS), revealing 4.4 mega base pair (Mbp) long circular genome with 4,090 protein-encoding genes and 1,458 TSSs with 93 non-coding RNAs. Following, to find transcriptionally altered system, E. limosum under the autotrophic growth condition was explored, resulting transcriptional abundance in genes encoding WLP and the energy conservation system. Integrating the transcriptomic result to translatomic data, which obtained via ribosome profiling (Ribo-Seq), offered translation efficiency of genes during the autotrophic growth condition, revealing the transcriptionally abundant genes, such as the carbonyl branch of the WLP, the ion-translocating complex, and ATP synthase complexes, showed decreased translation efficiency caused by stable 5′ untranslated region (5′UTR) structures. Ultimately, using the obtained promoters and 5′UTR information from the omics analysis, a library set was constructed, then integrated to produce acetoin, resulting increased acetoin production from zero to 1.17 g/L. These findings provide systemic insights into comprehending $CO_2$ fixing acetogen and indicate a potential target for engineering the bacteria for biochemical production.
최근 화석 연료를 대체하기 위한 CO2의 생물 전환 기술이 주목 받고있다. 관련하여 가장 대표적인 생물 전환 균주는 혐기성 아세토제닉 미생물 (아세토젠) 이며, 해당 균주는 합성 가스 ($H_2$/CO/$CO_2$) 를 주요 대사 산물인 acetyl-CoA로 전환하기 위해 Wood-Ljungdahl pathway (WLP) 라는 균주 특이적인 대사 경로를 보유하고 있다. WLP는 현재까지 보고 되어있는 6개 $CO_2$ 고정 경로 중 ATP를 얻을 수 있는 유일한 대사 경로로, WLP를 사용하는 아세토젠은 바이오 화합물 생산 측면에서 가장 효율적인 균주로 주목 받고있다. 하지만 이러한 상업적 적용에 있어서 아세토젠의 장점에도 불구하고, 아세토젠 균주에 대한 분자 수준 (전사 및 번역 수준) 에서의 이해는 제한되어 있다. 이를 해결하기 위해, 최근 아세토젠 게놈 시퀀싱 연구가 활발하게 진행되어 왔지만, 게놈 정보만으로는 $CO_2$ 고정을 통한 바이오 화합물 생산 경로의 기작을 이해하기에는 부족하다. 또한 생산 증가를 위해서는 관련 대사 경로뿐만 아니라 게놈 수준의 전사체 및 번역체 조절 기작의 이해와, $CO_2$ 고정 중 세포내 바이오 화합물을 생산 하기 위한 기술 최적화가 필요한데, 이는 심도 깊은 오믹스 연구만을 통해서 얻을 수 있다. 따라서 본 연구에서는 합성 가스 사용을 통해 성장 가능한 Eubacterium limosum ATCC8486을 다양한 오믹스 연구를 통해 균주의 게놈, 전사, 그리고 번역 단계를 이해하고, 합리적 엔지니어링 하고자 하였다. 먼저 균주의 게놈을 완성 시킨 결과, 4.4 mega base pair (Mbp) 규모의 유전체와 4,090개 단백질 코드 유전자를 발굴하였다. 다음으로 프로모터와 리보솜결합부위 (RBS) 정보를 얻기 위해 전사 시작 지점 (TSS) 총 1,458 개와 그리고 93 개의 noncoding RNA를 찾았다. 게놈과 TSS 정보는 전사 조절 기작을 이해하기 위해서는 유용하지만 직접적인 전사양 예측은 불가능하다. 따라서, 전사 단계에서 $CO_2$ 고정 중 유전자 발현을 측정하여 중요 유전자를 발굴하였다. 관련하여 전사체 분석 (RNA-Seq) 을 진행한 결과 WLP 및 에너지 저장 시스템을 책임지는 유전자가 $CO_2$ 고정 시 전사 발현 양이 증가 하는 것을 보였다. 전사 진행된 RNA는 단백질로 번역이 되지만, 최근 연구에 따르면 전사 후 조절 메커니즘으로 인해 전사 양과 단백질 양의 상관관계가 맞지 않을 수 있다. 따라서 정확한 번역체 정보를 얻기 위해 리보솜 프로파일 (Ribo-Seq) 을 진행한 후 전사체 정보와 통합 분석을 통해 모든 유전자 번역 효율 수치를 규명하였다. 결과 흥미롭게 전사 양이 높은 WLP의 carbonyl branch와 에너지 저장 시스템의 ion-translocating 복합체와 ATP 생산 복합체에서 안정된 5′비번역영역 (5'UTR) 구조에 기인하여 번역 효율 저하된 것을 확인 하였다. 이와 같은 분석들을 통해 게놈내 존재하는 모든 프로모터와 5'UTR이 전사 및 번역 단계에 미치는 영향을 수치화 하였다. 이를 사용하여 다양한 라이브러리 세트를 구축 및 아세토인 생산 경로에 접목한 결과 아세토인 생성을 0 g/L 에서 1.17 g/L로 증가 하였다. 결론적으로, $CO_2$ 고정 균주 E. limosum의 유전체, 전사체, 그리고 번역체 정보를 다양한 오믹스 분석을 통해 이해하고 이를 통해 조직적인 조절 기작을 규명과 해당 정보를 기반으로 생화학 생산을 위한 잠재적 인 대상을 규명하여 계량된 균주를 얻을 수 있다.