서지주요정보
End-to-end differentiable protein design using variational AutoEncoder = 변분 오토인코더를 이용한 단백질 디자인
서명 / 저자 End-to-end differentiable protein design using variational AutoEncoder = 변분 오토인코더를 이용한 단백질 디자인 / Su Jae Jeong.
저자명 Jeong, Su Jae ; 정수재
발행사항 [대전 : 한국과학기술원, 2020].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8036499

소장위치/청구기호

학술문화관(도서관)2층 패컬티라운지(학위논문)

MBIS 20027

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

리뷰정보

초록정보

Protein is an essential polymer that performs various functions in living things. Protein design means creating proteins with novel structures or functions. Computational protein design has been tried for a long time, but there were limitations because it could only deal with limited protein space compared to massive protein space. Recently, due to the advent of a deep generative model, proteins can be designed faster than conventional methods. In this research, protein sequences and corresponding structures were mapped into latent space through the variational autoencoder (VAE) model. Then, protein sequences and dihedral angles were generated from the sampled latent variable through the decoder. Protein structures were approximated by fixed backbone bond lengths and bond angles and appended new atoms with predicted dihedral angles. End to end differentiable protein structure generative model was built. Through a case study of globin superfamily, the performance of the VAE model was examined. New globin proteins were designed through our VAE model, and its properties were analyzed. VAE model was also tried up to mainly alpha helix class level.

단백질은 생명체에서 다양한 기능들을 수행하며 필수적인 고분자이다. 단백질 디자인은 새로운 구조나 특성을 지니는 단백질을 만들어 내는 것을 의미한다. 컴퓨터를 활용한 단백질 디자인은 많이 시도되어 왔으나, 수 많은 단백질 중 아주 일부만 다룰 수 있기 때문에 한계가 있다. 최근에 딥러닝 기술을 이용하여 새로운 단백질을 기존의 방법들보다 빠르게 계산해 낼 수 있게 되었다. 본 학위논문에서는 합성곱 신경망을 이용한 변분 자동 인코더을 통하여 단백질의 염기 서열과 구조를 잠재변수에 매핑하였다. 또한 잠재변수를 디코더를 통하여 단백질 염기 서열과 단백질의 이면각을 만들어내었다. 원자간의 결합 길이와 결합 각도를 고정시켜 이면각에 맞게 단백질 골격구조를 형성하고, 처음부터 끝까지 미분가능한 단백질 구조 생성모델을 만들었다. 글로빈 superfamily에 대한 사례연구를 통하여 변분 자동인코더의 성능을 확인하였고 이를 통하여 새로운 글로빈 단백질을 디자인하여 그 특성을 알아보았다. 그리고 더 나아가 mainly alpha helix class에 수준까지 확장시켜서 단백질 디자인을 시도해보았다.

서지기타정보

서지기타정보
청구기호 {MBIS 20027
형태사항 iv, 34 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 정수재
지도교수의 영문표기 : Dongsup Kim
지도교수의 한글표기 : 김동섭
학위논문 학위논문(석사) - 한국과학기술원 : 바이오및뇌공학과,
서지주기 References : p. 30-32
주제 protein design
deep learning
variational autoencoder
convolutional neural network
deep generative model
단백질 디자인
딥러닝
변분 자동 인코더
합성곱 신경망
심층 생성 모델
QR CODE qr code