서지주요정보
Human breast cancer classification using combined analysis of CNVs and gene expression = DNA 복제수 변이와 유전자 발현을 이용한 인간 유방암 분류에 관한 연구
서명 / 저자 Human breast cancer classification using combined analysis of CNVs and gene expression = DNA 복제수 변이와 유전자 발현을 이용한 인간 유방암 분류에 관한 연구 / Yong-Deuk Hwang.
발행사항 [대전 : 한국과학기술원, 2009].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8020597

소장위치/청구기호

학술문화관(문화관) 보존서고

MBiS 09016

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

DNA copy number variant is a DNA segment in which copy-number differences have been found by comparison of reference genomes. DNA copy number variants have been studied for prognostic/diagnostic biomarkers, tumor classifications, tumor progression markers, and so on. However, there was no paper to classify tumors using combined analysis of DNA copy number variants and gene expression data based on pathway analysis. We introduced new features which have classification power from DNA copy number variants based on pathway analysis. Also, we confirmed that human breast cancer samples have specific DNA copy number pattern related with gene ER. From this result, we found that combined analysis of DNA copy number variants and gene expression profiles improved the accuracy of human breast cancer classification.

DNA 복제수 변이(DNA copy number variants)는 참조 게놈과 비교하여 복제수의 차이가 1kb 이상의 DNA 조각을 의미한다. DNA 복제수 변이는 인간 유전체 변이 중에서 그 빈도가 가장 높다. DNA 복제수 변이에는 획득(gain), 손실(loss), 증폭(amplification), 삭제(deletion)가 있고 이것들은 세포의 성장과 분열, 분화, 유전자 발현과 같은 세포의 행동의 큰 영향을 끼친다. 기존 연구에서 DNA 복제수 변이를 암의 진단과 분류에 사용하고 있었지만 유전자 발현 정보와 통합하여 경로분석(pathway analysis)을 한 연구는 없었다. 본 연구는 DNA 복제수 변이와 유전자 발현 데이터를 이용하여 인간 유방암 환자를 분류하였다. 기존의 검증된 경로(pathway) 정보를 이용하여 DNA 복제수 변이와 유전자 발현 데이터에서 인간 유방암을 분류하는 정보력을 가진 경로들을 각각의 데이터에서 찾았다. DNA 복제수 데이터에서는 피셔 테스트를 통하여 유전자의 p-value를 구하고 이것을 티안의 방법(Tian`s method)을 이용하여 각 경로들의 p-value를 구하였다. 유전자 발현 데이터에서는 t-test를 통하여 유전자의 p-value를 구하고 이것을 티안의 방법(Tian`s method)을 통해 각 경로들의 p-value를 구하였다. 이렇게 구해진 2종류의 경로들을 p-value가 낮은 순서로 각각 정렬을 하고 상위 n(=3,5,10,15)개의 경로들을 합하여 분류에 사용할 특징(feature)을 구하였다. 분류를 위한 기계학습 알고리즘으로는 랜덤포레스트, 로지스틱리그레션, 서포트벡터머신을 이용하였다. 그리고 선택된 특징들이 특정 분류 알고리즘으로부터 독립적인 성능을 가진다는 것을 보여주었다. DNA 복제수 변이 데이터로부터 구한 5개의 경로와 유전자 발현 데이터로부터 구한 5개의 경로를 조합하여 유방암 분류를 하였고 적은 수의 특징 임에도 불구하고 우수한 성능을 보여준다는 사실을 발견 하였다.

서지기타정보

서지기타정보
청구기호 {MBiS 09016
형태사항 vii, 32 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 황용득
지도교수의 영문표기 : Do-Heon Lee
지도교수의 한글표기 : 이도헌
학위논문 학위논문(석사) - 한국과학기술원 : 바이오및뇌공학과,
서지주기 References : p. 27-30
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서