After Human Genome Project finished, researches which wanted to find the relationship between gene and diseases have been proceeded with Genome-wide Assocication Study. However, there are only a few researches which tries to find the relation between DNA sequence and diseases using deep neural network. In this paper, we propose the novel algorithm that chooses the DNA loci related to neurological diseases in DNA sequences, and classifies the sequence into neurological disease using minimum network. This algorithm uses histogram to know whether the DNA loci is relevant to the neurological diseases. The proposed algorithm was evaluated quantitatively with classification accuracy, and the performance was checked qualitatively with data visualization.
인간 게놈 프로젝트가 완료되고 나서, 전게놈 관련 분석을 이용하여 유전자와 질병의 관계를 밝혀내고자 하는 연구들이 많이 진행되었다. 그러나, 심층 신경망을 이용하여 DNA 염기 서열과 질병의 상관 관계를 알아내는 연구는 많이 부족하였다. 본 논문에서는 DNA 염기 서열이 주어졌을 때, 신경 질환과 연관이 있는 DNA 위치만을 선택하여 염기 서열의 길이를 줄인 다음, 작은 신경망을 이용하여 해당 서열을 신경 질환으로 분류하는 알고리즘을 제안한다. 이 알고리즘은 히스토그램을 이용하여 DNA 위치가 신경 질환과 관련이 있는 위치인지를 판별할 수 있다. 제안된 알고리즘은 분류 정확도를 통해 정량적으로 평가되었으며, 데이터 시각화를 통해 알고리즘의 성능을 정성적으로도 확인하였다.