Gene Ontology (GO) is a structured and controlled vocabulary for annotating genes with their functions. The annotations certainly help find genes relevant to specific concepts. Unfortunately, not all concepts relevant to genes are annotated. To address this problem, researchers proposed to use dependency relations so that the annotations of genes with concepts are inferred from other annotations. In order to construct such relations automatically, we propose to investigate the possibility that dependency relations are identified from definitions of concepts because definitions suggest relations of explicit types such as ‘involved in’, which is related to dependency relations.
For this purpose, we first analyze the relation between definitions and encoded dependency relations. We then generate candidates for dependency relations across sub-ontologies as an application of the identified relation. The analysis shows that encoded dependency relations can be adequately identified from definitions. It also suggests two ways for definitions to indicate dependency relations: relations between definitions and the occurrence of terms in other definitions. These methods are used to automatically find candidates for dependency relations across sub-ontologies that are supported by a Gene Ontology Annotation (GOA) dataset. We have thus shown that the identified relation between definitions and encoded dependency relations is useful in automatically generating the dependency relations.
Gene Ontology는 유전자들의 기능을 기술하는 어휘들의 구조화된 모음이다. 이들 개념과 관련된 유전자 쌍들의 모음을 Gene Ontology Annotation (GOA) dataset이라 부른다. 이 자료는 특정 기능에 관련된 유전자들을 찾거나 실험 결과를 분석하는데 사용된다. 이 자료에는 추가로 유도될 수 있는 쌍들이 존재하는 것으로 알려져 있어서 이들 쌍을 유도함으로써 이 자료의 활용성을 높일 수 있다. 이들 쌍을 유도하는 방법으로 의존 관계를 사용할 수 있는데, 본 연구에서는 이들 의존 관계를 자동으로 구성하는 방법으로 개념들의 정의를 사용한다. 이는 정의가 관계들을 제시할 때에 의존 관계들을 추려낼 수 있도록 관계의 의미도 같이 제시하기 때문이다.
본 연구에서는 정의에서 의존 관계를 구성하기 위해서 정의와 이미 표현되어 있는 의존관계와의 연관성을 조사하고 이렇게 식별한 연관성들을 이용하여 새로운 의존 관계들의 후보를 찾아낸다. 연관성 조사에서는 표현된 의존 관계가 정의로부터 구성될 수 있음을 알 수 있었다. 또한 의존 관계가 정의간의 관계와 정의와 개념간의 관계로 제시될 수 있음을 알 수 있었다. 이 식별한 연관성은 새로운 의존 관계를 찾는데 사용된다. 이렇게 찾은 새로운 의존 관계의 후보는 GOA dataset을 토대로 볼 때 의존 관계의 가능성이 높은 것으로 판정되었다. 본 연구에서는 이처럼 식별한 연관성이 새로운 의존 관계를 찾는데 유용할 수 있음을 보였다.