For multi-alignment of protein sequences, this thesis proposes an algorithm that greatly considers pairwise homology relation between each sequence pair and simultaneous global alignment. Homology vector concept is introduced to implement the global homology effect of each sequence from homology table, and vector projection is used to represent the global homology value. Complex sequence concept is introduced to raise the simultaneous global alignment effect. Some expeiments show that pairwise homology is fully reflected in multi-alignment by this method.
단백질 유전자 1차 배열 (primary sequence) 의 다중정렬 (multi-alignment) 을 효율적으로 수행하기 위한 몇 가지 알고리즘이 최근에 제안되었다. 본 논문에서는, 각 배열 쌍 간의 상동성을 효율적으로 반영하고 여러 배열에 대한 동시 비교성을 높이기 위한 알고리즘을 제안하고, 이를 구현하여 시험한 결과를 논한다. 일대일 정렬로부터 구한 각 쌍 간의 상동성을 사용해서 각 배열의 전체 배열들에 대한 상동성을 표시하기 위해, 상동성 백터의 개념을 도입하여 백터 전사값을 각 배열 간의 전체적 상동성 지표로 사용한다. 여러 배열의 동시 비교성을 높이기 위해, 정렬된 배열이 복합 배열을 생성하고 복합 배열도 상동성 백터를 가지고 정렬에 사용되도록 한다. 최종적으로 형성된 하나의 복합 배열인 주형 배열로 부터 각 배열 간의 정렬 형태를 구성한다. 실험에서는 일대일 배열 상동성이 다중 정렬 결과에 잘 반영되는 것을 볼 수 있었다.