Linguistic reconstruction, in which multiple genealogically-related languages are compared to recover their unattested or sparsely-attested common ancestor known as the protolanguage, has always been an important topic in linguistics. While research has been conducted on computational techniques for multilateral comparisons, the task of automated bilateral comparative reconstruction is yet to be explored. In this thesis, a bidirectional LSTM autoencoder adversarially regularized with pointwise and pairwise discriminators is proposed as a neural architecture to predict protolanguage word forms. An experiment performed on Ryukyuan dataset, composed of cognate pairs in two Ryukyuan languages Okinawan and Miyako, showed that the proposed architecture is capable of generating linguistically valid reconstructions.
같은 선조를 계승하는 다수의 언어를 비교하여 그 공통 조어의 형태를 복원하는 재구 작업은 언어학에서 매우 중요한 과제들 가운데 하나로, 특히 다수결의 원칙을 사용할 수 없는 2개 언어 비교 상황에서의 자동 재구 가능성에 대한 탐구가 필요하다. 본 학위 논문에서는 양방향 장단기 기억 신경망으로 구성된 자기부호화기에 점별 판별기와 쌍별 판별기를 부착하여 적대적 게임 구조에 의해 정규화하는 구조를 제안하고, 류큐어족에 속한 두 언어인 오키나와어와 미야코어 자료를 사용해 실험하여 언어학적으로 유의미한 조어형을 예측할 수 있음을 확인한다.