In this work, we study a Korean text-to-speech conversion system. In this system, a syllable is used as a phonetic unit, and the linear predictive coding (LPC) using the recursive least-squares (RLS) algorithm is used to model speech signals. We concentrate on devising a syllable concatenation rule and a prosody rule by which the text-to-speech conversion system can yield the intelligibility and naturalness of synthetic speech. We have used two methods to concatenate syllables. Concatenation by interpolation is done in the case of voiced sound, and direct concatenation is done in all other cases. Prosody that is concerned with accent and intonation is the most important factor for intelligibility and naturalness of synthetic speech. We have studied Korean accent and intonation, and made general rules for the text-to-speech conversion system. The synthetic speech from the Korean text-to-speech conversion system is fairly intelligible and natural, but improvement of speech quality appears to be required for the practical usage.
본 연구는 임의의 한글 text를 이에 대응하는 음성으로 발생시키는 한국어 음성합성 system에 관한 것으로, 우선 음성합성 system에 사용될 phonetic unit를 한국어 관점에서 비교. 분석하여 한국어에 알맞은 phonetic unit를 선택하였으며, 이를 database로 구축하는 방법에 대하여 연구하였다. 또한 한국어 음성합성 system에 의하여 합성된 합성음의 음질 향상을 위하여, 단어를 구성하는 음절과 음절사이에서 발생하는 모든 경우에 대하여, 두 음절을 연결할 수 있는 음절 연결규칙을 만들어 음성합성 system에 적용시켰으며, 또한 합성음의 자연스러움과 밀접한 관계가 있는, 한국어 accent와 intonation에 관하여 연구함으로써 음절 연결규칙을 만들어 음성합성 system에 적용시켰다.