In this thesis, we implement a system to correct accent, pronunciation, and intonation in spoken English pronounced by nonnative English speakers. In case of the accent evaluation, energy and pitch information are used to find stressed syllables, and then we extract the segment information for input patterns using a dynamic time warping method to discriminate and evaluate accent position. For the pronunciation evaluation, we utilize the segment information using the same algorithm as in accent evaluation and calculate the spectral distance for each corresponding phoneme between input and reference speech. For the intonation evaluation, we propose nine patterns of pitch slope to model various pitch contours, then we grade test sentences by utilizing accumulated error obtained by the distance measure and estimated slope patterns.
Our result shows that 98 % of accent and 71 % of pronunciation evaluation agree with perceptual evaluations. And for the result of the intonation evaluation, our system produces similar grades for four sentences having different intonation patterns to the perceptual evaluations.
한국인이 영어를 습득하는데 있어서 발성에 대한 교정을 받기위해서는 전문가의 지도를 받거나 어학용 기기를 통한 반복청취 및 발성을 통해 습득하는 것이 상례였다. 본 연구에서는 영어를 익히고자 하는 초보자에게 본인의 발성 및 성취도에 대한 자기 진단을 하면서 영어를 습득할 수 있도록 하는 알고리즘 및 시스템을 구현함이 목적이다. 구현할 알고리즘의 평가항목은 영어단어 발성시 액센트와 발음을, 영어문장에서는 억양과 발음을 평가해 줄 수 있도록 구성하였다. 액센트를 평가하기위해서는 에너지와 피치정보를 제안된 알고리즘에 적용하였고, 발음에 대한 평가는 spectral 거리측정을 이용하는 것을 기반으로 수작업된 분할 정보를 이용하거나 음소 테이블 및 유성음/무성음/묵음 분류기를 이용한 자동 분할 정보를 이용하여 구현하였다. 억양에 대해서는 발성패턴과 기준패턴의 피치궤적에서 각각의 포락선을 제안된 9개의 linear slope패턴을 이용하여 모델링하고 여기서 발상하게 될 81가지 mapping 패턴을 테이블로 만들어 유사도에 따른 가중치를 구하였다.
시스템의 성능 측정은 각 항목에 대한 주관적 평가를 실시하고 시스템이 내린 평가결과와 비교하도록 했다. 그 결과 엑센트는 98%, 발음은 71%, 억양은 80%의 유사도를 나타내었다.