This paper presents an audio signal processing system that automatically transfers singing expressions from one voice to another. Depending on singers' skills, a song is sung with great variations in terms of note onset time, pitch and energy. The system focused on extracting and transferring musical expressions, excluding the timbre of singers. This singing expression transfer system can provide more intuitive guidance to those who want to learn new vocabulary expressions and help the music activities of those who have difficulty in singing. The system transfers expressions in the order of tempo, pitch, and energy. In this study, we propose an algorithm to align the tempo of the note, a method to match pitch and energy information, and a method to optimize the performance of these processes. Based on these methods, we propose a new singing expression transfer system and propose a new approach to singing voice modification.
본 논문에서는 자동적으로 가창 표현을 한 목소리 신호에서 다른 목소리 신호로 이식하는 오디오 신호처리 시스템을 제안한다. 가창자의 능력에 따라 같은 노래를 부르더라도 음의 시작점, 음정, 에너지와 같은 부분에서 큰 변화가 발생할 수 있다. 이 시스템은 이러한 가창자의 고유의 음색을 제외한 음악적인 표현들을 추출 및 적용하는 것에 중점을 두었다. 이러한 가창 표현 이식 행위는 노래 부르기를 어려워하는 사람들의 음악 활동에 도움을 주고, 새로운 가창 표현을 학습하려는 사람들에게 보다 직관적인 가이드라인을 제공해 줄 수 있다. 이 시스템은 차례대로 음의 타이밍 정보와 음정, 그리고 에너지를 일치시키는 방식으로 표현을 이식한다. 본 연구에서는 이를 위해 음의 타이밍 정보를 일치시키는 알고리즘, 음정과 에너지 정보를 일치시키는 알고리즘, 그리고 해당 알고리즘의 성능을 최대한 개선시키고 최적화하는 방법을 제안한다. 그리고 이러한 세부 방법들을 기반으로 가창 표현 이식 시스템을 제안하여 가창 표현 수정에 대한 새로운 접근법을 제시하려고 한다.