In this thesis, we propose an efficiently representing method of spatial cues used in multi-channel spatial audio coding. The Binaural Cue Coding (BCC) method introduced recently represents multi-channel audio signals by means of mono signal and spatial cues, e.g., the Inter-Channel Level Difference(ICLD) and the Source Index(SI) . We try to express ICLD and SI information more efficiently based on the Inter-Channel Correlation (ICC) We apply the strategy of varying the type of spatial cues according to the ICC. When the SI is used as spatial cues, audio quality degradation occurs in output channels because the spectrum is empty at other channels that are not indexed. In order to solve the problem, we propose a compensation method for empty spectra created by utilizing the SI.
In our experiments, we perform a MOS test and measure the spectral distortion in order to confirm the performance of our proposed method. The results show that bit rate of side information is reduced by applying the strategy of varying the type of spatial cues based on the ICC and that the proposed compensation method is a simple but effective method to reconstruct the empty spectra of output channels from the comparison of the spectral distortion. Consequently we confirm that the proposed method can reduce the bit rate of side information without noticeable degradation in the audio quality.
본 논문은 기존의 Binaural Cue Coding 을 기반으로 효율적인 binaural cue parameter 표현방법과 빈 스펙트럼의 보상방법을 통해 큰 음질의 저하없이 side information의 비트 율을 줄이는 방법을 제안한다.
Spatial Audio Coding 분야에서 최근 소개된 Binaural Cue Coding(BCC) 방식은 각 채널간의 레벨 차(ICLD: Inter-channel level difference), 또는 음원의 채널정보(SI: source index)등을 이용하여 다채널 오디오 신호를 표현하였다. 본 논문에서는 채널간의 상관성에 기반하여 ICLD와 SI 정보를 보다 효과적으로 표현하려 하였다. 예를 들어 상관성이 적은 신호구간에서는 SI를 이용한 표현방법을 적용하고, 상관성이 클 경우 ICLD를 이용한 표현 방법을 적용함으로써 비트 율을 감소 시켰다. 또한 SI를 사용함으로써 발생하는 손실된 스펙트럼 정보를 음향적 특징을 이용하여 보상하는 방법을 제안하여 음질의 열화를 최소화 하였다.
본 논문의 실험결과는 제안된 방법과 BCC 방법에 의해 제생된 다채널 오디오 신호에 대하여 주관적 평가와 객관적 평가를 수행하였다. 실험 결과로부터 채널간 상관도에 따라서 spatial cue를 변화하늘 방법이 사이드 정보의 비트 율을 줄일 수 있다는 것과 빈 스펙트럼을 재생하기 위해 본 논문에서 제안한 방법이 간단하지만 효과적이라는 것을 알았다. 따라서 본 논문에서 제안한 방법을 적용하여 부호화 되고 재생된 다채널 신호는 큰 음질의 저하 없이 사이드 정보로 적은 비트 율을 가진다.