Ambsonic is a technique that decomposes a desired sound field into a combination of a limited degree of spherical harmonic function and reconstructs the contribution of each spherical harmonic function. However, when only a limited degree of spherical harmonic function is used, the physical area reproducible on high frequency range becomes smaller than the head size. Previous studies include decoding techniques called Max-rE which define and maximize energy vectors, and high-order Ambsonic which uses higher order spherical harmonics. However the energy vector is not proved with the actual sound localization, and the high-order Ambsonic technique has a disadvantage of using a plurality of speakers. In this study, novel decoding technique provide a consistent sound localization regardless of listener's head rotation in the high frequency band with a small number of speakers. Specifically, proposed method decomposes head-related transfer function into spherical harmonic function and reproduces interaural level difference using harmonics coefficients of desired sound field. As a result, interaural level difference of proposed method is improved comparing with previous methods.
앰비소닉 디코딩 기법은 목표 음장을 제한된 차수의 구면조화함수의 조합으로 분해하고, 각 구면조화함수의 기여도를 스피커들로 재구성함으로써 청취자에게 음향 현장감을 제공해주는 기술이다. 하지만, 제한된 차수의 구면조화함수만을 사용하는 경우, 고주파 대역에서 재현 가능한 물리적인 영역이 머리 크기보다도 작아지게 된다. 이 문제를 해결하기 위한 기존 연구들로, 에너지 벡터를 정의하고 이를 최대화 하는 에너지 벡터 최대화 디코딩 기법과 물리적으로 고차의 구면조화함수들까지 재현하는 고차 앰비소닉 기법들이 있다. 하지만 에너지 벡터는 실제 방향 인지와의 관계가 충분히 증명되지 않은 물리량이며, 고차 앰비소닉 기법은 다수의 스피커를 사용해야 하는 단점이 있다. 본 연구에서는, 기존 앰비소닉에서 재현이 어려운 고주파 대역에서 청취자 머리 회전에 일관된 방향인지를 소수의 스피커로 제공해 줄 수 있는 디코딩 기법을 제안한다. 구체적으로는, 머리전달함수를 고차의 구면조화함수로 분해하고, 고주파 대역의 방향 인지를 결정하는 두 귀간 레벨 차이가 청취자 머리 회전에 따른 모든 각도에서 최대한 적은 오차로 재현될 수 있도록 디코딩 기법을 설계하였다. 결과적으로 기존의 기법과 제안한 기법들 간의 비교를 통하여 특정 주파수 대역에서 두 귀간 레벨 차이가 정확히 재현됨을 확인하였다.