Recently, virtual multimedia such as 3D movie, broadcast, and virtual reality have been developed vividly with large demands and interests in many applications. Virtual Auditory Display (VAD), aims at generating spatialized virtual sound and conveying them to a listener. The Head-Related Transfer Function (HRTF), which is defined as an acoustic transfer function between sound pressure at a distal sound source and that measured in front of a listener’s ear drum, describes the physical transform of sound waves due to diffraction caused by the physical shape of a listener. HRTFs play a key role to render high-quality VAD. In this reason, various issues, e.g. interpretation, modeling, and customization of HRTFs, have been studied by many researchers.
This thesis mainly focuses on interpretation of HRTFs using the multi-dimensional analysis method: Tensor Singular Value Decomposition (Tensor-SVD). The SVD can be used to obtain orthogonal basis functions and their weightings from each dimension. The major advantage of the Tensor-SVD among various SVD methods is that the dimension of multi-dimensional data can be efficiently reduced and can be analyzed independently. As a pre-processing, it is commonly accepted to subtract empirical mean of a dataset for the reduction of basis functions caused by the mean value in HRTF analysis. However, in case of the multi-dimensional data, the mean value can be extracted from various spaces, because the data tensor has more than two dimensions. The mean values having a vector, matrices, and a third-order tensor form are extracted. The effect of the several dimensions are prominently reduced, especially for azimuth and subject axes. Therefore, it is necessary to define and extract mean value from the appropriate dimension according to the purpose of the analysis.
After extracting the proper mean value of the data, the multi-dimensional characteristics of HRTF in various domains are investigated: inter-aural time differences, time domain and log-magnitude (frequency) domain. The result shows that the analysis in particular domain has some merits and limitations. Therefore, in the multi-dimensional study of HRTF, selection of analyzing domain is necessary to utilize the characteristics of the domain. Also, the physical meanings of obtained basis functions and their weightings are explained in detail.
최근, 다양한 어플리케이션에서 3차원 영화, 방송, 가상 현실 등의 가상 멀티미디어에 대한 관심과 수요가 높아지고 있다. 가상 음향 기술은 가상의 소리를 생성하고 청자에게 전달하는 기술을 의미한다. 먼 곳에 있는 음원의 음압과 피실험자의 고막 앞에서 측정된 음압 사이의 음향학적 전달함수로 정의되는 머리전달함수는 청자의 신체적 모양에 의한 음파의 굴절과 관련된 정보를 담고 있다. 이러한 머리전달함수는 높은 품질의 가상 음향을 생성하는 데에 중요한 역할을 한다. 이러한 이유로 머리전달함수의 해석, 모델링, 맞춤화 등의 다양한 분야에 대한 연구가 많은 연구자들에 의하여 수행되어 왔다.
본 학위논문은 다차원 분석 방법인 텐서 특이값 분해를 이용하여 주로 머리전달함수의 해석에 초점을 맞추었다. 특이값 분해를 사용하여 직교한 기저 함수들과 그들의 기여도를 각 차원에서 얻을 수 있다. 다양한 특이값 분해법들 중에서 텐서 특이값 분해의 주요한 장점은 고차원 데이터의 차원을 효율적으로 줄일 수 있고, 독립적으로 분석할 수 있다는 것이다. 머리전달함수 분석에서, 평균에 의한 기저 함수를 줄이기 위한 전처리 과정으로써 통상적으로 평균 벡터 추출을 수행한다. 하지만, 고차원 데이터의 경우에는 차원의 개수가 두 개 이상이기 때문에 평균값이 다양한 형태로 정의 될 수 있다. 벡터, 행렬, 3차원 텐서 형태의 평균값을 추출하였다. 그 결과, 특히 방위각과 피실험자 축에 대한 영향이 현저하게 줄어들었다. 따라서, 분석 목적에 맞추어 적절한 차원에 대한 평균값을 추출하는 것이 필요하다.
적절한 평균값을 추출한 후, 다양한 영역에서 머리전달함수의 다차원적 특성을 조사하였다: 양이간 시간차, 시간 영역, 로그-크기(주파수) 영역. 특정한 영역에서의 분석은 장점과 단점을 가지는 것을 알 수 있었다. 따라서, 머리전달함수의 다차원적 분석을 위해서는 각 영역의 특성을 활용하여 분석하고자 하는 영역을 선택할 필요가 있다. 또한, 기저 함수들과 그들의 기여도에 관한 물리적 의미에 대하여 구체적으로 설명하였다.