서지주요정보
Extension of auditory source width by sound field reproduction = 음장 재현을 통한 음원의 너비 확장
서명 / 저자 Extension of auditory source width by sound field reproduction = 음장 재현을 통한 음원의 너비 확장 / Jung Min Lee.
저자명 Lee, Jung Min ; 이정민
발행사항 [대전 : 한국과학기술원, 2015].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8028407

소장위치/청구기호

학술문화관(문화관) 보존서고

DME 15036

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

This dissertation proposes a method to generate a virtual sound source delivering auditory illusions of its size as well as location. Conventional virtual audio systems focus on rendering sound images at the desired position for providing the localization of virtual sources. In various auditory scenes, however, spatial attributes of a sound source can be characterized in terms of size as well as location. For example, a choir or an orchestra produces the auditory sensation of larger size than a single singer. Among many attributes related to the size, auditory source width describes the perceived lateral extent of sound sources. In this study, a virtual source containing the extended width attribute as well as localization is defined as an extended virtual source. Various studies have revealed that the source width perception stems from dissimilar waves arriving at listener’s two ears, which are often caused by reflections in a natural environment. In free field, however, such dichotic listening condition can be realized by a direct wave emanated from an individual sound source. With disregarding reflections, the auditory source width of a single source is denoted as individual source width (ISW). Accordingly, the ISW can represent the width attribute of the extended virtual source. In manipulating the ISW of the extended virtual source, an objective measure for the ISW is required. As a representative measure quantifying the degree of similarity between left and right ear signals, interaural cross-correlation coefficient (IACC) is used in this study. To control the ISW by reducing IACC, a majority of audito systems employ width extension techniques based on the decorrelation of loudspeaker input signals. However, such channel-based methods inevitably restrict the size or location of the region in which the extended width perception can be created. To overcome these limitations in rendering the extended virtual source, the sound field reproduction approach is considered: the pre-defined target sound field for the extended virtual source is reproduced over a large area using a line array of loudspeakers. One of the highlights in this study is to propose a target sound field that can provide decorrelated ear signals at multiple listener positions by randomizing phase distributions in space and frequency. To this end, a higher-order sound field with polar phase variation is defined as the target sound field, and its harmonics order is given as a random number with respect to the frequency. The combination of multiple sound fields having different polar phase patterns at each frequency can produce random phase distributions over a large area. A direct solution for reproducing the proposed target sound field is then derived by approximating a general integral equation describing the target sound field. To evaluate the usable range of the proposed method, four criteria providing the possible range of minimum IACC are suggested by considering several assumptions and physical limitations. Once the array configuration and listener positions are given, the maximum ISW corresponding to the minimum IACC can be determined by the criteria. In addition, simulation results show that the proposed method can produce the IACC variation in relation to the distance between the extended virtual source and listener. A uniform IACC at different angular positions of the listener located at a fixed distance can be produced in a limited region. In representing an object-based virtual sound, such IACC variations can provide the coherent auditory and visual perspective of a virtual object to multiple listeners.

본 연구의 목적은 너비를 갖는다고 느껴지는 가상 음원을 형성하는 것이다. 일반적으로 가상 음원을 형성하기 위해 크게 두 가지 방법을 주로 사용하였다. 먼저 스테레오 스피커나 헤드폰을 이용하여 한 명의 청취자 양 귀에서의 음압을 제어함으로써 특정 방향이나 거리에 가상 음원이 위치해 있다고 느끼게끔 하는 방법이 활발하게 사용되고 있다. 최근에는 다수의 스피커를 독립적으로 사용할 수 있는 기술과 장비가 개발되면서, 청취자의 귀에서의 음압만 제어하는 것이 아닌 특정 영역에 형성되는 음장을 제어함으로써 다수의 청취자에게 가상 음원 효과를 주는 방법들이 개발되고 있다. 대표적인 방법으로 음장 재현 기술은 원하는 가상 음원 효과를 제공할 수 있는 목표 음장을 설계하고, 스피커 어레이를 통해 재현하는 방법이다. 음장 재현 기술의 주요 목적은 특정 위치에 가상 음원을 형성함으로써 다수의 청취자에게 가상 음원의 방향과 거리감을 주는 것이었다. 그러나 실제 음향 환경에서는 음원의 위치뿐만 아니라 크기감도 느낄 수 있다. 예를 들어, 합창단이나 기차와 같은 음원은 청취자로 하여금 특정 크기를 느끼게끔 한다. 이러한 음원의 크기 인지에 대한 연구는 주로 실내 음향 분야에서 활발하게 연구되어 왔다. 콘서트 홀과 같은 실내에서 존재하는 초기 반사파의 영향으로 청취자의 양 귀에 상관성이 낮은 음압이 형성됨으로써 음원의 너비(Auditory Source Width, ASW)를 느끼게 된다. 또한 이러한 인지 원리를 정량화할 수 있는 대표적인 척도로 양이간상관계수(Interaural Cross-correlation Coefficient, IACC)가 주로 사용되고 있다. 그러나 반사파가 존재하지 않는 자유 음장에서도 양 귀에 상관성이 낮은 음압이 형성되는 경우 음원의 너비를 인지하게 된다. 이와 같이 음원으로부터 발생하는 직접음에 의한 영향만으로 느껴지는 음원의 너비는 개별 음원의 너비(Individual Source Width, ISW) 또는 음원들의 앙상블의 너비(Ensemble Width)로 구분할 수 있다. 이중에서 ISW는 하나의 가상 음원으로부터 느껴지는 너비를 나타낼 수 있다. 따라서 본 연구의 목적은 청취자로 하여금 ISW를 인지시킬 수 있는 가상 음원을 형성하는 것이 되고, 이러한 가상 음원을 확장 가상 음원(extended virtual source)라고 정의하였다. 만약 다수의 확장 가상 음원을 형성하게 되면 청취자는 ISW뿐만 아니라 앙상블 너비를 느낄 수 있을 것이다. 음장 재현 방법을 기반으로 확장 가상 음원을 형성하기 위한 목표 음장을 설계하는 것이 본 연구의 주요 하이라트 이다. 특히 다수의 청취자에게 확장 가상 음원 효과를 제공하기 위해 다수의 청취자의 양 귀에 상관성이 낮은 음압을 형성함으로써 IACC를 감소시킬 수 있는 음장을 정의하였다. IACC를 감소시킬 수 있는 대표적인 방법으로는 청취자의 양 귀에서 랜덤한 위상 분포를 형성하는 것이다. 주로 스테레오 스피커의 입력 신호의 위상 분포가 랜덤하도록 하는 필터를 설계함으로써 한 명의 청취자 위치에서 IACC를 감소하였다. 본 연구에서는 이러한 원리를 확장하여 다수의 청취자 위치에서 IACC를 감소시킬 수 있는 음장을 제안하였다. 특히 청취자와 확장 가상 음원 사이의 거리가 가까워지면 IACC를 감소시켜 더 넓은 ISW를 느끼게 하거나, 반대로 거리가 멀수록 IACC를 증가시킬 수 있는 음장을 정의하였다. 또한 확장 가상 음원으로부터 동일한 거리만큼 떨어져 있지만 다른 각도에 위치한 다수의 청취자들에게는 동일한 IACC를 형성시킴으로써 동일한 ISW를 인지시킬 수 있는 음장을 설계하였다. 이를 위해 각도 방향으로 위상이 변하게끔 하는 지향성을 갖는 음장을 정의하고, 주파수에 따라 지향성의 복잡성을 랜덤하게 형성함으로써 위치에 따라 그리고 주파수에 따라 위상이 랜덤하게 분포하도록 하였다. 이와 같이 제안한 목표 음장의 IACC를 살펴봄으로써 제안한 음장이 원하는 IACC 특성을 형성할 수 있음을 알 수 있었다. 나아가 선형 스피커 어레이를 통해 목표 음장을 재현하기 위한 스피커 입력해를 함수의 형태로 제안하였다. 이를 위해 목표 음장을 적분식의 형태로 나타내고, 정지 위상 근사법(stationary phase approximation)을 통해 선형 적분식으로 근사화함으로써 스피커 입력해를 나타내는 함수를 유도할 수 있었다. 특히 기존의 단극 음원형태의 가상 음원을 형성하는 스피커 입력해와 다른 점으로 음장을 재현할 수 있는 영역이 비대칭적으로 형성되는 특징을 분석하였다. 또한 다양한 시뮬레이션을 통해 제안한 방법을 통해 제한된 영역에서 원하는 IACC분포가 형성됨을 확인할 수 있었다. 또한 본 연구는 확장 가상 음원을 형성하기 위한 이론적인 방법을 제시한 것에서 나아가 제안한 방법을 통해 감소시킬 수 있는 IACC의 범위를 제시하였다. 목표 음장이 음파 방정식을 성립하기 위한 가정과 청취자의 양 귀 사이의 제한된 거리에 대한 물리적인 제약 조건, 유한한 길이의 스피커 어레이에 의한 한계와 정지 위상 근사법을 활용할 수 있는 조건을 고려하여 확장 가상 음원과 청취자 사이의 거리에 따른 최소 IACC를 1/3 옥타브 밴드별로 제시할 수 있는 네 가지 기준을 제안하였다. 본 연구는 확장 가상 음원을 형성하는 목적을 달성하기 위해 심리 음향 인자를 정량화하기 위한 척도를 도입하여 물리적으로 제어하는 방법을 제안하였다는 데에 의의가 있다. 특히 스피커 어레이를 사용하여 다수의 청취자에게 확장 가상 음원 효과를 제공할 수 있는 방법을 제시함으로써 가상 현실(Virtual Reality) 구현 시스템이나 3D 디스플레이 장치에 적용시 보다 현실적이고 인상적인 가상 음향 효과를 줄 수 있을 것이다.

서지기타정보

서지기타정보
청구기호 {DME 15036
형태사항 vii, 247 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 이정민
지도교수의 영문표기 : Yang Hann Kim
지도교수의 한글표기 : 김양한
공동지도교수의 영문표기 : Jung Woo Choi
공동지도교수의 한글표기 : 최정우
Including Appendix
학위논문 학위논문(박사) - 한국과학기술원 : 기계공학과,
서지주기 References : p.
주제 extended virtual source
individual source width
interaural cross-correlation coefficient
sound field reproduction
decorrelation
확장 가상 음원
단일 음원의 너비
양이간상관계수
음장 재현 방법
비상관화
QR CODE qr code