서지주요정보
Source localization algorithms in binaural processing models = 두귀의 정보처리를 이용한 음원 국지화 알고리즘
서명 / 저자 Source localization algorithms in binaural processing models = 두귀의 정보처리를 이용한 음원 국지화 알고리즘 / Young-Ik Kim.
발행사항 [대전 : 한국과학기술원, 2003].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8013806

소장위치/청구기호

학술문화관(문화관) 보존서고

MMA 03012

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

This thesis presents sound source localization algorithms in binaural processing models. We propose two new binaural source localization algorithms. One is a time-domain processing algorithm for finding sound source direction using principal component analysis (PCA) of input correlation matrix. And another is a frequency domain method to estimate useful binaural cues of interaural time difference (ITD) and interaural intensity difference (IID) using zero-crossings and peak amplitudes (ZCPAs) of cochlear filter output signals. Both of our methods are practical to the source localization problem. However the PCA method has relatively large variance for an accurate estimation of source direction and cannot be applied to multiple source conditions. The ZCPA method can capture accurate source directions even in multiple sound sources. With simulations in diffusive and interfering noisy conditions, we verified that the suggested algorithms are effective to the source localization problem.

인간은 여러가지 소리가 들리는 잡음환경 속에서 쉽게 특정한 소리에 주의집중하여 인지하는 능력을 가지고 있다. 인간의 그러한 능력은 여러가지 생리학적/인지학적 정보처리에 기인하겠지만, 무엇보다 두 귀를 이용하여 특정한 소리를 국지화한 다음 주의집중하는 데 있다고 하겠다. 이 논문에서는 인간이 두 귀를 이용해서 소리의 방향을 찾는 과정을 수학적으로 모델링하는 두가지 새로운 방법을 제시한다. 첫번째 방법에서는, 두 귀에서 입력된 음성 데이터로 상관행렬(input correlation matrix)을 만든다음, 그 주요성분(principal component)이 가지는 각과 실제 소리가 들려오는 방향의 관계를 이용해서 특정 소리의 방향을 예측한다. 이때 2차원의 입력 데이터를 가지고 해석을 하기 때문에 2개 이상의 소리에 대해서는 이론적으로 예측이 힘들다는 단점을 가진다. 그리고 실험을 통해 방향 예측치의 오차범위가 너무 크다는 단점을 확인하였다. 두번째 방법은, 인간의 청각모델에 기초한 방법으로, 먼저 입력된 음성 데이터를 인간의 청각기관인 내이에 해당하는 주파수 분리기(cochlear filter-bank)를 거친 다음, 신호의 영점교차지점과 그때의 최대치(zero-crossing and peak amplitude, ZCPA)를 구한다. 그리고 왼쪽귀의 ZCPA들과 오른쪽 귀의 ZCPA들을 서로 비교하여 상관관계(cross-correlation)가 가장 클때의 시간지연 차이(interaural time difference, ITD)와 크기 차이(interaural intensity difference, IID)를 구한다음, 이 두가지 차이로 소리의 방향을 예측한다. 이 방법은 두개 이상의 소리가 들리는 상황에서도 방향의 예측이 가능하며, 실험에서도 오차의 범위가 낮게 나타났다. 하지만, 특정 주파수에 두개 이상의 소리가 같은 크기로 썩이는(SNR = 0dB) 경우에는 역시 정확한 예측이 어렵다. 우리는 ZCPA를 이용한 방법을 기존에 제시된 다른 방향예측 방법과 성능비교 및 잡음에 강인한 정도를 해석적으로 검토해 볼 계획이다. 그리고, 앞으로는 이 연구를 바탕으로 방향성 필터링(directional filtering) 기술을 개발하는데 주력하고자 한다.

서지기타정보

서지기타정보
청구기호 {MMA 03012
형태사항 i, [37] p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 김영익
지도교수의 영문표기 : Rhee-Man Kil
지도교수의 한글표기 : 길이만
학위논문 학위논문(석사) - 한국과학기술원 : 응용수학전공,
서지주기 Reference : p. 35-36
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서