The objective of this study is estimating the location of interested sound source by using the similarity between a beamformer output in time domain and the candidate signal. When several sound sources emit a noise simultaneously, conventional beam-forming method has a limitation that it can only estimate the location of a source which beam power is maximum. For this reason, another localization method should be required to estimate other source’s location.
The waveform of beamformer output in time domain at the location of sound source is similar with the waveform emitted by that source. To estimate the location of sound source by using this feature, similarity between candidate signal and beamformer output is quantified. And the maximum location of similarity is estimated a location of source.
The similarity can be defined into two methods. The first one is direct comparison method. This method uses two time-vectors those are beamformer output and candidate signal. In this method, inner product and angle between two vectors are defined as similarity. The second one is indirect comparison method which uses a spectrogram and an AR model parameter for comparison between beamformer output and candidate signal. Cross-correlation and structural similarity are defined as similarity in this method.
To figure out the results and performance of localization by using these similarities, we demonstrate two conditions. The one condition is when two pure tone sources exist and the other condition is when several bird sounds exist.
As a consequence, inner product with two time-vectors and structural similarity with spectrograms can estimate the locations of interest sound source.
본 연구의 목적은 시간 영역의 빔 출력과 후보 신호 사이의 유사도를 이용하여 관심있는 음원의 위치를 추정하는 것이다. 다수의 음원이 있는상황에서, 기존의 빔 형성 방법은 빔 출력이 최대인 음원의 위치만 추정하는 한계가 있다. 따라서 다른 음원의 위치를 추정하기 위해선 다른 방법이 필요하다.
소음원이 있는 위치 혹은 방향에서의 빔 출력은 그 음원이 내는 신호와 파형이 유사하다. 이 성질을 이용해 관심 음원의 위치를 추정하기 위해 후보 신호와 빔 출력사이의 유사도를 정량화 한다. 그리고 유사도의 최대값을 이용해 음원의 위치를 추정하고자 한다. 유사도를 정의하는 방법은 크게 두가지로 나뉜다. 먼저 직접 비교방법은 빔 출력과 후보 신호를 시간 벡터로 구성하고, 두 벡터사이의 내적과 각도를 유사도로 정의한다. 또 다른 방법으로는 간접적으로 비교하는 방법으로 신호의 스펙트로그램과 AR 모델계수로 나타내고, 상호상관과 구조 유사도를 이용해 유사도를 정의한다.
이 유사도를 이용한 위치 추정결과를 분석하고 그 성능을 알아보기 위해 주파수가 다른 두 순음 음원이 존재하는 상황에서의 위치 추정 결과와 종류가 다른 새소리가 존재할때, 두 가지 상황에 대해 모사실험을 수행했다. 그 결과 내적을 이용한 방법과 스펙트로그램 사이의 구조 유사도를 적용했을때 관심 음원의 위치를 추정할 수 있다.