서지주요정보
Acoustic focusing using beamforming for augmented sensing = 감각 증강을 위한 빔형성 기법에 근거한 음향학적 집속
서명 / 저자 Acoustic focusing using beamforming for augmented sensing = 감각 증강을 위한 빔형성 기법에 근거한 음향학적 집속 / Peter Gormsen.
저자명 Gormsen, Peter ; 곪슨, 피터
발행사항 [대전 : 한국과학기술원, 2016].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8029964

소장위치/청구기호

학술문화관(문화관) 보존서고

MME 16077

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Selective listening is a key feature of the human auditory system. It is the ability to selectively listen to one specific talker or voice in presence of multiple talkers, voices and/or background noise. The auditory system does this by using complex binaural signal processing that can exploit directional, spectral and visual cues. The task of selective listening in such complex sound environments has been termed the "cocktail party problem". Studies have shown that listeners with sensorineural hearing loss experience greater difficulty in these situations. Much attention has been given to this issue by research institutions and hearing aid manufacturers. Recently, different solutions based on the use of microphone array beamforming have been proposed. These solutions can generally be divided into fixed beamforming or adaptive beamforming systems. Fixed beamforming systems do not depend on the input, whereas adaptive beamforming systems can adapt their directional properties depending on the sound field. Adaptive systems can potentially achieve greater performance in certain situations, but fixed beamforming systems are generally said to be more robust and versatile. In this thesis, a solution to the cocktail party problem based on fixed beamforming for a microphone array will be described. A special trait of the solution proposed is the focus on obtaining a frequency invariant response. Frequency invariant beamforming avoids a coloration of the sound that most conventional methods do not. Yet, existing research on the subject has been found to be very limited. To investigate the performance of the proposed method, simulations and measurements have been conducted. Ideally, subjective testing should be performed to test the speech intelligibility of subjects using the proposed system method to other available methods. Unfortunately, such a test is very extensive and beyond the scope of this thesis. Lastly, interesting topics worthy of further research will be discussed.

선택적듣기 능력은 인간 청각 기관의 핵심 기능이다. 이것은 여러 화자의 음성과 배경 소음이 동시에 존재할 때 선택적으로 특정 화자 음성을 들을 수 있는 능력을 말한다. 청각 시스템은 복잡한 양귀에 들리는 신호를 이용한 복잡한 신호처리를 통하여 방향성, 주파수 대역 정보를 얻고 이와 시각적 정보를 종합하여 이러한 능력을 발휘하는 것으로 알려져 있다. 이러한 매우 복잡한 음향 환경에서의 선택적 듣기 능력을 통상 "칵테일 파티 문제" 라고 부른다. 연구에 따르면 감각신경성 청력손실이 있는 청자의 경우, 이러한 환경에서 큰 어려움을 겪는 것으로 보인다. 않은 연구기관 특히 보청기 업체들이 이 문제에 많은 관심을 보이고 있다. 최근에 마이크로폰 어레이에 기반한 빔형성 기법을 응용하는 다양한 해법들이 제안되었다. 이러한 해법은 고정 빔형성 과 적응형 빔형성 기법으로 나눌 수 있다. 고정 빔형성 법은 입력에 대하여 빔형성 특성이 고정적이나, 적응형의 경우에는 음장의 변화에 따라 지향성을 바꾸어 줄 수 있다. 적응 형 시스템은 잠재적으로 특정한 상황에서 높은 성능을 달성할 수 있지만, 고정 빔 형성 시스템은 일반적으로 더 강건하고 다용도로 사용 가능한 것으로 알려져있다. 본 연구에서는 마이크로폰 어레이와 고정형 빔형성 법을 사용한 칵테일 파티 문제의 해결 방안을 제안하고자 한다. 주파수에 따른 빔형성 특성 변화가 최소화되도록 설계하는 것에 초점을 맞추어 해결 방안을 제시하고자 한다. 일반적인 빔 형성 기법은 주파수 영역에 따라 다른 특성을 보여 착색 효과가 현저할 수 있으나 주파수 불변 빔형성 기법은 이러한 착색효과를 최소화 내지는 방지 할 수 있다. 본 연구 주제에 대한 기존의 연구는 매우 제한적인 것으로 보인다. 제안된 방법의 성능을 모의 실험과 측정 실험을 통하여 알아 보았다. 이상적으로, 주관적인 테스트를 통하여 제안한 방법과 기존의 기법을 비교하여 음성 명료도를 측정하는 것이 필요하나, 이는 대규모의 주관 평가를 필요로 하여 본 연구의 범위를 넘어선다. 마지막으로, 가치있는 추가 연구 방향 내지는 주제를 제안한다.

서지기타정보

서지기타정보
청구기호 {MME 16077
형태사항 xii, 71 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 피터 곪슨
지도교수의 영문표기 : Youngjin Park
지도교수의 한글표기 : 박영진
Including Appendix
학위논문 학위논문(석사) - 한국과학기술원 : 기계공학과,
서지주기 References : p. 69-71
주제 microphone array beamforming
frequency invariant beamforming
wearable microphone array
QR CODE qr code