Robot industry is demanding robot auditory system in a specific type of artificial ears shaped after human external ear, particularly pinnae, for human-robot interface, especially for localization of human. Researches on sound source localization methods for robot artificial ears have been started recently. However, those are not adequate enough to be practical with specific constraints given by the robot industry such as pinnae size, the number of microphones and sampling frequency and so on.
This thesis is related to speaker localization, especially direction for Humanoid Robot using modularized localization sensor in a type of artificial ears and proposes a specific application of sound source localization method appropriate for modularized robot artificial ears, each of which consists of a pair of microphones and single pinnae with 7cm in length corresponding to human average pinnae size. The placement of pinnae and microphones for sound localization sensor module and signal processing, i.e. cleansing method for eliminating reflected waves induced by robot platform are essential parts of this thesis. Localization performance of the proposed method for speech source localization in an office environment is evaluated. Therefore, we confirm that robots with modularized localization sensor can estimate azimuth and elevation angles of a speaker just using Inter-channel Transfer Function (IcTF) magnitude and phase responses measured from four microphone output signals.
음원 위치 추정은 listener에 의해 인지된 소리가 어느 위치에 있는지에 대한 분별 능력 혹은, 마이크로폰 어레이에 의해 측정된 음향신호를 이용하여 공간상의 음원의 위치를 추정하는 기술을 일컫는다. 이러한 기술은 3차원 가상입체음향 산업, 인간형 지능로봇의 화자인식, 방범/군사용 감시 시스템, 원격 회의 등과 같은 여러 공학적 분야에 적용되고 있으며 특히, 로봇 산업의 경우, 이러한 기술은 로봇과 인간의 효과적인 상호작용을 위한 중요한 기술 중 하나로 시각 정보와 함께 보다 자연스러운 상호작용을 위해 사용되고 있다.
만약 이러한 음원 위치 추정기술이 시각 정보에만 의존할 경우, 화자가 시각 센서의 시야 내에 존재하여야 한다는 단점이 있으며 또한 로봇이 존재하는 공간의 조명 등의 환경 조건에 의해 영향을 받는다. 이러한 이유로 근래에 들어 청각에 의한 인지에 대해서도 많은 관심과 발전이 이루어지고 있다.
인간형 지능로봇의 궁극적인 목표는 로봇과 이의 사용자, 즉 인간과 공존하는 것으로 로봇과 사용자 간의 자연스러운 소통을 위하여 인간과 닮은 로봇에 대한 요구가 대두되고 있는 실정이다. 하지만, 인간과 유사한 청각 형태를 부여하기 위해 마이크로폰의 위치를 사람의 귀의 위치와 같이 좁은 영역에 제한 시키고 사람의 외이의 형태를 모방한 작은 크기의 간단화된 귓바퀴 구조를 사용할 경우, 기존에 사용된 방법들은 협소한 검지 영역 또는 인간의 음성에는 반응을 하지 못한다는 단점으로 인해 로봇 산업에 적용되기란 한계가 있다. 따라서 본 연구에서는 기존 방법들의 문제점을 보완하여 작은 크기의 귓바퀴 하나와 마이크로폰 두 개로 이루어진 인공 귀 한 쌍을 이용하는 음원 위치 추정 방법을 제안하며 사무실 환경에서 이루어진 실험을 통해 제시한 음원 위치 추정 방법의 가능성을 살펴보도록 한다.