서지주요정보
New feature subset selection method and its applications for EMG recognition = 새로운 특징 집합 선택 방법과 근전도 신호 인식에의 응용
서명 / 저자 New feature subset selection method and its applications for EMG recognition = 새로운 특징 집합 선택 방법과 근전도 신호 인식에의 응용 / Jeong-Su Han.
발행사항 [대전 : 한국과학기술원, 2006].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8017067

소장위치/청구기호

학술문화관(문화관) 보존서고

DEE 06019

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Recently, bio-signals, such as EMG, EEG, and EOG have been considered as means of communication and control of human-machine systems. The effective recognition of these signals is a promising theme of study since it provides with convenient means for human-machine interaction such as the brain computer interface (BCI) that uses electroencephalogram (EEG), the prostheses controller using electromyogram (EMG), and the mouse using electroolfactogram (EOG). The EMG signal is a form of electric manifestation of neuromuscular activation associated with a contracting muscle. EMG signals have following characteristics. First, EMG signal is nonstationary. Second, EMG signal is different from person to person. There are various factors that affect the physiological bio-signals such as EMG signals. These factors are both internal such as thickness of skins, tissues, and difference of the number of muscle fibers, and external such as electrode-electrolyte interface, and electrode configuration. One of major applications for EMG signals is the control of powered prosthesis. Beyond this rehabilitation application, nowadays, EMG signals are adopted for new human-machine interfaces. A mouse cursor interface, a powered wheelchair interface, and an environment control unit are some representative examples. To apply EMG signals as an input interface to these systems, we must solve the user-dependency problem of EMG signals. To handle this user-dependency problem, we may adopt two very different approaches. One direction is called "personalization" technique. This scheme admits the different characteristics of each user and tries to design personalized pattern recognition structures. To accomplish this task, it may utilize a user-dependent feature selection process and/or an adaptive classifier. In this approach, however, there are two main shortcomings. One is the necessity of an additional system such as a user identification recognition system to make the pattern recognition system know who he/she is. Because personalized recognition system is turned to a specific user, we must let the system know who the user is. The other is that a preprocessing step such as initial learning or feature subset selection is indispensable before using the system. This makes user tedious and the whole system inconvenient to use even if a preprocessing step is not much burden to users. In this thesis, we solve the same problem in a very different way. Our solution, which stands in opposite direction of the first method, is try to find as common characteristics of users as possible. Here common characteristics of users mean common feature subset which works well to all users. To select such a feature, we define a new criterion function, called classifiability. Conventional distance-based criterion functions give how separate feature distribution is but classifiability reveals classification capability of a specific feature for classes. We propose a new criterion function, classifiability, based on separability index matrix (SIM), which provides relevant features with very low computational cost. Based on the proposed criterion function, classifiability, and in reference to the forward search technique, we propose a new feature selection algorithm (SIMF). To cope with the user-dependency of EMG signals, we propose common separability index matrix (cSIM) and modified SIMF. By using this simple concept and modified SIMF, we make the feature selection algorithm find less user-dependent feature subsets. In extensive experimental comparisons, the proposed algorithm outperformed other filter-type feature selection methods for various criterion functions in terms of classification ac-curacy, feature selection cost, and robustness to noise features such as irrelevant and/or redundant features. In experimental results for EMG signals, the selected feature subset shows quite user-independency. The proposed concept, classifiability, SIMF, and cSIM can be applicable to the general feature selection problem. It means that the proposed concepts have larger extendability. As for further developments, we will develop the proposed algorithm for discrete datasets, which will make it applicable for a wide range of applications particularly in machine learning and data mining.

인간-기계, 인간-로봇의 새로운 인터페이스의 하나로 생체신호는 최근에 사람들의 많은 관심을 받고 있다. 신호처리 기술의 발달과 소형화된 하드웨어의 개발로 인간의 몸에서 발생하는 여러가지 생체신호를 각종 시스템의 입력원으로 사용하려는 시도가 많이 이루어지고 있다. 근전도 신호는 근육의 수축시 발생하는 생체신호의 일종이다. 신호적인 특징으로 첫째, 비정상적(nonstationary) 특성을 가지며, 둘째 근육의 구성하는 Motor Unit의 수의 차이, 피부의 두께의 차이 등과 같은 생리학적인 이유와 근전도 측정 장비의 효과 등을 포함하는 외부적인 요인으로 인해 신호적 특성이 사람마다 다르게 나타난다. 마지막으로 신호의 크기가 수 mV로 주위 환경의 노이즈에 많이 영향을 받는다. 근전도 신호는 전동의수의 제어원으로 많이 사용되어져 왔다. 근육이 절단된 환자를 위한 전동의수를 제어하기 위해 사용자의 의지로 움직임이 가능한 근육에서 근전도 신호를 측정/해석하여 자연스럽게 의수를 제어한다. 특정 사용자를 대상으로 하는 시스템에서 사용되었던 근전도 신호가 새로운 입력 수단의 하나로 인식이 되면서 웨어러블 컴퓨터를 위한 마우스 제어, 각종 ECU(Environment control unit)의 입력수단으로 사용되기 시작하였다. 이와 같은 입력 장치들은 특정 사용자만을 위한 시스템이 아니라 다수의 사용자를 대상으로 시스템이 개발되어야 한다. 그러나 사람마다 다른 근전도 신호의 특성이 시스템의 개발을 어렵게 하고 있다. 이와 같은 개인적인 특성 차이로 인한 문제점들을 해결하기 위해서 크게 두 가지 방법이 있다. 첫째는 개인화(personalization)으로 대표되는 방법이고 둘째는 본 논문에서 새롭게 방법을 제안한 사용자들간의 유사성을 최대한 찾는 방법이다. 개인화 방법은 특징 선택 과정의 개인화 과정과 패턴 인식기의 적응과정을 포함한다. 이러한 개인화 과정은 인식 시스템에게 현재의 사용자를 알려주기 위한 부가적인 시스템이 반드시 필요하다. 왜냐하면 인식 시스템은 특정 개인에게 최적화되어 있으므로 시스템을 사용하기 전에 반드시 시스템은 현재 누가 사용자인지를 알아야 한다. 또한 특징 추출 및 학습 등의 초기화 과정은 시스템 사용의 편이성을 떨어뜨린다. 사용자들간의 유사성이란 본 논문에서 여러 사람들에게 잘 적용 가능한 공통 특징 집합을 의미한다. 기존의 특징 집합의 우수함을 평가하기 위한 여러 평가 함수는 특징 집합의 거리 값에 의존한다. 따라서 특정 사용자의 특징 분포가 다른 사용자들의 특징 분포와 다른 분포를 갖는다면 기존의 평가함수를 통해서 공통의 특징 집합을 찾을 수 없다. 또한 특정 클래스간의 거리가 큰 상태가 전체 특징 집합의 우수성을 제대로 평가하지 못하는 결과를 유발한다. 따라서 본 논문에서는 분리지표 행렬(Separability Index Matrix)에 기반하여 Classifiability라는 새로운 개념의 특징 평가 함수를 제안하였다. 이 함수는 특징 집합의 분리도가 아니라 클래스의 분류능력을 평가하는 함수이다. 즉 Classifiability가 높은 특징 집합은 그렇지 않은 특징 집합에 비해 더 큰 분류 능력을 갖는 집합을 의미하며 이는 곧 더 낮은 오분류율을 발생시킨다. 제안한 분리지표 행렬과 Classifiability를 이용하여 새로운 특징 집합 선택 방법(SIMF)을 제안하였다. 순방향 Search방법에 기반한 제안한 특징 선택 방법은 `Relevance 갱신과정\'을 통해 그 다음 좋은 특징 집합을 최소의 계산량으로 찾는다. Relevance 갱신과정은 다른 특징 집합 선택 방법과 구별되는 과정으로 다음에 찾아야 하는 특징은 현재 찾은 특징 집합이 구별하지 못하는 클래스를 구별할 수 있는 특징임을 찾는 과정이다. 제안한 특징 선택 방법은 찾은 특징 집합이 'fully separable condition'을 만족할 경우 특징 추가 과정을 멈춘다. 이 조건은 찾은 특징 집합이 주어진 특징 집합들 중에서 최소 평균 이상의 분리도를 갖는 특징 집합의 조합임을 나타낸다. 근전도 신호의 사용자 의존성을 해결하기 위해 분리지표 행렬의 개념을 확장하여 공통 분리지표 행렬(Common Separability Index Matrix)을 제안하였다. 공통 분리지표 행렬은 사용자에 무관하게 각 특징이 갖는 공통의 분류 정보를 포함하는 행렬이다. 이 행렬과 수정된 특징 집합 선택 방법(SIMF)을 이용하여 근전도 신호의 사용자 의존성을 해결하였다. 제안한 알고리즘의 유용성을 평가하기 위하여 벤치마크 데이터로 잘 알려진 UCI 데이터를 사용하였다. 평가항목은 오분류율, 특징 선택 소요 시간, 잡음 특징(redundant, irrelevant feature)에 강인성 유무를 사용하였다. UCI 데이터에서 특징의 수가 10개 이상이고 missing 특징이 없고, 그 특징 값이 연속이 10개의 데이터 집합에 대해서 평가하였다. 평가 결과 제안한 특징 선택 방법은 기존의 여러 다양한 방법에 비해 더 낮은 오분류율을 보고하였다. 그 뿐만 아니라 제안한 특징 선택방법은 특징을 가장 빨리 찾는다고 알려진 best individual search방법만큼 빠르게 특징을 찾음을 확인할 수 있었다. 또한 기존의 여러 특징 선택 방법이 잡음 특징에 그 성능이 저하됨에 비해서 제안한 방법은 잡음 특징에도 상당히 강인한 모습을 보여주었다. 이와 같은 좋은 특성은 본 논문에서 제안한 Classifiability, Relevance 갱신과정에 기인한다. 근전도 신호의 사용자 의존성을 제안한 공통 분리지표 행렬과 특징 선택 방법이 해결하는지를 확인하기 위해서 10명의 사용자로부터 6가지 동작에 해당하는 근전도 신호를 획득하였다. 10명의 사용자를 임의로 6명과 4명의 사용자 그룹으로 나눈 뒤 6명의 사용자에게서 선택한 특징 집합이 나머지 4명에게 어떤 성능을 발휘하는지 확인하였다. 이와 같은 실험을 20회 반복하였다. 특징 선택 결과 제안한 알고리즘은 10명의 사용자를 모두 고려하여 선택한 특징과 평균 90%이상 유사한 특징 집합을 선택하였다. 하지만 기존의 방법은 40%에서 100%까지 그 유사도가 사용자 그룹에 따라 많은 차이를 나타내었다. 또한 선택한 특징 집합을 이용하여 오분류율을 측정하였을 때에도 제안한 알고리즘이 기존의 알고리즘보다 아주 우수한 성능을 나타냄을 확인할 수 있었다. 본 논문에서는 근전도 신호의 사용자 의존성을 해결하기 위해서 분리지표 행렬, Classifiability 등의 새로운 개념을 제안하고 이를 바탕으로 새로운 특징 선택 방법을 제안하였다. 이러한 개념과 방법은 비단 근전도 신호에만 한정적으로 적용되는 것이 아니라 일반적인 특징 선택 문제에도 잘 적용될 수 있음을 실험을 통해 확인하였다. 또한 근전도 신호를 포함하는 다른 여러 생체신호의 사용자 의존성을 해결할 수 있는 방법을 제시하였다. 이는 본 논문에서 제안한 여러 가지 개념들이 넓은 확장성을 가짐을 의미한다. 제안한 여러 개념들을 패턴 인식 문제뿐만 아니라 데이터 mining, machine learning 등의 분야의 discrete 데이터를 다루는 문제로의 확장이 추후 필요하다.

서지기타정보

서지기타정보
청구기호 {DEE 06019
형태사항 xi, 113 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 한정수
지도교수의 영문표기 : Zeung-Nam Bien
지도교수의 한글표기 : 변증남
학위논문 학위논문(박사) - 한국과학기술원 : 전기및전자공학전공,
서지주기 Reference : p. 109-113
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서