Recently, HCI (Human Computer Interaction) technology for assisting disabled or elderly people has been developed. One of the recent topics is understanding user’s intention using natural signal of human such as voice or gesture. Natural signal of human is comfortable and convenient way for user to interact with the system. As an example, vision-based hand gesture can be used to control various home appliances. 3D positions of face and hands are calculated using their position on the images which are obtained by stereo cameras. Using 3D trajectory of hand, we can recognize the user’s command. The main problems which lower the performance of the hand gesture recognition system are inter-person variation and intra-person variation. If multiple users use the system, the user independent (UI) recognition algorithm generally has lower recognition rate than the user dependent (UD) recognition algorithm. Furthermore, even same user has different hand motion characteristic from time to time. When a new user uses the system, those problems lower the hand gesture recognition rate of new user. Inter-person variation can be handled by using UD model, model selection and user adaptation. Intra-person variation can be handled by using fuzzy logic which has robust characteristic to uncertainty and ambiguity of human motion.
Fuzzy decision tree learning has been widely used for classification problem because of its two advantages. The first one is powerful performance and interpretability of decision tree. The second one is ability of fuzzy logic to handle uncertainty and ambiguity. Even though fuzzy decision tree has good performance for learning and classification, it has a weakness for generalization and adaptation performance. The higher degree of overlap of fuzzy membership function is, the bigger structure of fuzzy decision tree is. Therefore the proper method to reduce the size of decision tree is required. We propose multivariate fuzzy decision tree (MFDT) for enhancement of classification and adaptation performance. The structure of fuzzy decision tree can be reduced by using multivariate concept. After building several recognition models, the best model for new user is selected by using maximum likelihood model comparison. We also propose user adaptation algorithm based on gradient descent method.
For the general performance of proposed algorithm, we tested it using benchmark data sets such as iris and wine data of UCI Machine Learning Repository. For the performance of hand motion recognition, we tested using hand motion data which is collected from 10 people for 15 days. The experimental results show the classification and user adaptation performance of proposed algorithm is better than general fuzzy decision tree.
최근 장애인이나 노약자를 보조하기 위해 목소리나 동작을 인식해 사람의 의도를 파악하는 등의 인간-기계 상호작용 기술이 발전해 왔다. 목소리나 동작은 사람의 자연스러운 신호이기 때문에 시스템을 사용하기에 편리한 인터페이스이다. 이러한 기술이 적용된 예로 가전기기를 제어하기 위한 비전 기반의 손동작 인식 시스템을 들 수 있다. 두 대의 카메라로부터 얻은 이미지에서 얼굴과 손의 위치를 찾고 3차원 좌표를 계산한다. 손의 3차원 궤적을 이용해 사용자가 어떤 명령을 수행했는지 인식할 수 있다. 이러한 손동작 인식 시스템의 손동작 인식률을 저하시키는 대표적인 원인은 사람마다 손동작이 모두 다르다는 점과 같은 사람이라도 때때로 손동작이 변할 수 있다는 점이다. 다양한 사용자의 손동작을 인식하기 위한 사용자 독립 모델은 데이터 수집이 용이하다는 장점이 있는 반면 사용자 종속 모델보다 인식률이 낮다는 단점이 존재한다. 이러한 단점은 다수의 인식 모델을 생성한 후 새로운 사용자의 손동작 특성에 가장 적합한 모델을 선택하고 사용자의 손동작 특성에 적응시킴으로써 해결될 수 있다. 같은 사람이라도 변화하는 손동작 특성은 퍼지 논리를 적용함으로 강인하게 다루어질 수 있다. 퍼지 의사결정트리는 의사결정트리 구조가 갖는 뛰어난 분류 능력과 높은 이해도를 가지며 퍼지 논리가 갖는 불확실성과 모호성에 강인하다는 장점을 갖기 때문에 분류 문제에 널리 적용되어 왔다. 그러나 노드를 분기하기 위해 퍼지 소속함수를 사용하기 때문에 노드의 수가 많아진다는 단점을 갖는다. 노드 수의 증가는 일반화 성능 및 적응 능력을 저하시키는 요소가 되기 때문에 노드 수를 감소시킬 적합한 방법이 필요하다. 이 논문에서는 일반화 성능 및 적응 능력의 향상을 위한 다변량 퍼지 의사결정 트리 학습 및 분류 방법을 제안한다. 또한 다수의 모델을 생성한 후 최대 우도 모델 선택 기법에 근거해 새로운 사용자를 위한 가장 적합한 모델을 선택하고 gradient descent에 근거해 모델을 사용자 특성에 적응시키는 방법을 제안한다. 제안된 알고리즘의 일반적 성능을 평가하기 위해 벤치마크 데이터를 이용해 분류 능력을 평가했다. 손동작 인식 능력을 평가하기 위해 10명의 사용자로부터 15일간 수집한 데이터를 이용해 실험했다. 실험 결과는 제안한 알고리즘이 일반적인 퍼지 의사결정트리에 비해 향상된 분류 능력 및 사용자 적응 능력을 갖는다는 것을 보인다.