In the recent years, a wireless sensor network (WSN) has become one of key technologies to enable people's ubiquitous computing life. Advances in WSNs make many of impossible possible, and the various needs of WSN applications are emerging increasingly. Target classification in WSNs is one of the most important and demanding technologies used to meet such various needs. However, considerable complicated processing is required for target classification, which is opposed to the resource limitation of sensor nodes.
The objective of this thesis is to develop an efficient target classification scheme for WSNs which is called PATaCS. The proposed PATaCS consists of target detection, target classification, and data fusion for processing efficiency. Specifically, since each processing component in the PATaCS is closely related with one another, they are required to be explored together for optimization. In this thesis, the PATaCS scheme is proposed, discussed, and evaluated by the classification accuracy of vehicles with acoustic and seismic signals collected from a real sensor field. In addition, some implementations are given to show their feasibility. Each component of the PATaCS scheme is described as follows:
First, target detection should be done in advance of target classification. Among many detection theories, the constant false alarm rate (CFAR) algorithm is usually employed since the environmental characteristics of WSN are nonstationary and unpredictable. Accordingly, we use a sort of the CFAR algorithms to detect a target in our works.
Second, when a classification algorithm for WSN nodes is designed, a parametric approach should be more preferred to non-parametric one due to the hard limitation in resources. As a parametric classifier, the Hidden Markov Model (HMM) algorithm or the Gaussian mixture model (GMM) algorithm does not only show good performances for target classification in WSNs but also require very small resources, making it suitable for today's general sensor nodes.
Finally, there are two levels of data fusion, node-level within a sensor node and group-level over sensor nodes. Based on either parametric classifier, a decision tree generated by the classification and regression tree (CART) algorithm is used to fuse the information from heterogeneous sensors, acoustic and seismic sensors in our works. Especially, since the processing mechanism of the decision tree is simple and the required amount of memory can be controlled with ease, it can be said to be pertinent to sensor nodes. The node-level classification scheme, comprising a parametric classifier and the decision tree generated by the CART algorithm, provides a satisfactory classification rate while using little resources compared with other conventional methods. On the other hand, considering a group-level fusion in WSNs, a confidence-based fusion algorithm is proposed to improve the overall performance by fusing the information among sensor nodes. In the confidence-based fusion, the confidence of each sensor node is obtained based on the likelihoods generated by the used parametric algorithm, the GMM in our works, and then it is used as the weighting factor of the node when fusing sensor nodes. Our experimental results show that the proposed group-level fusion algorithm improves the accuracy effectively with randomly selected nodes compared to the other fusion algorithms.
Consequently, experimental results show that the proposed PATaCS scheme produces satisfactory performance with relatively smaller resources. Finally, we obtained 98.27 % classification rate, a very high accuracy, through the confidence-based fusion based on the GMM node classifier.
본 논문에서는 센서네트워크에 적용하기 위한 효율적인 목표물 식별을 위한 기법으로 PATaCS를 제안하고 실제 센서네트워크 데이터 집합을 통하여 그 성능을 증명한다. 더하여, 몇몇 구현 예제를 보인다. PATaCS는 크게 CFAR 탐지 알고리즘과 모수적 식별 알고리즘 그리고, 센서노드 단위의 데이터 퓨전 알고리즘으로서 결정트리, 그룹 단위의 신뢰도 기반 퓨전 알고리즘으로 구성된다. 센서네트워크의 센서노드는 자원에 대하여 엄격한 제한을 받기 때문에, 센서노드에 들어가는 알고리즘들은 우선적으로 복잡도 (Complexity) 분석을 통하여 효율성을 살펴봐야 한다. 센서노드에 들어가는 알고리즘은 크게 노드 단위의 탐지 알고리즘과 식별 알고리즘 그리고 데이터 퓨전 알고리즘이 있다.
PATaCS는 탐지 알고리즘으로서 CFAR 알고리즘을 적용하는데, 이는 센서네트워크 신호가 불안정적(nonstationary) 하고 다음 식별 단계를 위한 데이터를 신속히 지원 및 처리를 해줘야 하기 때문이다. 이러한 CFAR 알고리즘은 사실상 센서네트워크에 범용적으로 적용되고 있다.
식별 알고리즘에 있어서는 비모수적인(Non-parametric) 방법보다는 모수적인(Parametric) 접근이 이뤄져야 한다. 왜냐하면, 비모수적인 알고리즘은 좋은 성능을 나타내기 위해서는 사전에 많은 데이터 량을 유지하고 있어야 하는 반면, 모수적인 알고리즘은 그에 따른 파라메터 값만을 유지하기 때문에 사전 학습 데이터의 크기와 상관없이 학습데이터를 통한 모델 특성을 나타내는 일정한 크기의 파라메터 값만 유지하면서도 양호한 성능을 나타낼 수 있다. 본 논문에서는 많은 모수적인 알고리즘 중에서, 은닉 마코프 모델 (HMM) 알고리즘 또는 가우시안 혼합 모델 (GMM) 알고리즘을 적용하였다.
센서노드 단위의 센서 퓨전을 위한 알고리즘으로는 식별 및 회귀 트리(CART) 알고리즘을 통해 생성되는 결정트리 (Decision tree)를 적용한다. 결정트리 알고리즘은 알고리즘 로직이 간단하여 적은 메모리를 요구하는 동시에 처리가 빠르며 좋은 성능을 나타내기 때문에 적은 자원을 갖는 센서노드에 적합하다. 반면, 그룹 단위에 포함하는 센서노드들을 퓨전하는데에 있어서는 신뢰도(confidence) 기반 퓨전 기법이 적용된다. 각 센서노드들은 개별 위치와 환경이 다르기 때문에 목표물에 대한 정보에 대한 신뢰도가 다르다. 이러한 신뢰도를 가중치화하여 퓨전을 하면 양호한 결과를 나타낼 수 있다.
실험 결과에 따르면, 가우시안 혼합 모델 알고리즘을 식별 알고리즘으로 적용할 경우, 적은 메모리를 요구하면서 음향 및 진동 신호에 대하여 각각 89.76 %, 81.44 %의 좋은 성능을 보였다. 또한, 노드단위에서 결정트리를 이용한 서로 다른 센서의 정보를 퓨전하여서도 다른 퓨전 알고리즘들에 비하여 적은 자원으로 94.1 %의 높은 성능을 나타냈다. 이러한 센서노드에 들어가는 알고리즘은 그 성능과 복잡도에 대한 실험 및 분석을 통하여 실제 센서노드에의 적용가능성을 확인하였다. 마지막으로, 신뢰도 기반의 그룹레벨 퓨전 알고리즘을 통해서는 98.27 %의 매우 높은 성능을 나타내었다.
따라서, 본 논문에서 제안하는 PATaCS 기법은 센서네트워크에서 실제 목표물을 탐지하고 식별하며 퓨전을 통해 그 성능을 향상시킬 수 있는 적용 가능한 매우 우수한 기법임을 확인하였다.