This dissertation presents a comprehensive study on data measurement interval control and data imputation methods for the rapid detection of abnormal situations in IoT environments. The study initially introduces a novel deep reinforcement learning-based adaptive data measurement interval control method specifically designed to detect abnormal situations and enhance the energy efficiency of IoT devices. By leveraging three essential features extracted from the measured data, namely the trend feature, dynamics feature, and data outlier feature, the proposed method achieves efficient identification of abnormal occurrences while conserving energy. Through the integration of two distinct reward functions, namely the dynamics similarity reward function and energy reduction reward function, the method demonstrates superior response time for notifying abnormal situations, outperforming existing techniques. Additionally, the proposed methodology showcases exceptional performance in terms of energy consumption, yielding significant data volume savings during normal situations. This research contributes to the advancement of IoT-based monitoring by providing improved energy efficiency and timely abnormal situation detection, resulting in enhanced operational effectiveness and resource utilization. Furthermore, this study presents a pattern similarity-based missing data imputation method for large-scale data measurement in IoT-based applications, addressing the challenge of restoring missing data caused by factors such as battery depletion or communication failure. The proposed method encompasses a sophisticated framework that integrates several essential components, including the automatic selection of the k-nearest patterns, an advanced approach for incorporating temporal relations through data positioning optimization, and a meticulously designed pattern score function for accurate imputation. Notably, the pattern score function, formulated based on two RMSE calculations, enables the selection of the most appropriate pattern for imputation, resulting in remarkable accuracy. Extensive experimentation and evaluation demonstrate the superiority of the proposed method, surpassing benchmark methods with substantial reductions in RMSE across diverse datasets, particularly at the largest missing intervals. Additionally, the proposed method offers notable advantages such as exceptional computational efficiency and seamless scalability to handle large-scale datasets, addressing the critical need for accurate imputations in IoT applications with data loss challenges. This research significantly contributes to the development of robust data analysis techniques, ensuring the integrity and reliability of IoT-based monitoring applications.
본 연구에서는 IoT 환경 내 신속한 이상 상황 감지를 위한 데이터 측정 주기 제어 및 데이터 복원 기술 연구를 제안한다. 환경 내 배치된 IoT 단말로부터 이상상황을 신속하게 감지하면서도, IoT 단말의 에너지 절약을 향상시키는 심층 강화학습 기반의 데이터 측정 주기 제어 방법을 제안한다. 해당 방법은 IoT 단말의 데이터 측정 주기를 하나의 고정된 값이 아닌, 상황에 따라 동적으로 변화시키며, 이때 IoT 단말의 에너지 절감과 이상상황에 대한 신속 감지 간의 상충 관계를 균형있게 고려한다. 우선 이상상황에 대한 신속한 감지를 위해, 이상상황 내 데이터 값에서 발견되는 세 가지 주요 특징인 추세 특징, 비정상 데이터 특징, 데이터 유동성 특징을 추출한다. 이러한 세 가지 특징 벡터들을 모두 결합하여 심층강화학습 모델의 입력 상태 (state)로 활용하고 에너지 감소 보상 함수와 유동성 유사도 보상 함수라는 두 가지 보상 함수 체제로 학습 에이전트의 행동 (action)을 평가하도록 한다. 본 심층 강화학습 모델은 두 개의 심층 신경망을 활용하고, 이때 Proximal Policy Optmization을 통해 효율적으로 학습하게 된다. 이렇게 학습된 심층 강화학습 모델은, 일정 사이클 마다 전송된 데이터의 상태 특성을 관찰하고, 이상상황 발생 시 자동적으로 IoT 단말의 데이터 측정 주기를 줄여, 이상 상황을 정밀 모니터링 할 수 있다. 또한 전송된 데이터의 값이 일정 임계점을 넘는 순간에는 신속한 알람을 제공할 수 있으며, 타 방법들 대비, 이상상황 발생 시 최대 8.1배 빠른 응답 시간 및 가장 높은 데이터 수집 정확도를 가지는 것을 실험 결과를 통해 확인하였다. 마지막으로, 이상 상황 모니터링 과정 내, IoT 단말의 배터리 부족 혹은 통신장애 등으로 인하여 데이터 누락이 장기간 발생 될 경우, 추후 데이터 분석, 혹은 기계 학습 모델의 정확도가 상당히 저하되어 불완전한 결과를 초래할 수 있다. 따라서 데이터 분석 과정의 무결성과 신뢰성을 보장하기 위해 본 연구에서는 패턴 유사도 기반의 데이터 복원 방법을 새롭게 제안한다. 해당 방법은 누락 이전 데이터 패턴과 유사한 k개의 유사 패턴을 MPdist 기법을 활용하여 자동 선별하게 되고, 실제 누락 구간과 선별된 복원 데이터 간의 시간적 관계성 문제를 2차 함수 기반의 최적화 문제를 통해 해결한다. 이때 데이터의 물리적 값의 범위를 제한요건으로 고려하여 최적의 값을 도출하고, 이를 통해 복원 될 데이터의 시간적 관계성 문제를 해결한다. 이후, 제안하는 패턴 점수 함수를 통해, 가장 우수한 점수를 받은 패턴을 최종 선별하여 이를 실제 누락 데이터 복원에 활용한다. 해당 방법은 타 알고리즘과의 성능 비교를 통해, 제안된 알고리즘의 유효성을 검증하였으며, 특히 복원 정확도 및 연산 복잡도 측면에서 더 우수한 성능을 도출하였다.