서지주요정보
Deep imputation network for missing-value imputation of concurrent continuous missing patterns using relationship among multiple IoT data streams in a smart space = 다중 사물인터넷 데이터 스트림의 관계성을 이용한 연속 누락 패턴 값 대체에 관한 연구
서명 / 저자 Deep imputation network for missing-value imputation of concurrent continuous missing patterns using relationship among multiple IoT data streams in a smart space = 다중 사물인터넷 데이터 스트림의 관계성을 이용한 연속 누락 패턴 값 대체에 관한 연구 / Minseok Lee.
저자명 Lee, Minseok ; 이민석
발행사항 [대전 : 한국과학기술원, 2019].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8033286

소장위치/청구기호

학술문화관(도서관)2층 패컬티라운지(학위논문)

DCS 19008

SMS전송 소장위치

도서상태

이용가능

대출가능

반납예정일

초록정보

Missing values with various missing patterns and the high missing rates from many different data streams of Internet of Things (IoT) devices remain challenging problems. In this regard, while analyzing a dataset collected from a smart space with multiple IoT devices, we found a continuous missing pattern that is quite different from the existing missing-value patterns. A pattern has large blocks of continuous missing values of over a few seconds and up to a few hours in length. In addition, concurrent continuous missing patterns occurring simultaneously in multiple IoT data streams are very common. Given the explosive growth of IoT data streams, such a pattern is a vital factor regarding the availability and reliability of IoT applications; however, it cannot be solved using existing missing-value imputation methods. Therefore, a novel approach for the missing-value imputation of concurrent continuous missing patterns is required in a smart space with multiple IoT data streams. We deliberated that, even if the missing values of a continuous missing pattern occur in multiple IoT data streams, imputation of these missing values is possible through the learning of other related data streams using a machine-learning method. To solve the missing values of a continuous missing pattern, we analyzed multiple IoT data streams in single smart space and determined their relationship such as their correlation and causality, where the correlation is a linearly proportionate inter-dependency, and causality indicates the cause and effect among multiple IoT data streams in a smart space. To substitute the missing values of concurrent continuous missing patterns, we propose a deep-learning based missing-value imputation model exploiting information on various relationships, i.e., a deep imputation network (DeepIN), in an IoT environment. DeepIN uses multiple long short-term memories that are constructed according to the relationship of each IoT data stream. We evaluated DeepIN on the IoT dataset from our real smart-office testbed, and the results of our experiments showed reasonable accuracy (75$\sim$80\%) of missing value imputation when continuous missing patterns occur simultaneously in up to three IoT data streams. Furthermore, our proposed approach dramatically improves the imputation performance over the state-of-the-art missing-value imputation algorithm. Based on our extensive experiments and analyses, we found that the causality information among multiple IoT data streams is the most significant factor in the missing-value imputation of concurrent continuous missing patterns. Based on these results, our proposed approach can be a promising methodology that enables many smart space services and applications, even if a long-term block of values is missing in IoT environments.

본 논문에서는 단일 스마트 공간에서 다중 사물인터넷 데이터 스트림들에서 발생하는 연속 누락패턴의 누락 값을 대체하는 기법을 다루었다. 다중 사물인터넷 데이터 스트림들의 특성들을 분석하고, 그로부터 발생한 요구사항들에 맞는 딥러닝 알고리즘을 설계하여 연속 누락 패턴의 누락 값 대체 정확도를 높이는 방안을 제시하고 그 성능을 분석하였다. 다중 사물인터넷 기기로부터 생성되는 데이터들은 다양한 사물인터넷 응용과 서비스에 활용되어 진다. 이러한 응용과 서비스의 정확성과 신뢰성을 위해서는 사물인터넷 데이터 스트림에서 매우 빈번하게 발생하는 누락 값을 정확히 대체하는 기법이 필요하다. 특히, 다중 사물인터넷 데이터 스트림에서 공존하는 연속 누락 패턴은 누락 값이 연속해서 발생한다는 점에서 기존의 누락 값 패턴들과 매우 다른 특성들을 보인다. 이러한 연속 누락 패턴은 최소 수초에서 최대 몇 시간 동안 연속적으로 누락 값이 발생하고 2개 이상의 데이터 스트림에서 동시에 발생하는 경향을 보인다. 동시다발적으로 발생하는 연속 누락 패턴의 누락 값을 대체하기 위해, 단일 스마트 공간에서 생성되는 다중 사물인터넷 데이터 스트림들이 내포하고 있는 시/공간적 상호의존성을 통해 데이터 스트림들 사이의 관계성을 분석하여 각각의 사물인터넷 데이터 스트림들의 상관관계와 인과관계 정보를 찾아냈다. 각각의 사물인터넷 데이터 스트림의 관계성 정보를 기반으로 딥러닝 기법을 적용하여 각 사물인터넷 데이터 스트림들을 입력 값으로 받고, 연속 누락 패턴의 누락 값을 대체한 값을 결과로 출력하는 모델을 학습시킨다. 제안한 기법의 성능을 측정하기 위해 구축된 테스트베드에서 생성된 실제 사물 인터넷 기기의 데이터를 사용하였으며, 단일 연속 누락 패턴 뿐만 아니라 다중 사물인터넷 데이터 스트림에서 공존하는 연속 누락 패턴의 누락 값을 대채하는데 매우 효과적임을 보였다. 이러한 결과는 상황인지 및 예측이나 비정상 상황 대처 시스템에 활용될 수 있다.

서지기타정보

서지기타정보
청구기호 {DCS 19008
형태사항 v, 113 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 이민석
지도교수의 영문표기 : Soonjoo Hyun
지도교수의 한글표기 : 현순주
공동지도교수의 영문표기 : Younghee Lee
공동지도교수의 한글표기 : 이영희
학위논문 학위논문(박사) - 한국과학기술원 : 전산학부,
서지주기 References : p. 107-112
주제 Smart space
missing-value Imputation
continuous missing pattern
multiple IoT data streams
relationship
deep learning
스마트 공간
누락 값 대체
연속누락패턴
복합 스마트 데이터 스트림
관계성
딥러닝
QR CODE qr code