서지주요정보
Automatic sensor data stream segmentation for real-time activity prediction in smart spaces = 스마트 공간에서 실시간 행동 예측을 위한 센서 데이터 스트림 자동 분할 기법
서명 / 저자 Automatic sensor data stream segmentation for real-time activity prediction in smart spaces = 스마트 공간에서 실시간 행동 예측을 위한 센서 데이터 스트림 자동 분할 기법 / Hyunjeong Cho
발행사항 [대전 : 한국과학기술원, 2015].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8028303

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 15083

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

리뷰정보

초록정보

Recently, human activity recognition and prediction have become important functionalities in ambient-assisted living. Activity inference algorithms detect what task a human undertakes, by analyzing the data stream pattern generated from various Internet of Things (IoT) devices. However, determining how the data stream should be segmented in real-time, referred to as data segmentation, remains as one of the most difficult challenges. In this paper, we propose a generalized automatic data segmentation approach for real-time activity prediction by employing the Jaro-Winkler Distance measurement. Our approach selects a breakpoint of a stream by comparing the Jaro-Winkler distance between the feature set created from the training dataset in advance, and the data stream and finding a peak among the variations. The resultant segment also becomes new training data after being tagged; this removes the need to segment the stream data manually for humans. From the experiment based on dataset collected from a real environment, our approach shows reasonable performance of 75% accuracy only by syntactic analysis of event stream. Also from the additional experiment by adding semantic rule, we expect that our approach can be applied to any system and improved much when some semantic rules suitable for system is added to the end of the segmentation process.

스마트 공간에서 사람의 행동을 인지/예측하고자 하는 연구들이 활발이 진행되고 있다. 이와 같은 연구들의 큰 장애물 중 하나는 다양한 IoT 장치들로부터 끊임없이 들어오는 데이터 스트림을 실시간으로 처리하는 문제이다. 데이터를 분석해 분류하는 머신러닝 알고리즘들은 분할 된 세그먼트 단위의 데이터를 처리하기 때문에, 데이터 스트림을 실시간으로 적절하게 분할하는 기술은 행동 인지/예측 알고리즘의 성능에 많은 영향을 끼친다. 따라서 본 연구에서는 예측된 사람의 행동이 언제 끝나는지를 자동적으로 찾아내는 기법을 제안하며, 이 때 문자열 비교 알고리즘인 Jaro-Winkler distance를 이용한다. 또한 기존 기법들의 문제점들로 꼽히는 과도한 전처리 과정이나 시멘틱한 정보를 이용한 복잡한 계산을 생략하면서도 합리적인 성능을 낼 수 있도록 하고, 어떤 행동 모델이나 환경에도 적용할 수 있는 일반화된 기법을 고안하는 것에 주 목적을 둔다. 제안된 알고리즘은 실제 환경에 구축된 테스트베드를 이용해 모은 데이터셋을 이용해 평가하였다. 실험 결과로는, 제안된 알고리즘 만으로의 정확도는 75%까지의 성능을 보여주었으며, 시멘틱한 정보를 담은 간단한 규칙을 추가한 결과 정확도는 96%까지 오를 수 있음을 확인하였다. 이를 통해 제안된 알고리즘이 모든 환경에 적용이 가능한, 데이터 스트림 분할 과정의 첫 번째 단계가 될 수 있으며 이 후 각 환경에 맞는 시멘틱한 규칙을 추가하면 높은 수준의 정확도로 데이터 스트림을 분할하는 데 활용될 수 있음을 확인하였다.

서지기타정보

서지기타정보
청구기호 {MCS 15083
형태사항 v, 37p : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 조현정
지도교수의 영문표기 : Young Hee Lee
지도교수의 한글표기 : 이영희
Including Appendix
학위논문 학위논문(석사) - 한국과학기술원 : 전산학부,
서지주기 References : p.
주제 Internet of Things
Activity Prediction and Recognition
Segmentation
Jaro-Winkler Distance
Data Stream
사물인터넷
행동 예측 및 인지
분할
자로-윙클러 거리
데이터 스트림
QR CODE qr code