서지주요정보
Interruptibility prediction using contextual information on smartphones = 스마트폰의 상황정보를 이용한 인터럽트 가능성 예측
서명 / 저자 Interruptibility prediction using contextual information on smartphones = 스마트폰의 상황정보를 이용한 인터럽트 가능성 예측 / Minsoo Choy.
발행사항 [대전 : 한국과학기술원, 2020].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8036783

소장위치/청구기호

학술문화관(문화관) 보존서고

DKSE 20009

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

We are frequently interrupted by smartphones for a variety of reasons in our lives. However, such interruption at inappropriate moment can be a huge psychological burden. Owing to its practicality and importance, interruptibility prediction has gained popularity in both academia and industry. In this dissertation, among the various interruption purposes, we predict interruptibility for notifications and phone calls. Because smartphones are widely spread and provide us with rich contextual data, they are currently one of the most popular data sources to understand user behavior, and thus, we use smartphones in our research. The difference in perspective on the present makes our research stand out from previous studies. Most existing studies extracted the feature values from the current moment (i.e., the predicting point), and relatively subsequent studies additionally considered the immediate past (e.g., 5 minutes). However, the events that occurred several hours ago can also affect the current interruptibility owing to a variety of factors such as mood. Motivated by this, we reflect on the whole current day to understand the current moment in-depth. Depending on how the long past is exploited for the prediction, we suggest two methodologies. The first methodology is based on conventional machine learning (ML). To consider long periods in the past systematically, the method divides it into several timeslots, and then, for each timeslot, extracts relevant features (e.g., game playing time in the morning). These new features, along with those derived from the immediate past and the present, are used in a conventional way. The second methodology is based on a recurrent neural network (RNN). We propose the hierarchical LSTM network by leveraging a hierarchical characteristic that the time system has: the timestamps form the timeslots. The method samples context vectors at a certain interval (e.g., 15 minutes) and concatenates them into a sequence. Then, the hierarchical LSTM network understands the context vector sequence and predicts the current interruptibility. Further, we have two directions to improve the models. The former one is with respect to the missing values. Actually, interpolated values based on very far real values are not reliable and can act as noise values. We evaluate reliability of each interpolation and incorporate it into our data set. The latter one is with respect to the generalization of the model. We try to create a generalized model using the data sets of the heavy users. For the evaluation, we used two data sets, KAIST data set and device analyzer data set. The KAIST data set has been obtained from 25 participants during four weeks and is used for notification interruptibility. The other is a large-scale public data set constructed from 907 users during approximately nine months and is used for call interruptibility. The ML model is applied to both notification interruptibility and call interruptibility, whereas the RNN model is applied to only the call interruptibility due to the small scale of the KAIST data set. The experimental results show that the ML model improves the prediction accuracy by up to 16% and 7% compared with the baseline and state-of-the-art methods, respectively. The RNN model achieves a prediction accuracy of 76.6%, which outperforms both a conventional ML-based method and a simple LSTM model. Moreover, when missing values are imputed properly, the accuracy is further increased to 81.3%. The generalized model relieved the cold start problem by achieving a prediction accuracy of about 70%, which is reasonable, for 200 real new users.

일상생활에서 우리는 스마트폰으로부터 전화나 노티피케이션 (알림) 등의 다양한 이유들로 방해를 받는다. 그러나 적절치않은 상황에서의 방해는 심리적으로 큰 부담이 될 수 있다. 이러한 실용성과 중요성 때문에, 인터럽트 가능성에 대한 연구는 학계나 기업에서 주목을 받고 있다. 본 논문에서 우리는 노티피케이션과 전화에 대한 인터럽트 가능성을 예측한다. 스마트폰은 오늘날 널리 보급되어 있고, 다양한 상황 정보를 제공하기 때문에, 이를 사용자의 행동패턴 파악을 위한 데이터 출처로 사용하는 연구들이 많고, 본 연구에서도 스마트폰 데이터를 활용한다. 기존의 연구들과 본 연구의 가장 큰 차이점은 '현재 (예측 시점)'를 어떻게 표현하느냐에 있다. 대부분의 기존 연구들은 현재의 상황 정보값만이나 짧은 과거 (예: 5분)를 함께 고려한다. 그러나, 다양한 인간적인 요인 (예: 기분)으로 인하여, 몇 시간 전의 사건들도 현재의 인터럽트 가능성에 영향을 미칠 수 있다. 이 사실에 입각하여, 우리는 현재를 보다 깊게 이해하기 위하여 당일 전체를 고려하고, 이 긴 과거를 어떻게 고려하느냐에 따라 두가지 방법을 제안한다. 첫번째 방법은 '기존 기계학습 방식'에 기반한다. 하루를 체계적으로 고려하기 위하여, 우리는 이를 여섯개의 시간대로 나누고, 각 시간대와 연관있는 추가상황 정보 (예: 아침동안의 게임 플레이시간)를 생성한다. 이렇게 새로 생성된 추가 상황 정보들은 현 시점 및 짧은 과거로부터 생성된 상황정보와 함께 기존 기계학습 방식으로 활용된다. 두번째 방법은 순환신경망에 기반한 방법이다. 우리는 '시점들이 시간대를 이룬다'는 시간쳬계가 가진 계층성을 활용하여, 계층화된 순환신경망 모델을 제시한다. 이 방법은 하루에 대해 일정 간격 (예: 15분)마다 추출된 속성벡터들의 배열을 활용한 것으로, 모델은 본 배열의 흐름을 파악하여 현재의 중단가능성을 예측해낸다. 우리는 본 모델에 대한 두가지 발전 방안을 연구하였다. 첫번째는 '결측값'과 관련있다. 매우 멀리 떨어진 실측값에 기반하여 보간된 값들은 신뢰성이 낮고, 이들은 도리어 노이즈로 작용할 가능성이 있다. 그렇기 때문에, 우리는 각 보간값들의 신뢰도를 평가하고 이를 데이터셋에 통합하였다. 두번째는 '모델 일반화'와 관련있다. 우리는 헤비유저들의 데이터를 활용하여 일반화된 모델을 만들었다. 평가를 위해서, 우리는 두 개의 데이터셋을 활용한다. 하나는 교내 학생 25명에 대해 한 달간 수집한 데이터셋이며 노티피케이션에 대한 중단가능성 예측에 활용되고, 다른 하나는 약 9달간 907명에 대해 수집된 규모가 매우 큰 공개 데이터셋이며 전화에 대한 중단가능성 예측에 활용된다. 첫번째 방법은 노티피케이션 및 전화에 대한 인터럽트 가능성 예측에 모두 적용되고, 두번째 방법은 데이터 규모상 전화에 대한 인터럽트 가능성 예측에만 적용된다. 우리의 첫번째 제안 모델은 현 시점만 고려하는 가장 기본적인 모델과 짧은 과거를 함께 고려하는 최신 모델에 비해 각각 16%, 7% 향상된 성능을 보였다. 두번째 제안모델은 76.6%의 성능을 내었는데, 이는 우리의 첫번째 제안모델과 단순한 순환신경망 모델을 모두 앞선 수치이다. 더욱이, 결측값에 대한 처리를 함께하는 경우, 81.3%까지 성능이 향상되었다. 일반화된 모델은 실제 200명의 새로운 유저에 대해 약 70%라는 타당한 성능을 냄으로써 콜드스타트 문제를 해결하였다고 사료된다.

서지기타정보

서지기타정보
청구기호 {DKSE 20009
형태사항 vii, 80 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 최민수
지도교수의 영문표기 : Jae-Gil Lee
지도교수의 한글표기 : 이재길
학위논문 학위논문(박사) - 한국과학기술원 : 지식서비스공학대학원,
서지주기 References : p. 76-79
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서