서지주요정보
(A) study on variational inference-based deep learning algorithms for multi-source data with dataset shift = 다중 소스 데이터의 데이터셋 시프트를 고려한 변분추론 기반 심층 학습 기법에 관한 연구
서명 / 저자 (A) study on variational inference-based deep learning algorithms for multi-source data with dataset shift = 다중 소스 데이터의 데이터셋 시프트를 고려한 변분추론 기반 심층 학습 기법에 관한 연구 / Eunju Yang.
발행사항 [대전 : 한국과학기술원, 2023].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8041570

소장위치/청구기호

학술문화관(도서관)2층 학위논문

DEE 23091

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

With the rapid advancement of deep learning technology in recent years, the intelligence of services is being enhanced in various industries. Among them, time series prediction and anomaly detection are key modules used to build such intelligent services. For example, in the power field, time series prediction is essential for accurately predicting the future power consumption of individual buildings, and anomaly detection is used to improve the integrity and reliability of the power supply network. In maritime surveillance systems, time series prediction is used to forecast ship trajectories and anomaly detection is utilized to automatically detect illegal vessels and accidents, thereby enhancing maritime security. These applications of time series prediction and anomaly detection play a crucial role not only as standalone solutions but also as essential modules for control and management in various industry domains. As a result, deep learning-based models for time series prediction and anomaly detection considering the characteristics of each data have been extensively researched in various industrial fields. However, to effectively learn and apply these applications in real-world service domains, the consideration of a multi-source environment is necessary. Traditional deep neural network models assume that the training dataset is collected from the same distribution. However, in real services, training is performed using data collected from various sensors and client environments, and the service itself needs to independently consider various data sources. In such cases, dataset shift can occur. Dataset shift refers to the concept that includes distribution discrepancies between data sources, distribution shifts over time, and covariate changes according to environmental characteristics. This dissertation addresses the issue of distribution discrepancy between datasets collected from various sources and the distribution shift problem between the training and testing phases. To solve these problems, this dissertation proposes deep learning techniques considering the distribution discrepancy characteristics of data collected from multiple sources for time series prediction applications and anomaly detection models. Furthermore, techniques to address the dataset shift problem occurring after the model is deployed to edge devices are also proposed. In Chapter 3, a deep learning technique is proposed to address the distribution discrepancy and distribution shift problems of multi-source data in a time series power load prediction model in the power field. With the recent expansion of Advanced Metering Infrastructure (AMI) and smart meter installations, the power consumption of individual buildings is periodically measured at the terminal and transmitted to the central cloud. In the central cloud, the power consumption of individual buildings is predicted based on the real-time collected power data from multiple buildings, and this prediction is utilized for power supply and transactions. The data used for the load prediction model comes from various data sources, such as smart meters, which have different characteristics. Additionally, since performance degradation can occur due to distribution changes of source data during the testing phase of time series prediction, deep learning techniques are required. Therefore, to address these issues, Chapter 3 proposes a distribution estimation technique utilizing variational inference and real-time time series clustering models. Group-based model personalization based on the proposed distribution estimation is also suggested. This technique not only considers the distribution discrepancy between multi-sources but also addresses the temporal distribution changes of single-source data, resulting in robust prediction performance against concept drift. In Chapter 4, an anomaly detection technique is proposed that takes into account the distribution discrepancy of ship trajectory data collected from multiple ship AIS terminals in the maritime environment. Anomaly detection is one of the applications where estimating the data distribution is crucial due to its nature. In this dissertation, the occurrence of conditional distribution variations in multi-source data characteristics in ship route data is presented, and a deep learning technique is proposed that performs anomaly ship detection based on a more precise estimation of the normal data distribution. Specifically, the latent route condition variables of ships are estimated, and a model is proposed to evaluate the normalcy of a given route based on the estimated conditional data distribution using variational inference. Additionally, to ensure reliable maritime ship surveillance, a ship trajectory estimation technique is proposed that utilizes two heterogeneous datasets, AIS and satellite imagery, thus considering the data characteristics of multiple objects, in this case, ships. This demonstrates that the accuracy of deep network-based services can be improved by considering the characteristics of multiple objects. In Chapter 5, the dataset shift problem is addressed where the distribution of data changes when the model trained on the server is deployed to terminals, unlike the case where data from multiple sources is transmitted to the central cloud. To address this, methods are proposed to adapt the deployed model to the distribution of user data even when labels are not available. Specifically, the case is assumed where the model is trained with multi-source data when trained on the server, and learning techniques are proposed to overcome the limitations of existing studies that inevitably require source information from data collected from multiple sources. Unlike previous research where the size of the model increases as the number of source domains in the used dataset increases, the technique enables adaptation of the model regardless of the number of source domains, providing a suitable method for adaptation on terminal devices. In this dissertation, deep learning techniques are proposed that consider the distribution shift problem within a dataset when data is collected from multiple sources and used to train the model. The focus is on two applications: time series prediction and anomaly detection, where distribution changes and estimation are crucial. Not only the accuracy of the model is considered, but also learning techniques are proposed that take into account resource management efficiency from the perspective of service providers on the central server. Through this, robust learning techniques are proposed that address concept drift and covariate shift, which are common dataset shift problems. Particularly, performance improvements in anomaly detection applications sensitive to data distribution are confirmed by incorporating model training considering distribution discrepancies within the dataset.

최근 딥 러닝 기술의 급속한 발전으로 다양한 산업에서 서비스의 지능화가 이루어지고있다. 그 중에서도 시계열 예측과 이상 징후 탐지는 이러한 지능적인 서비스를 구축하는 데 사용되는 핵심 모듈이다. 예를 들어, 전력 분야에서는 개별 건물의 미래 전력 소비량을 정확하게 예측하기 위해 시계열 예측이 필수적이며, 이상 탐지는 전력 공급 네트워크의 무결성 및 신뢰도 향상을 위해 사용된다. 해상 감시 시스템에서는 시계열 예측을 사용하여 선박 궤적을 예측하고 이상 탐지를 사용하여 불법 선박 및 사고를 자동으로 탐지하여 해상 보안을 강화에 활용된다. 이처럼 시계열 예측 및 이상 탐지의 이러한 응용 프로그램은 독립형 솔루션의 역할뿐만 아니라 다양한 산업 영역에서 제어 및 관리를 위한 필수 모듈로써 중요한 역할을 한다. 이에 따라 다양한 산업 분야에서 각 데이터의 특성을 고려한 딥러닝 기반 시계열 예측 및 이상징후 탐지 모델이이 광범위하게 연구되고 있다. 하지만 실제 서비스 도메인에서 이러한 응용을 효과적으로 학습하고 적용하기 위해서는 다중 소스 환경을 고려해야한다. 기존의 심층 신경망은 학습 데이터셋이 동일한 분포에서 수집되었다고 가정하지만, 실제 서비스에서는 다양한 센서와 클라이언트 환경에서 수집된 데이터로 학습되며, 서비스 시점에도 다양한 데이터 수집 환경이 고려되어야한다. 이러한 경우 데이터 소스 간의 분포 편차로인해 데이터셋 시프트가 발생하고 모델의 성능이 저하될 수 있다. 데이터 셋 시프트는 학습 시점의 데이터와 테스트 시점의 데이터의 분포 간에 편차가 존재하는 현상으로, 시간에 따른 데이터의 분포 이동, 환경 특성에 따른 공변량 변화 등을 포함하는 개념이다. 본 학위논문은 다양한 소스로부터 수집된 데이터셋 간의 분포 편차 문제와함께 학습 단계와 테스트 단계 사이의 분포 시프트 문제를 다룬다. 이를 해결하기 위해서, 본 학위 논문에서는 다중 소스로부터 수집된 데이터의 분포 편차 특성을 고려한 심층 학습 기법을 제안하고, 더 나아가 모델이 엣지 장치로 배포된 이후 발생하는 데이터셋 시프트 문제를 해결하기 위한 기법을 제안한다. 3장에서는 전력 분야의 시계열 전력 부하 예측 모델에서 다중 소스 데이터의 분포 편차와 시간에 따른 분포 이동 문제를 해결하기 위한 심층 학습 기법을 제안한다. 최근 첨단계량인프라(AMI)와 스마트 미터 설치의 확대로 인해 개별 건물의 전력 사용량이 단말에서 주기적으로 측정되고 중앙 클라우드로 전송된다. 중앙 클라우드에서는 실시간으로 수집되는 다중 건물들의 전력량을 바탕으로 개별 건물들의 부하를 예측하고 전력 공급, 거래 등을 한 데이터로 활용한다. 이 때, 부하 예측 모델에 사용되는 데이터는 다양한 특성을 가진 데이터 소스 (예, 스마트 미터)에서 수집된다. 또한, 구축된 예측 모델은 건물 별로 수행되므로 개별 건물의 특성을 고려한 모델을 구축하여 높은 정확도를 달성해야한다. 뿐만 아니라, 시계열 예측에서는 테스트 단계에서 소스 데이터의 분포 변화로 인해 성능 저하가 발생하므로 심층 학습 기법이 요구된다. 따라서, 이러한 문제들을 해결하기위해 3장에서는 변분 추론과 실시간 시계열 클러스터링 모델을 활용한 분포 추정 기법을 제안하고 있다. 제안한 분포 추정을 기반으로 한 그룹 기반 모델 개별화를 제안하였으며, 본 기법의 경우 멀티 소스 간의 분포 편차를 고려하였을 뿐 아니라 단일 소스 데이터의 시계열 분포 변화를 함께 고려하여 개념 변화 (concept drift)에 강인한 예측 성능을 보였다. 제안한 기법은 24개의 모델 학습 만으로도 96개의 모델을 학습한 기법 보다 예측 오차를 24%를 개선하였을 뿐 아니라, 추가적인 모델 학습 없이도 새로운 고객에 대하여 가장 좋은 성능의 예측을 제공하였다. 또한, 본 챕터에서는 제안된 심층 학습 기법을 실제 전력 분야에서 배포하기 위한 서빙 플랫폼 아키텍처도 함께 제시한다. 4 장에서는 해양 환경에서 다중 선박들의 AIS 단말에서 수집되는 선박 경로 데이터의 분포 편차를 고려한 이상 징후 탐지 기법을 제안한다. 이상 징후 탐지는 관측 데이터의 분포 추정 기술이 중추가 되는 응용 중 하나이다. 본 학위 논문에서는 다중 소스 데이터의 조건부 분포 변화 특성이 선박 항로 데이터에서 발생함을 제시하고, 이를 고려한 분포 추정모델을 제안함으로써 기존보다 정상 데이터 분포를 더 정밀하게 추정하는 심층 학습 기법을 제안한다. 구체적으로는 선박의 잠재적인 항로의 조건 변수를 추정하고, 이를 기반으로 조건부 데이터 분포를 변분 추론을 통해 추정함으로써 주어진 항로의 정상도를 평가하기 위한 모델을 제안하였다. 뿐만 아니라, 신뢰도 높은 해양 선박 감시를 위해 AIS 뿐 아니라 위성 영상을 새로운 소스 데이터로 활용하여 두 개의 이종 데이터셋을 활용한 선박 경로 추정기법을 함께 제안한다. 본 챕터에서 제안한 경로 추정 모델은 기존 기법 대비 20.2%의 정확도 개선을 이루었으며, AIS 데이터만을 사용하는 기존 기법 대비 복원오차를 92% 개선하였다. 이를 통해 다중 선박의 데이터 특성을 고려함으로써 심층 네트워크 기반의 서비스들의 정확도가 개선될 수 있음을 제시한다. 5 장에서는 다중 소스의 데이터가 중앙 클라우드로 전송되는 경우와 달리 서버에서 학습된 모델이 단말로 배포된 경우 데이터의 분포가 변화하는 데이터셋 시프트 문제를 다룬다. 이를 위해, 라벨이 주어지지 않은 경우에도 배포된 모델을 사용자 데이터의 분포에 맞춤화하기 위한 방법을 제시한다. 구체적으로는 서버 측에서 다중 소스 데이터로 모델이 학습되는 상황을 고려하며, 이 때 기존 연구들의 경우 다중 소스로부터 수집된 데이터들의 도메인 정보가 필연적으로 요구되는 한계점이 있음을 제시하고 이를 해결하기 위한 기법으로 FREEDOM을 제안한다. 공변량 변화를 고려한 모델 적응 연구들에 사용되는 대표적인 4개의 벤치 마크에 대하여 FREEDOM의 성능 평가를 수행하였다. 세 개의 데이터 셋에서 최신 모델의 성능을 상회함을 보였으며, 다른 하나의 벤치 마크에 대해서도 더 도전적인 가정 하에서 모델의 적응 정확도가 유사한 수준을 보임을 확인하였다. 본 기법의 경우 기존의 연구들이 소스 측에서 사용된 데이터 셋의 소스 도메인의 수가 증가함에따라 모델의 크기가 증가하였던 것과 달리, 소스 도메인의 수에 상관 없이 모델을 적응할 수 있도록 함으로써 별도의 조치 없이도 최종 학습된 모델의 크기를 줄일 수 있음을 보였다. 종합적으로 본 학위 논문에서는 다중 소소로부터 데이터가 수집되고 이를 바탕으로 모델이 학습되는 경우, 데이터 셋 내에 존재하는 분포 시프트 문제를 고려한 심층 학습 기법을 제시한다. 특히, 분포 변화 및 추정이 핵심이 되는 두 응용인 시계열 예측과 이상 징후 탐지 응용을 중점적으로 다루었으며, 모델의 정확도 뿐 아니라 중앙 서버의 서비스 제공자의 관점에서 자원 관리 효율성을 함께 고려한 학습 기법을 제시하였다. 이를 통해 대표적인 데이터 셋 시프트 문제인 개념 변화 (concept drift)와 공변량 변화 (covariate shift)문제에 강인한 학습 기법을 제안하였으며, 특히 데이터 셋 내의 분포 편차를 고려한 모델 학습을 통해 데이터 분포에 민감한 이상 징후 탐지 응용에서 성능 개선을 확인하였다.

서지기타정보

서지기타정보
청구기호 {DEE 23091
형태사항 ix, 135 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 양은주
지도교수의 영문표기 : Chan-Hyun Youn
지도교수의 한글표기 : 윤찬현
수록잡지명 : "Temporal Data Pooling with Meta-Initialization for Individual Short-Term Load Forecasting". IEEE Transactions on Smart Grid, v.14, Issue 4, 3246-3258(2023)
수록잡지명 : "Individual Load Forecasting for Multi-Customers with Distribution-aware Temporal Pooling". IEEE INFOCOM 2021 - IEEE Conference on Computer Communications, (2021)
Including appendix
학위논문 학위논문(박사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 121-131
주제 dataset shift
deep learning personalization
individual load forecasting
vessel trajectory anomaly detection
unsupervised domain adaptation
test time adaptation
데이터셋 시프트
딥러닝 개별화
개별 부하 예측
선박 이상 항로 탐지
비지도 도메인 적응
테스트 타임 적응
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서