Location dependent Dirichlet process mixture model for clustering spatially correlated time series = 공간적 상관관계를 갖는 시계열 데이터 군집화를 위한 위치 종속적 디리클레 혼합 모델 연구
서명 / 저자 Location dependent Dirichlet process mixture model for clustering spatially correlated time series = 공간적 상관관계를 갖는 시계열 데이터 군집화를 위한 위치 종속적 디리클레 혼합 모델 연구 / Junsub Jung.
발행사항 [대전 : 한국과학기술원, 2021].
Online Access 원문보기 원문인쇄





학술문화관(문화관) 보존서고

MIE 21031

휴대폰 전송







Dirichlet process mixture model has been widely used as a Bayesian nonparametric model for clustering. However, the exchangeability assumption of Dirhclet process is not valid for clustering spatially correlated time series because these data are spatially and temporally indexed. In the analysis of spatially correlated time series, the correlations between observations at proximal times and locations must be appropriately considered. In this study, we propose a location-dependent Dirichlet process mixture model, which is an extension of the traditional Dirichlet process mixture model, for clustering spatially correlated time series. We model the temporal pattern as an infinite mixture of Gaussian processes while considering spatial dependency using a location-dependent Dirichlet process prior over mixture weights, which encourages observations from proximal locations to be assigned to the same cluster. At the same time, because global mixture weights and mixture atoms for modelling temporal patterns are shared across space, observations with similar temporal patterns can be still grouped together even if they are far away. The proposed model also allows the number of clusters to be automatically determined during the clustering procedure. We validate the proposed model using simulated examples. Moreover, in a real case study, we detect the clusters of daily confirmed number of COVID-19 for each county in the USA according to their spatial and temporal similarities, and analyze the mean temporal pattern of each cluster.

디리클레 혼합 모델은 클러스터링을 위한 베이지안 비모수적 모델로서 많이 활용되어왔다. 하지만 디리클레 과정의 교환가능성에 대한 가정은 데이터가 공간적, 시간적으로 인덱싱되어 있는 시공간 데이터를 다루는 문제에 적합하지 않다. 공간적 상관관계를 갖는 시계열 데이터의 군집화 문제에서는 공간적, 시간적으로 인접한 관측결과들 사이의 상관관계가 반영되어야 한다. 본 연구에서는 디리클레 혼합모델을 시공간 군집화 문제에 적합하게 적용할 수 있도록 확장한 공간 종속적 디리클레 혼합모델을 제시하였다. 제안모형은 가우시안 과정의 무한혼합모델로 시간적 패턴을 모델링하고 공간적 상관관계를 반영하기 위하여 공간 특성을 사전분포에 통합시킨 공간 종속적 디리클레 과정을 할당확률의 사전분포로 사용하였다. 제안 모형에 의해 가까운 위치에서의 관측결과는 높은 공간적 상관관계에 의해 종속적 사전분포를 갖기 때문에 같은 군집에 할당되어질 확률이 높아진다. 또한, 제안 모델의 할당확률을 결정하는 혼합 변수와 시간적 패턴을 모델링하기 위한 가우시안 과정은 모든 위치에서 공유되기 때문에 서로 멀리 떨어져 있더라도 시간적 패턴이 비슷한 위치들은 같은 군집으로 할당 될 수 있다. 제안 모델은 기존의 디리클레 혼합 모델과 마찬가지로 추론 과정에서 군집의 갯수를 자동으로 결정한다. 모델의 매개변수 추정을 위해 변분추론방법을 사용하였다. 시뮬레이션 분석과 실제 사례 분석을 통해 제안모형을 검증하였다. 실제 사례 분석에서는 미국의 일일 신종 코로나바이러스 감염증 확진자수를 이용하여 미국의 각 군들을 일일 확진자수의 시간적, 공간적 유사성에 따라 군집화하였고 확진자수의 평균 함수를 추정하여 확진자수 변화 패턴을 분석하였다.


청구기호 {MIE 21031
형태사항 iii, 26 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 정준섭
지도교수의 영문표기 : Heeyoung Kim
지도교수의 한글표기 : 김희영
Including Appendix
학위논문 학위논문(석사) - 한국과학기술원 : 산업및시스템공학과,
서지주기 References : p. 22-24





이 주제의 인기대출도서