This dissertation proposes and explores several probabilistic models that deal with spatial data in various fields. In particular, Bayesian nonparametric priors are used to solve the problem of parameter selection occurred by density estimation or clustering problem. In the first chapter, we discuss a density estimation model for mobile location data with different volume and measurement errors. In the second chapter, we propose a Bayesian nonparametric joint mixture model for clustering spatially correlated time series based on both spatial and temporal similarities. Finally, in the third chapter, we propose a deep generative cluster model in order to cluster similar patterns of wafers in semiconductor processes. We show potential usefulness of the proposed probabilistic models for a lot of real spatial data through various examples and experimental results that appropriately reflect the nature of the spatial data and the problem situations.
본 학위 논문은 다양한 분야에서 존재하는 공간 데이터를 다루는 여러 확률 모델들을 제안하고 살펴본다. 특히 베이지안 비모수 사전 확률을 이용하여 밀도 추정이나 군집화 문제에서 생기는 모수 선택 문제를 해결하는데 초점을 두었다. 첫 번째 장에서는 데이터 크기와 측정오차가 서로 다른 모바일 위치 데이터에 대한 밀도 추정 모델에 대해 다루었다. 두 번째 장에서는 공간 정보를 포함하는 시계열 데이터에 대한 군집화를 위한 결합 군집 모형을 살펴본다. 마지막으로 세 번째 장에서는 반도체 공정에서 생기는 웨이퍼의 불량 패턴을 유사한 형태로 군집화 하기 위해 웨이퍼 빈 맵 데이터와 공정 기록 데이터를 동시에 활용하는 심층 생성 군집 모델을 제안한다. 공간 데이터의 특성과 문제 상황을 적절히 반영하는 다양한 사례와 실험 결과들을 통하여, 확률 모델이 실제 존재하는 많은 공간 데이터에 어떻게 사용될 수 있는지에 대한 여러 가능성을 제시하려 한다.