서지주요정보
Hierarchical modeling for the analysis of zero-inflated time-series count data observed in multiple locations = 다중모집단에서 수집된 영과잉 시계열 가산자료 분석을 위한 계층적 모델링
서명 / 저자 Hierarchical modeling for the analysis of zero-inflated time-series count data observed in multiple locations = 다중모집단에서 수집된 영과잉 시계열 가산자료 분석을 위한 계층적 모델링 / Kisung Sim.
발행사항 [대전 : 한국과학기술원, 2022].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8039529

소장위치/청구기호

학술문화관(도서관)2층 학위논문

DMAS 22009

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In this research, we propose statistical methodologies for the analysis of zero-inflated time-series count data observed in multiple locations. In the first part, we propose a two-stage approach for meta-analysis or meta-regression. The first stage uses a generalized linear model with Poisson distribution to estimate location-specific association. The second stage uses multivariate meta-regression and mixed-effects meta-regression to pool the association across locations and to identify the underlying factors that may explain the between-location heterogeneity. The two-stage meta-analysis was applied to analyze the daily time-series suicide data collected from 47 prefectures in Japan for 1972-2015. In the second part, we propose nonparametric Bayesian Poisson hurdle random effects models (nb-PHM) to explore the heterogeneity in the location-specific associations in a fully Bayesian hierarchical modeling framework. The proposed models attempted to address several limitations of the two-stage approach. First, the Poisson hurdle model consists of two parts; a binary part and a positive part. The binary part models the probability that the count outcome is zero or not while the positive part model the non-zero counts. That way, we can have more flexibility to deal with inflated or deflated zeros for the count outcome than the conventional Poisson distribution assumption. The Poisson hurdle model also allows for examining the covariates effect both on the binary part and the positive part, separately. Second, as the time-series data are collected from multiple locations, we consider a hierarchical structure in both parts of the model by specifying location-specific random effects to represent the location-specific association. Moreover, the random effects of both binary and positive parts are modeled jointly to induce between-part correlations. To describe the between-location heterogeneity more flexibly, we assume not only a normal distribution but also a Dirichlet process (DP) mixture of normals for the joint vector of random effects. That way, we can conduct a model-based clustering and identify an underlying subgroup structure if it exists. For the proposed nb-PHM, we consider a fully Bayesian inference through the Markov Chain Monte Carlo sampling to avoid the two-stage approach. The methodology is illustrated through an application to Japan suicide data, Korea tick data, and a simulation study.

본 연구에서는 다중모집단에서 수집된 영과잉 시계열 가산자료를 분석하는 통계 방법론을 제안한다. 첫번째 연구에서는 두 단계 메타분석 방법을 제안한다. 첫번째 단계에서는 각 모집단별로 설명변수와 반응변수의 관계를 추정하기 위해 포아송 분포를 가정한 일반화 선형모형을 사용한다. 두번째 단계에서는 모집단별 추정치를 하나로 통합하고, 모집단별 추정치를 정보공유를 통해 조정하며, 모집단간 이질성을 설명하는 설명변수를 찾기 위해 다변량 메타 회귀모형과 혼합효과 메타회귀 모형을 사용한다. 이러한 두 단계 메타분석 방법을 일본의 47개현에서 수집된 1972-2015년 동안의 일별 자살 및 온도 자료 분석에 적용하여 일본에서의 온도-자살 관계와 지역간 이질성을 계량화 하고, 지역간 이질성을 설명하는 설명변수를 찾아보았다. 두번째 연구에서는 비모수 베이지안 포아송 허들 임의효과 모형을 제안한다. 이 모형을 통해 첫번째 연구에서 제안한 두 단계 메타분석방법의 몇 가지 단점을 보완하고자 한다. 첫째로 일별 자살자료는 현마다 다른 분포를 보이는데, 어떤 현에서는 0이 과잉관찰 된다. 이러한 영과잉 자료를 분석하는 포아송 분포의 가정이 제한적일 수 있으며, 이를 보완하기 위해서 포아송 허들모형을 사용한다. 허들모형은 두 부분으로 나눠지며, 0인지 아닌지를 모델링하는 이항부분과 양의 값을 모델링하는 양수부분으로 이루어진다. 이러한 허들모형은 0이 과잉 관찰되는 경우뿐만 아니라 과소 관찰되는 경우에도 적용할 수 있어 매우 유동적인 가정이라 할 수 있다. 또한 허들모형을 이용하면 설명변수가 이항부분과 양수부분에 미치는 영향을 분리해서 조사할 수 있다는 장점이 있다. 둘째로 여러 모집단에서 수집된 자료를 하나의 통합된 모형으로 분석하기 위해 설명변수와 반응변수의 관계를 나타내는 모수를 각 모집단별로 추정할 수 있도록 임의효과로 가정한다. 또한 이항부분과 양수부분의 임의효과에 결합확률분포를 적용하여 두 부분 간의 상관관계를 유도한다. 또한 임의효과에 통상적으로 사용되는 정규분포 가정을 완화하기 위해 디리슐레 확률과정 혼합정규분포 모형을 가정하여 모집단간 이질성을 보다 유동적으로 계량화하고 모형-기반 군집분석을 통해 군집구조를 찾을 수 있도록 한다. 마지막으로 이 모형의 추정을 마르코프 연쇄 몬테카를로 방법를 통한 완전 베이지안 추론을 한다. 이렇게 제안한 모형을 시뮬레이션을 통해 검증 및 비교평가하고 일본의 자살 자료 및 한국의 진드기 자료에 적용하였다.

서지기타정보

서지기타정보
청구기호 {DMAS 22009
형태사항 viii, 82 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 심기성
지도교수의 영문표기 : Yeonseung Chung
지도교수의 한글표기 : 정연승
Including Appendix
학위논문 학위논문(박사) - 한국과학기술원 : 수리과학과,
서지주기 References : p. 74-80
주제 Two-stage meta-analysis
Multivariate meta-regression
Mixed-effects meta-regression
Zero-inflated count data
Dirichlet process mixture
Poisson hurdle random effects model
두단계 메타-분석
다변량 메타-회귀분석
임의 효과 메타-회귀분석
영과잉 가산자료
디리슈레 프로세스 혼합 모형
포하송 허들 임의 효과 모형
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서