서지주요정보
Nonparametric Bayesian hierarchical model and multivariate meta-regression model for environmental epidemiology study = 환경역학 연구를 위한 비모수 베이지안 계층 모형 및 다변량 메타 회귀모형 연구
서명 / 저자 Nonparametric Bayesian hierarchical model and multivariate meta-regression model for environmental epidemiology study = 환경역학 연구를 위한 비모수 베이지안 계층 모형 및 다변량 메타 회귀모형 연구 / Daewon Yang.
발행사항 [대전 : 한국과학기술원, 2021].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8037808

소장위치/청구기호

학술문화관(도서관)2층 패컬티라운지(학위논문)

DMAS 21002

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

리뷰정보

초록정보

In this research, we proposed statistical models for investigating three important topics in the field of environmental epidemiology. First, we proposed a Bayesian nonparametric sparse latent factor model for multivariate functional clustering to conduct a clustering analysis for Canadian air pollution data. Air pollution data, especially multiple air pollutants, can be considered multivariate functional data in a statistical view. While there exist a variety of methodologies for univariate functional clustering, the approach for multivariate functional clustering are less studied. Moreover, there is little research for the functional clustering methods incorporating additional covariate information. We propose a Bayesian nonparametric sparse latent factor model for covariate-dependent multivariate functional clustering. Multiple functional curves are represented by basis coefficients for splines and joint vectors of basis coefficients and covariates are are reduced to latent factors. Then, the factors are modeled using a Dirichlet process (DP) mixture of Gaussians to facilitate a model-based covariate dependent multivariate functional clustering. The method is further extended to a time-varying clustering while incorporating temporal dependency to handle sequential multivariate functional data. For this, dynamical hierarchical dirichlet process (dHDP) is applied instead of DP. The proposed methods are illustrated through a simulation study and applied to time-series data for daily mean concentrations of ozone ($O_3$), nitrogen dioxide ($NO_2$) and fine particulate matter ($PM_{2.5}$) collected for 25 cities in Canada from 1986-2015 to investigate the spatial and temporal patterns of Canadian air quality. Secondly, we proposed a two-stage approach for meta-analysis using multivariate meta-regression model to investigate the suicide seasonality from suicide count data across multiple populations and evaluate the heterogeneity and underlying determinants. Previous studies have revealed the existence of the suicide seasonality in many countries, however its underlying factor and mechanism remain unclear. Comparison of seasonal suicide patterns across geographically, demographically and socioeconomically heterogeneous populations will help elucidate the underlying factors influencing these patterns and better explain the mechanisms of the phenomenon. However, almost all previous studies on seasonal suicides investigated a study population that was relatively homogeneous (e.g. a single city, a single country or a few communities within a country). We propose a two-stage approach using multivariate meta-regression model for analyzing suicide counts data from multiple populations through a unified statistical modelling framework. In the first stage, we examine the suicide seasonality for each community using a generalized linear model with a quasi-Poisson distribution. We modelled nonlinear and cyclic seasonal patterns of suicide through a cyclic B-spline basis function to the week variable. In the second stage, we pool the community-specific seasonality using multivariate meta-regression to obtain country-specific seasonality. For estimation, we used an iterative method to obtain a maximum likelihood estimation (MLE) within the framework of linear mixed models. We investigated the suicide seasonality across 354 communities from 12 countries and evaluate the heterogeneity of suicide seasonality and its underlying determinants. Thirdly, we proposed a two-stage approach for meta-analysis using mixed effects meta-regression model to investigate how the minimum mortality temperature (MMT) has changed over time from the temperature-mortality data collected across multiple populations for the last several decades and evaluate the heterogeneity. MMT, which is the temperature where the mortality is minimized in the temperature-mortality association, is often considered an important indicator to assess the temperature-mortality association, indicating adaptation to climate. Recent studies have reported that the MMT has changed over the last decades in many countries indicating that people’s susceptibility to temperature has changed over time. However, most of previous studies on temperature-mortality association examined relatively homogeneous populations and the study design or the analytical methods are different over studies, which make it difficult to synthesize the results of those previous studies and to make an overall conclusion. We propose a two-stage approach using mixed effects meta-regression model for analyzing the temporal change of the MMT from multiple populations through a unified statistical modelling framework. In the first stage, we define 5-year subperiods and examine the MMT for each community and for each subperiod using a generalized linear model with a quasi-Poisson distribution. We modelled the nonlinear and delayed association between temperature and mortality through a distributed lag nonlinear model (DLNM) structure defining a cross basis for a bi-dimensional functional space describing at the same time the dependency along the temperature and in its lag dimension. In the second stage, we pool the time-varying community-specific MMT using mixed effects meta-regression. For estimation, we used an iterative method to obtain a maximum likelihood estimation (MLE) within the framework of linear mixed models. We investigated how the MMT has changed over time across 699 communities from 34 countries and evaluate the heterogeneity.

본 연구에서는 환경역학 분야에서 중요한 세가지 연구 주제를 고찰하기 위한 통계모형을 제안하고, 이를 실제 자료 분석에 적용하였다. 첫째로 캐나다의 대기오염 자료를 군집분석하기 위해 다변락 함수적 자료 군집분석을 위한 비모수 베이지안 잠재요인 모형을 제안하였다. 대기 오염 자료는 통계적인 관점에서 다변량 함수적 자료로 볼 수 있는데, 단변량 함수적 자료를 군집분석하는 통계적 기법은 다양하게 연구가 되어있는 반면에 다변량 함수적 자료를 군집분석하는 통계적 모형은 비교적 연구가 덜 되어있는 상태이다. 또한 추가적으로 공변량에 대한 자료까지 주어져 있을 때 이를 함께 분석할 수 있는 통계적 기법은 거의 알려져 있지않다. 이 논문에서는 다변량 함수적 자료와 공변량을 함께 군집분석할 수 있는 비모수 베이지안 잠재요인 모형을 제시한다. 이 모형은 다변량 함수적 자료를 기저 함수를 이용해서 기저 계수로 나타낸 이후 기저 계수와 공변량을 묶어서 이를 잠재 변수로 줄여서 표현한다. 이렇게 차원이 축소된 잠재변수를 디리슐레 혼합 모형을 사용함으로써 모형에 기반한 공변량 의존적 다변량 함수적 자료 군집분석을 수행한다. 또한 다변량 함수적 자료가 순차적으로 반복 측정 되었었을때 이를 분석하기 위해 시계열적 상관관계를 갖는 시간-가변 군집분석 모형을 제시한다. 본 모형은 앞서 제시한 군집분석 모형의 확장 형태로 디리슈레 혼합 모형 대신 시계열적 상관관계를 유도하는 계층 디리슈레 혼합모형을 사용한다. 본 연구에서는 이렇게 제시된 군집분석 방법을 모의실험을 통해 검증하고, 캐나다 대기오염 자료를 분석하였다. 둘째로, 다중 모집단에서 수집된 자살자료를 통합하여 자살의 계절성을 알아보고, 모집단간의 이질성과 이를 설명하는 요인을 찾아내기 위해 다변량 메타 회귀모형을 활용한 두 단계 메타분석방법을 제안하였다. 많은 나라에서 자살 자료가 계절성을 띄고 있음을 이전 연구들은 보고하고 있지만 그 메커니즘은 확실하게 밝혀지지 않았다. 이를 위해 지리학적, 인구학적, 사회경제적으로 다양한 모집단의 자료를 분석해서 자살의 계절성을 비교함으로써 이러한 계절성에 영향을 주는 요인과 그 메커니즘에 대한 이해를 높일 수 있을 것이다. 그러나 자살 계절성을 다룬 대부분의 이전 연구들은 하나의 도시 혹은 하나의 나라 등 상대적으로 동질적인 모집단의 자료를 분석하였다. 우리는 다변량 메타 회귀모형을 활용한 두 단계 메타분석방법을 통해 다양한 모집단 자료를 하나의 통합된 통계 모형 아래에서 분석할 수 있는 자살의 계절성 연구 방법에 대해 제시한다. 첫번째 단계에서 유사 포아송 분포를 통한 일반화 선형 모형 사용해 각 집단별로 자살의 계절성을 조사한다. 이 때, 자살의 계절성의 비선형적이고 순환적인 성질을 순환 스플라인 기저 함수를 통해 나타낸다. 두번째 단계에서 각 집단별 자살의 계절성에 다변량 메타 회귀분석을 적용해 나라별로 자살의 계절성을 조사한다. 이 때 추정을 위해, 반복법을 사용하여 선형 혼합 모형의 틀에서 기반되는 최대가능도 방법을 구현한다. 위의 방법을 12개 나라, 354개의 도시의 자살 자료에 적용함으로써 자살의 계절성을 조사하고 모집단간의 이질성과 이를 설명하는 요인을 분석한다. 셋째로, 다중 모집단에서 장기간 수집된 온도와 사망자료를 통합하여 최소사망온도의 시간에 따른 변화를 알아보고, 모집단간의 이질성을 조사하기 위해 다변량 혼합회귀모형을 활용한 두 단계 메타분석방법을 제안하였다. 최소 사망자 수 온도는 온도-사망자 수 관계를 분석하는 주요 지표 중에 하나로 기후에 대한 적응 정도를 나타낸다. 최근 연구에서 최소 사망자 수 온도가 최근 몇십년간 많은 나라에서 변화해 왔다고 보고되고 있으며 이는 온도에 대한 인간의 적응도가 시간에 따라 변화하고 있음을 보여준다. 그러나 대부분의 이전 연구들은 온도 사망자 수 관계에 대해서 상대적으로 동질적인 모집단의 자료를 분석하고 있으며 각 연구마다 분석 방법 등이 다르기 때문에 이 결과들을 통합하기에는 어려움이 따른다. 우리는 다변량 혼합회귀모형을 활용한 두 단계 메타분석방법을 통해 다양한 모집단 자료를 하나의 통합된 통계 모형 아래에서 분석할 수 있는 온도 사망자 수 관계 연구 방법에 대해 제시한다. 첫번째 단계에서 5년 길이의 하위 기간을 설정하고 각 도시에 대해서 각 하위 기간별로 최소 사망자 수 온도를 조사한다. 이 때, 온도-사망자 수 관계의 비선형적이고 지연되는 성질을 분산 지연 비선형 모형을 통해 나타낸다. 분산 지연 비선형 모형은 온도의 차원과 지연 차원, 두 차원 모두를 동시에 고려하는 기저함수를 정의한다. 두번째 단계에서 각 도시별 각 하위 기간별로 구한 최소 사망자 수 온도를 혼합 메타 회귀분석을 통해 결합한다. 이 때 추정을 위해, 반복법을 사용하여 선형 혼합 모형의 틀에서 기반되는 최대가능도 방법을 구현한다. 위의 방법을 34개의 나라, 699개의 도시의 온도-사망자 수 자료에 적용하여 최소 사망자 수 온도의 시간에 따른 변화를 분석하고 모집단간의 이질성을 조사한다.

서지기타정보

서지기타정보
청구기호 {DMAS 21002
형태사항 viii, 96 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 양대원
지도교수의 영문표기 : Yeonseung Chung
지도교수의 한글표기 : 정연승
Including Appendix
학위논문 학위논문(박사) - 한국과학기술원 : 수리과학과,
서지주기 References : p. 87-94
QR CODE qr code