서지주요정보
Spatial missing imutation using a gaussian process in a bayesian hierarchical poisson random effects model : application to an air pollution health effects study = 베이지안 계층구조를 이용한 포아송 임의효과 모형에서 gaussian process를 이용한 공간적 결측치 대체법 : 환경오염과 건강에 관한 연구
서명 / 저자 Spatial missing imutation using a gaussian process in a bayesian hierarchical poisson random effects model : application to an air pollution health effects study = 베이지안 계층구조를 이용한 포아송 임의효과 모형에서 gaussian process를 이용한 공간적 결측치 대체법 : 환경오염과 건강에 관한 연구 / Bit-Na Cho.
발행사항 [대전 : 한국과학기술원, 2013].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8025650

소장위치/청구기호

학술문화관(문화관) 보존서고

MMAS 13018

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Poisson random effects regression model is often used to analyze spatially-varying associations between a count response variable and an exposure variable when the data for multiple locations are available and multiple observations are obtained in each location (e.g. multi-site time series data). Also, when location-specific predictors that may explain the spatial variability in the exposure-response association are available, a hierarchical regression structure can be added to the Poisson random effects model in a Bayesian framework. However, often, the location-specific predictors are not observed for all locations and missing data occur. One na"ive approach is to use only the complete case data but it is not recommendable as using the reduced sample results in a loss of power in statistical inference. Because the location-specific predictors should be spatially correlated, one may consider missing data imputation by modeling a Gaussian process (GP) with some spatial correlation structure. One caution should be made for the choice of the correlation because misspecified correlation should yield a bias both in imputation and in the statistical inference in a hierarchical Poisson regression modeling. In this research, motivated by an air pollution health effects study data where we encounter such missing data problem, we examine the correlation misspecification bias in the spatial GP modeling for missing predictor imputation as well as in the statistical inference for a Bayesian hierarchical Poisson regression modeling. Also, we apply the spatial GP imputation to our data selecting the best correlation structure via a cross-validation and compare the results of Poisson regression modeling between using the complete case data only and using all data with imputation.

포아송 임의효과 회귀모형은 반복측정자료가 여러 지역에서 얻어졌을 때, 반응변수와 설명변수의 관계를 지역에 따라 가변적으로 모형화하는데 유용하게 사용된다. 또한, 설명변수와 반응변수 관계의 지역적 가변성을 설명할 수 있는 지역별 예측변수들이 추가적으로 관찰되었다면, 베이지안 계층적 회귀구조를 포아송 임의효과 회귀모형에 결합할 수 있다. 그러나, 지역적 예측변수들이 종종 모든 지역에서 관찰되지 않는 경우 자료에 결측치가 발생한다. 이러한 경우, 결측치가 발생한 지역을 제외하고 모형화를 하면 표본의 수가 감소하여 통계적 추론에 정밀성이 떨어진다. 이를 보완하기 위해, 지역별 예측 변수의 공간적인 상관관계를 이용하여 가우시안 확률과정 (Gaussian process) 을 통해 결측치를 대체하는 방법을 사용할 수 있다. 이때, 가우시안 확률과정에 필요한 공간적 상관구조의 설정이 필요하며, 잘못 지정된 상관구조는 결측치 예측 및 결측치를 이용한 회귀모형 추정에 편향이 가져올 수 있다. 본 연구는 앞서 설명한 결측치의 문제점을 수반한 환경오염과 건강에 관한 분석자료에 기반한다. 본 연구에서는 가우시안 확률과정을 이용한 결측치의 공간적 대체법이 상관구조의 잘못된 지정에 따른 결측치 예측 및 회귀모형 추정의 편향이 어떻게 나타나는지를 비교 분석하였다. 또한, 교차 검증법을 통해 실제 자료에 가장 적합한 상관관계 구조를 설정하고, 가우시안 확률과정 모형화를 통해 결측치를 대체한 후, 전체 자료를 사용한 경우와 결측치를 제외한 자료를 사용한 경우 포아송 임의효과 회의모형의 결과가 어떻게 달라지는지를 비교 분석하였다.

서지기타정보

서지기타정보
청구기호 {MMAS 13018
형태사항 iv, 26 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 조빛나
지도교수의 영문표기 : Yeon-Seung Chung
지도교수의 한글표기 : 정연승
학위논문 학위논문(석사) - 한국과학기술원 : 수리과학과,
서지주기 References : p. 23
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서