서지주요정보
Bayes variable selection for semicontinuous outcome regression = 반연속형 자료 회귀분석을 위한 베이지안 변수 선택법
서명 / 저자 Bayes variable selection for semicontinuous outcome regression = 반연속형 자료 회귀분석을 위한 베이지안 변수 선택법 / Jin-Su Park.
발행사항 [대전 : 한국과학기술원, 2012].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8024338

소장위치/청구기호

학술문화관(문화관) 보존서고

MMAS 12001

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In biomedical research, semi-continuous data (mixture of zeros and continuously distributed positive values) frequently arise. Regression analysis for such semi-continuous outcome variable is challenging because of the inappropriateness of the normal error assumption. One naive approach is to fit a normal regression with log-transformed outcome variable. This method is easy to implement but is not flexible enough to account for large proportion of zeros. A two-part model has been developed allowing for more flexibility where two regressions model the binary part and the continuous part of the data separately. Alternatively, a truncated normal regression is applicable, which assumes an underlying latent variable exists and follows a normal regression, and it can be extended to zero-inflated truncated normal model. In this research, we compare 4 different methods for semi-continuous outcome regression in various scenarios via simulation studies and examine how inferences are affected by different model specifications. In all methods, we conduct Bayesian inference and develop MCMC algorithms for posterior sampling where the Stochastic Search Variable Selection (SSVS) structure for the regression coefficients is incorporated facilitating variable selection. We apply the 4 methods to a motivating example data to investigate the relationship between impulsivity and hazardous drinking in young adulthood.

반연속형 자료 ( 양수 값을 갖는 연속형 자료와 0의 값을 갖는 자료의 혼합 자료) 는 의생명공학 연구 분야에서 종종 등장한다. 이 반연속형 자료는 오차의 정규 분포 가정을 만족하지 않으므로 일반적인 회귀 모형으로 추정하면 편향이 생기는 등의 문제점이 생긴다. 이러한 문제점을 해결하기 위한 가장 간단한 모형으로 응답변수를 로그 변형하여 회귀 모형으로 추정하는 로그정규분포 모형이 있다. 이 모형은 구현이 간단하다는 장점이 있지만 0의 비율이 높은 자료를 추정할 때는 여전히 불충분하다. 그래서 더 유연한 모형으로써, 주어진 자료를 0인지 아닌지에 대한 2진 자료와 연속형 자료로 분리하여 생각하여 두 가지 자료를 각각 회귀 모형으로 추정하는 투 파트 모형, 정규분포를 따르는 잠재변수가 존재한다고 가정하여 회귀 분석을 하는 절단 회귀 모형, 그리고 마지막으로 절단 회귀 모형을 확장시킨 영 과잉 절단 회귀 모형이 제안되었다. 본 논문에서는 시뮬레이션을 통하여 다양한 상황으로 생성한 반연속형 자료들에 앞서 언급한 4가지 모형 ( 로그정규분포 모형, 투 파트 모형, 절단 회귀 모형, 영 과잉 절단 회귀 모형 )을 적용하여, 모형에 따라 추론이 어떻게 변하는 지를 비교해보고자 한다. 모든 모형에 대하여 추정 방법으로는 베이지안 기법을 이용하였다. 사후분포는 MCMC 알고리즘을 사용하여 구하였으며, 변수 선택을 하기 위하여 회귀 계수의 사전분포로써 SSVS 구조를 사용하였다. 마지막으로 시뮬레이션에서 얻은 결과를 기반으로 실제 자료에 4가지 모형을 적용하여 여러 변수들이 컨트롤되고 있을 때에 충동 변수가 과음에 미치는 영향을 조사하여 보았다.

서지기타정보

서지기타정보
청구기호 {MMAS 12001
형태사항 iv, 24 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 박진수
지도교수의 영문표기 : Yeon-Seung Chung
지도교수의 한글표기 : 정연승
학위논문 학위논문(석사) - 한국과학기술원 : 수리과학과,
서지주기 References : p. 20-21
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서