Latent class models have been widely used in longitudinal studies to uncover unobserved heterogeneity in a population and find baseline characteristics of latent classes simultaneously by using the class allocation probabilities dependent on predictors. However, uncertainty in the choice of the number of classes is a well-known issue on previous latent class models for longitudinal data. To address this issue, we propose a Bayesian nonparametric latent class model for longitudinal data. The proposed model is an infinite mixture model with predictor-dependent class allocation probabilities. An individual longitudinal trajectory is described by the class-specific linear mixed effects model. The model parameters are estimated using Markov chain Monte Carlo methods. The proposed model is validated using a simulated example and a real-data example of characterizing latent classes of estradiol trajectories over the menopausal transition using data from the Study of Women's Across the Nation.
잠재클래스 모형은 예측변수에 따라 상대적으로 결정되는 잠재 하위집단 할당확률을 사용하여 모집단의 관측되지 않은 이질성을 밝혀내고 각 하위집단을 특징짓는 기본 특성을 파악하기 위해 많은 종단연구에서 활용되었다. 하지만, 잠재 하위집단의 수를 결정할 때에 존재하는 불분명성은 이전의 종단데이터 분석을 위한 잠재클래스 모형의 문제점으로 지적되어 왔다. 본 논문에서는 종단데이터를 분석하기 위한 베이지안 비모수 잠재클래스 모형을 제안함으로써 앞서 말한 불분명성을 해결했다. 제안모형은 예측 변수에 따라 상대적으로 결정되는 잠재 하위집단 할당확률을 갖는 무한혼합모형으로 개별적인 추세는 각 잠재 하위집단 고유의 선형 혼합효과 모형을 통해 모델링 한다. 모델의 매개변수 추정을 위해 베이지안 추정법인 마코브 체인 몬테카를로 방법을 사용하였다. 제안모형은 시뮬레이션 분석과 실제 사례분석을 통해 검증했고, 실제 사례분석에서는 전국여성건강연구 데이터를 활용하여 폐경이행기 동안 다른 에스트라디올 농도 변화 추세를 갖는 잠재 하위집단들의 특성을 파악하였다.