This work proposes to incorporate Dirichlet Forest Priors to Variational Deep Embedding (VaDE), a deep unsupervised generative model for clustering, in order to implement hierarchical clustering and evaluates its hierarchical clustering accuracy. In this process, the method to alleviate the class imbalance problem in clustering by injecting prior knowledge is presented. Furthermore, this paper suggests a method to give guidance to clustering with few labels. Evaluations on the performance gains of these contributions are done through experiments on both image and text datasets.
본 논문에서는 가우시안 혼합모델과 변분 오토인코더를 결합시킨 비지도적 생성을 통한 클러스터링 모델 중 하나인 변분적 딥 임베딩에 디리클레 포레스트 사전 확률을 활용하여 계층적 클러스터링을 시도하였고 그에 대한 성능을 살펴보았다. 이 과정에서 불균형적 데이터에 대한 변분적 딥 임베딩의 성능을 개선하는 방법을 제시하였고 소량의 라벨을 이용하여 클러스터링에 지도를 반영할 수 있는 방법을 제시하였다. 본 논문에서는 이미지와 자연어 데이터셋을 활용한 실험을 통해서 이러한 성능 개선들을 검증하였다.