We usually handle large data set with more than 100 variables in social statistical analysis or biological analysis. However, it is often impossible to handle 100 variables at once without the super-computer. Although we use the super-computer, it takes long time to compute and build its model at once. In this case we can choose a tree-structured approach as a solution, The CART provides users with many options and useful results in detail. We have to examine variable importance which the CART offers. After we select relatively important variables which reflects the contribution each variable makes in classifying or predicting the target variable, we can make a new grouping algorithm. Finally, we get more information by comparing the true model which is given in the form of a Bayes network with a new model.
서로 연관성이 있는 확률변수들에 대한 베이즈 네트웍 모델을 만들려고 할 때, 확률변수 전체를 모두 다루는 데는 많은 시간이 소요되고, 어떤 경우에는 원래의 모델과는 거리가 먼 결과를 야기할 수 있는 문제가 있을 수 있다. 이러한 문제점의 해결하기 위하여 전체 모델을 적당한 크기의 그룹으로 나누어 개개의 집합에 대한 결합모델을 세우고, 그것을 토대로 전체 모델의 구조를 추측하는 방법을 고려하였다. 이 논문의 주된 논제는 전체 확률변수를 몇개의 부분집합으로 묶을 때, CART가 제공하는 결과들이 유용한지에 대한 검토이다. 시뮬레이션 결과 CART에서 제공하는 변수 중요도가 변수들 사이의 연관성을 잘 나타내 주는 효율적인 측도임을 알 수 있었다.