서지주요정보
(A) theory and method for large recursive models with incomplete categorical data = 불완전 범주형 자료의 거대 순환 모형에 대한 이론과 방법
서명 / 저자 (A) theory and method for large recursive models with incomplete categorical data = 불완전 범주형 자료의 거대 순환 모형에 대한 이론과 방법 / Seong-Ho Kim.
저자명 Kim, Seong-Ho ; 김성호
발행사항 [대전 : 한국과학기술원, 2005].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8016438

소장위치/청구기호

학술문화관(문화관) 보존서고

DMA 05003

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Statistical graphical models are getting more attention nowadays from many research fields such as Artificial Intelligence, Medical diagnosis, educational learning, cognitive science, biology, data mining, machine learning, and many other applied sciences. Some of the reasons are user-friendliness and easy interpretation and representation of model structures. The model structures are presented in graph, and we use directed edges or undirected edges between nodes (or variables) in the graph according to the intrinsic relationship between the corresponding nodes. Necessary and sufficient conditions for collapsibility of a hierarchical log linear model for a multidimensional contingency table were defined by Asmussen and Edwards [3]. We have shown that these conditions can be combined with recursive graphical models, and the necessary and sufficient for collapsibility is found for recursive graphical models. We propose an ML estimation method for a recursive model of categorical variables which is too large to handle as a single model. We first split the whole model into a set of submodels which can be arranged in the form of a tree. Two conditions are suggested as an instrument for estimating the parameters of the whole model yet working within individual submodels. Theorems are proved to the effect that, when missing values are involved, we can generalize and apply the principle of EM to the tree of submodels so that the ML estimation is possible for a recursive model of any size. For illustration, simulation experiments of the ML estimation are carried out for recursive models of up to 158 binary variables, and the proposed method is applied successfully to real data where 28 binary variables are involved.

다변량 분할표상에서 계층적 로그 선형 모델의 붕괴가능성에 대한 필요충분조건은 Asmussen 과 Edwards에 의해 정의 되었다. 이들의 결과들이 순환 그래프 모형에 결합될 수 있음을 보였고 순환 그래프 모형에 대한 붕괴가능성에 대한 필요충분조건을 발견하였다. 또한 너무 커서 한 모형으로 다룰 수 없는 범주형 변수의 순환 모형에 대한 ML 추정 방법을 제안했다. 이 방법은 전체 모형을 나무 모양으로 배열된 부분모델의 집합으로 나누어 모수를 추정한다. 나눌 때 두 조건이 필요하고 이 두 조건은 각각의 부분모형의 추정치가 전체 모형의 모수 추정치를 잘 추정할 수 있도록 해 준다. 이와 더불어 분실 값들이 포함되어 있을 때 나무모양의 부분모델에 EM 알고리즘을 일반화 시킬 수 있고 적용할 수 있다는 것을 보였다. 이 결과 ML 추정 방법은 순환 모형의 크기에 상관없이 수행된다. 예증으로서, ML 추정의 모의실험을 했다. 특히, 158개의 이진변수를 가진 거대 순환 모형에 대해 수행했고 28개의 이진변수를 가진 실제 자료에 성공적으로 제안된 방법을 수행했다.

서지기타정보

서지기타정보
청구기호 {DMA 05003
형태사항 vii, 85 p. : 삽도 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 김성호
지도교수의 영문표기 : Sung-Ho Kim
지도교수의 한글표기 : 김성호
학위논문 학위논문(박사) - 한국과학기술원 : 응용수학전공,
서지주기 Reference : p. 80-85
주제 Bayesian Networks
Collapsibility
EM algorithm
Hyper-EM
Missing Data
QR CODE qr code