서지주요정보
Structure learning of Bayesian networks using random forest and independence test = 랜덤포레스트와 독립성검정을 사용한 베이지안망 모형의 구조학습
서명 / 저자 Structure learning of Bayesian networks using random forest and independence test = 랜덤포레스트와 독립성검정을 사용한 베이지안망 모형의 구조학습 / Hye-Yoon Choi.
발행사항 [대전 : 한국과학기술원, 2011].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8022564

소장위치/청구기호

학술문화관(문화관) 보존서고

MMA 11015

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Data mining is the whole procedure of analyzing patterns between some objects. Due to its importance in wide range of areas such as business, science and technology, the methods for proceeding this job are developed from early century. Especially, inventing computers enables us to create many efficient tools including Random Forest. Classification is one of the form of data mining. The key objective of classification is the generalization of known structure from given data. We can use the Bayesian Network, a kind of classification, to analyzing the relations between random variables under suitable conditions. Bayesian Network is the graph-shaped modeling relations between random variables. Each variable supported by $\{0,1 \}$ can be expressed by nodes of graph. Their relations also can be described by edges. This method includes a lot of graphical model structure to find correct one such as undirected graph model, directed acyclic graph model and chain model. This modeling among variables can allow us to recognize whole structure easily. Directed acyclic graphical model, especially, contains a bunch of information even though it is hard to determine. To find the true structure, people must do several jobs. Before analyzing given data, we should get information about a whole situation which we can gain. It is sometimes very useful ingredient for deciding structure. There exist two ways to find undirected edges for objective reasons. One is to find undirected graphical model. This can do by a variety of tools such as log-linear modeling. The other is to determine the previous structure of directed acyclic graph model before deciding orientations. We will introduce this by using the package Random Forest. Finally, we should decide the directions of edges. Unfortunately, there is no standard program for doing this. But as we study the characteristic of relations between nodes such as independency, we can determine the orientations. Also we use the knowledge of situation to analyze this. After doing this jobs, we get a structure which we want.

데이터 마이닝은 객체들의 경향성을 분석하는 절차이다. 이 분야는 일찍이 비지니스, 과학기술 등과 같은 넓은 분야에서 중요성이 대두되어 발전되었다. 특히 컴퓨터의 등장 이후에는 랜덤 포레스트를 포함해서 많은 효율적인 도구들이 개발 되었다. 분류는 데이터 마이닝의 한 형태로 이의 주된 목적은 주어진 자료를 통해 기존의 구조를 일반화 하는 것이다. 적절한 조건하에 확률변수들의 관계를 분석하기 위해 분류의 한 종류인 베이지안 네트워크를 사용할 수 있다. 베이지안 네트워크는 확률변수간의 관계를 그래프 모양으로 나타내는 것이다. 0 또는 1의 값을 갖는 각각의 변수들은 그래프의 꼭지점으로써 표현될 수 있고 그들의 관계는 꼭지점 사이의 선분에 의해서 나타날 수 있다. 이 방법은 방향성이 없는 그래프, 방향성이 있는 그래프, 그것들이 섞여있는 그래프등으로 구현될 수 있다. 특히 베이지안 네트워크는 방향성이 있는 그래프에 의해 구현된 구조를 말한다. 이것은 결정하기가 어렵지만 많은 정보를 포함하고 있다. 올바른 베이지안 네트워크를 찾기 위해서는 우선 변수들이 생성되어 있는 상황을 잘 인지할 필요가 있다. 방향성이 없는 그래프의 구현은 두가지 목적이 있을 수 있다. 하나는 그자체로 의미가 될 수 있는 기존의 구조에 대한 구현으로써의 목적이고 다른 하나는 베이지안 네트워크를 찾기위한 전 단계로써의 목적이다. 우리는 이 논문에서 두번째에 대한 것을 랜덤 포레스트로 구현하였다. 베이지안 네트워크를 찾기 위한 마지막 단계로 선분의 방향을 결정하는 과정을 거쳐야 한다. 이 과정에서는 이전 단계들에서 있었던 프로그램 형태의 특성화된 방법은 존재하지 않는다. 그렇지만 독립성과 같은 변수들 사이의 관계를 이용해서 방향을 결정할 수 있다. 이 때 또한 변수들이 생성된 상황을 이용할 수도 있다. 이러한 일련의 과정을 거친후에 우리는 우리가 원하는 베이지안 네트워크 구조를 얻을 수 있다.

서지기타정보

서지기타정보
청구기호 {MMA 11015
형태사항 iv, 34 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 최혜윤
지도교수의 영문표기 : Sung-Ho Kim
지도교수의 한글표기 : 김성호
학위논문 학위논문(석사) - 한국과학기술원 : 수리과학과,
서지주기 참고문헌 : p. 31
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서