서지주요정보
Feature-embedding neural processes for missing value prediction = 결측값 예측을 위한 피처-임베딩 뉴럴 프로세스
서명 / 저자 Feature-embedding neural processes for missing value prediction = 결측값 예측을 위한 피처-임베딩 뉴럴 프로세스 / Minsu Kwon.
발행사항 [대전 : 한국과학기술원, 2020].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8035985

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 20007

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

This paper addresses the missing value prediction problem in data. Existing missing value prediction studies apply their algorithms after replacing missing values with a constant value, which does not represent the missing values clearly and has disadvantages in processing data with a high missing rate. Also, it is needed to consider the uncertainty in missing value prediction which is important for model reliability. We propose a model that generalizes a single data sample from its observations and predicts the distribution of the value of a query feature to measure uncertainty. Our model can deal with an incomplete data sample independently of missing values, and the prediction uncertainty can be measured by the output variance. In this process, the feature embedding matrix and feature importance weights are introduced to represent each feature and learned jointly with the proposed model. Through experiments in various aspects, we verify that the proposed model effectively predicts the missing values of data and offers reliable uncertainty measures.

이 연구는 데이터에서 발생하는 결측값 예측 문제를 다룬다. 기존의 결측값 예측 연구는 주로 결측값을 상수로 대체한 다음 알고리즘을 적용하는데 이는 명확하게 결측값을 대체하지 못하며 결측률이 높은 데이터를 효과적으로 처리할 수 없다. 또한 기존의 연구에서는 모델의 신뢰성에 중요한 결측값의 불확실성이 고려되지 못하고 있다. 이 연구는 이러한 문제를 해결하기 위해 관찰된 값들만을 고려하여 단일 데이터 샘플을 일반화하고 쿼리 피처 값의 분포를 예측하여 불확실성을 측정하는 모델을 제안한다. 이 모델은 결측값들에 독립적으로 데이터 샘플을 처리 할 수 있으며 출력 분산를 통해 결측값 예측에서의 불확실성을 나타낸다. 이 모델에서, 피처 임베딩 행렬과 피처 중요도가 각 피처의 특성 표현하기 위해 도입되었고 제안된 모델과 함께 학습된다. 우리는 다양한 측면에서의 실험을 통해 제안된 모델이 데이터 포인트의 결측값을 효과적으로 예측하고 신뢰할 수 있는 불확실성 측정을 제공하는지 확인한다.

서지기타정보

서지기타정보
청구기호 {MCS 20007
형태사항 iii, 28 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 권민수
지도교수의 영문표기 : Ho-Jin Choi
지도교수의 한글표기 : 최호진
학위논문 학위논문(석사) - 한국과학기술원 : 전산학부,
서지주기 References : p. 24-26
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서