서지주요정보
Joint active feature acquisition and classification with variable-size set encoding = 가변 크기 집합의 인코딩을 이용한 동적 피쳐 획득과 분류의 공동 학습
서명 / 저자 Joint active feature acquisition and classification with variable-size set encoding = 가변 크기 집합의 인코딩을 이용한 동적 피쳐 획득과 분류의 공동 학습 / Hajin Shim.
발행사항 [대전 : 한국과학기술원, 2019].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8033853

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 19022

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

We consider the problem of active feature acquisition where the goal is to sequentially select the subset of features in order to achieve the maximum prediction performance in the most cost-effective way at test time. In this work, we formulate this active feature acquisition as a joint learning problem of training both the classifier (environment) and the reinforcement learning (RL) agent that decides either to ‘stop and predict’ or ‘collect a new feature’ at test time, in a cost-sensitive manner. We also introduce a novel encoding scheme to represent acquired subsets of features by proposing an order-invariant set encoding at the feature level, which also significantly reduces the search space for our agent. We evaluate our model on a carefully designed synthetic dataset for the active feature acquisition as well as several medical datasets. Our framework shows meaningful feature acquisition process for diagnosis that complies with human knowledge, and outperforms all baselines in terms of prediction performance as well as feature acquisition cost.

이 논문은 분류 문제의 테스트 단계에서 필요한 정보 (이하 피쳐) 를 수집하는데에 있어 비용이 소요되는 상황을 가정하고, 가장 비용 효율적인 방식으로 최대의 예측 성능을 달성하도록 하는 순차적 피쳐 획득 정책과 획득한 피쳐를 바탕으로 분류를 수행하는 분류기를 공동으로 학습하는 것을 목표로 한다. 피쳐 획 득은 각 인스턴스 별로 다르게 일어나며, 현재 가지고 있는 정보를 바탕으로 능동적으로 일어나게 된다. 위 목표를 달성하기 위해 먼저 "어떤 피쳐를 수집 할 지" 혹은 "수집을 중단 할 지" 를 결정하는 에이전트와, 분류기에 대한 최적화 문제로 나타내었으며 , 이를 풀기 위하여 강화학습을 이용한 공동 학습 프레임워크를 제시하였다. 또한 집합을 인코딩 하는 심층 모델을 이용하여 현재까지 얻은 피쳐들의 집합에 대해서 수집한 순서에 관계 없이 동일한 실수 벡터로 나타낼 수 있는 방법을 제안하여 에이전트의 상태 공간을 효과적으로 줄였다. 제안한모델을평가하기위해동적피쳐획득실험을위해설계된합성데이터와몇가지의의료 데이터에 대해서 실험을 진행하였다. 그 결과 논문에서 제안한 프레임워크를 이용해 에이전트가 선택한 피쳐가 사람의 지식과 결부되는 결과를 보였으며, 기준 모델들에 비해 분류 성능과 피쳐를 획득하는 비용 측면에서 우수함을 보였다.

서지기타정보

서지기타정보
청구기호 {MCS 19022
형태사항 iii, 23 p. : 삽화 ; 30 cm
언어 한국어
일반주기 저자명의 한글표기 : 심하진
지도교수의 영문표기 : Eunho Yang
지도교수의 한글표기 : 양은호
학위논문 학위논문(석사) - 한국과학기술원 : 전산학부,
서지주기 References : p. 20-21
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서