서지주요정보
Deep anomaly detection for unlabeled dataset = 레이블이 없는 데이터셋을 위한 심층 이상 감지 기법
서명 / 저자 Deep anomaly detection for unlabeled dataset = 레이블이 없는 데이터셋을 위한 심층 이상 감지 기법 / Minkyung Kim.
발행사항 [대전 : 한국과학기술원, 2023].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8040287

소장위치/청구기호

학술문화관(도서관)2층 학위논문

DEE 23016

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Anomaly detection techniques constitute a fundamental resource in various applications to identify observations that deviate considerably from what is considered normal. In recent years, in response to increasingly complex data at a large scale, deep learning-based anomaly detection has been actively researched and has shown high capabilities. Meanwhile, since deep learning is based on a representation learned from a given dataset, most deep anomaly detection models aim to learn normality, assuming that a dataset consisting of only normal samples is available. Thereby, one-class classification-based approaches are one of the representative approaches of deep anomaly detection. However, in practice, it is expensive to prepare a training dataset consisting of normal samples as it requires per-sample inspection. This dissertation deals with deep anomaly detection based on robust normality learning in deep one-class classification for the unlabeled dataset, which is a mixed set of normal and abnormal data. To this end, we propose 1) an unsupervised one-class classification based on an adaptive threshold and pseudo-labeling without human intervention and 2) an active learning-based one-class classification searching for an adaptive threshold by leveraging human annotation feedback. For both methods, we obviate the use of a hyper-parameter for the anomaly ratio of a dataset that is often unknown prior knowledge in practice but critical for one-class classification. Through multiple experiments and analyses with multivariate point datasets, we demonstrate that the proposed methods improve the robustness of anomaly detection under different levels of anomaly ratio, which is unknown in practice. The proposed method is also applied to microscopy cell images contaminated with artifacts, adding its practicality in the real world. This work contributes to increasing the utilization of a vast amount of collected data that remains unlabeled in the real world and the efficiency of labeling workers.

이상 감지 기술은 어플리케이션에 따라 정의되는 보편적인 관측치, 혹은 정상이라 여겨지는 관측치에서 벗어나는 것을 감지하는 기술로, 다양한 산업 영역에서 필수 기술로 자리매김하고 있다. 최근에는 점점 더 복잡해지는 대규모 데이터에 대응하여 딥 러닝 기법을 활용하는 이상 감지가 활발히 연구되고 있다. 여느 딥 러닝 모델과 같이, 딥 러닝 기법을 기반으로 하는 심층 이상 감지에서도 목적에 맞는 학습 데이터셋을 얻는 것은 중요한 문제이다. 특히, 대부분의 심층 이상 감지 기법은 정상 데이터로만 이루어진 학습 데이터셋을 요구한다. 이는 일관성이 떨어지는 비정상 데이터와 달리, 공통된 특징을 보이는 정상 데이터의 특징 공간을 학습하는 데에 딥 러닝 기법을 접목하는 것이 더 적절하기 때문이다. 따라서 심층 이상 감지는 일반적으로 정상 상태에서 수집되는 데이터만을 학습하여 새로운 데이터가 정상 상태인지 아닌지를 판별하는 형태인 단일 클래스 분류로 모델링된다. 하지만, 현실의 다양한 어플리케이션에서 정상 데이터로만 구성되는 데이터셋을 마련하는 것에는 레이 블링 비용이 수반된다. 특히 데이터의 수집 양이 많고, 레이블링 비용이 높은 경우의 수집 데이터는 레이블이 없는 상태로 남아있게 되는데, 이는 수집 데이터의 활용도를 크게 떨어트린다. 이에 따라 본 논문에서는, 정상 데이터와 비정상 데이터가 레이블 없이 혼합된 데이터 세트에서도 정상 상태의 특징 공간을 학습할 수 있는 심층 이상 감지 기법을 다룬다. 먼저 사람의 개입 없이 의사 레이블링을 기반으로 하는 비지도 단일 클래스 분류를 제안하며, 나아가 레이블링이 가능한 인적 자원을 효율적으로 활용할 수 있는 능동 학습 기반 단일 클래스 분류를 제안한다. 이 때, 단일 클래스 분류의 중요 매개변수 설정에 관련되는 데이터셋 내 비정상 데이터의 비율을 추정함으로써, 데이터셋 혹은 학습 환경에 따라 달라지는 매개변수 설정에 구애받지 않는다. 또한, 능동 학습 환경에서 얻어지는 레이블을 활용하여 정보량이 높은 데이터 공간을 간접적으로 추정하고, 이를 대조적 학습 기반 반지도 학습법에 적용하여 정상 상태의 특징 공간을 보다 효율적으로 학습 한다. 본 논문에서는 실 수집 데이터세트인 이상 감지 벤치마크 데이터셋과 인공물로 오염된 현미경 이미지 데이터셋에 대해 제안 방법의 효과를 검증하였다. 제안된 방법은 기존 심층 이상 감지 모델에 적용되어 레이 블이 없는 데이터셋에서도 정상 상태를 견고히 학습함을 보였다. 본 연구는 현실에서 레이블링이 되어있지 않은 수집 데이터들의 활용도를 높이고, 나아가 레이블링 작업자의 효율을 증대하는데 기여한다.

서지기타정보

서지기타정보
청구기호 {DEE 23016
형태사항 v, 63 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김민경
지도교수의 영문표기 : Junkyun Choi
지도교수의 한글표기 : 최준균
Including appendix
학위논문 학위논문(박사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 54-60
주제 Deep anomaly detection
One-class classification
Unsupervised learning
Active learning
Unlabeled dataset
심층 이상 감지
단일 클래스 분류
비지도 학습
능동 학습
레이블이 없는 데이터셋
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서