Anomaly detection is a field of research necessary in various practical scenarios such as cyber fraud detection and medical diagnosis. There have been many anomaly detection studies using deep self-supervised learning, but relatively few investigations on tabular data tasks. In our study, we propose Contrastive Learning with Anomaly Generation (CLAG), an effective learning method that utilizes generated anomaly. This is a combination of anomaly generation scheme with contrastive representation learning, which has been in the spotlight recently. In our experiments, CLAG shows high performance on multiple tabular datasets, especially state-of-the-art performance on Thyroid. We analyze which factors are helpful in learning the representations required for anomaly detection through several additional experiments.
이상치 탐지는 사이버 사기 탐지, 의료 진단 등 여러 실생활 상황에서 필요로 하는 연구 분야이다. 심층 자기지도 학습을 이용한 많은 이상치 탐지 연구가 이루어졌지만, 표 형식 데이터를 다루는 문제에서의 연구는 비교적 적다. 우리의 연구에서는 생성된 이상 데이터를 사용하는 효과적인 학습 방법인, 이상 데이터 생성 하의 대조 학습을 제안한다. 이것은 이상 데이터 생성 방식을 최근 각광받고 있는 대조 표상 학습과 결합한 것이다. 우리의 실험에서, 이상 데이터 생성 하의 대조 학습은 여러 표 형식 데이터에 대해 높은 성능을 보였고, 특히 갑상선 의료 데이터에서 최첨단의 성능을 보인다. 우리는 여러 추가적인 실험들을 통해 이상치 탐지에 필요한 표상을 학습하는 데에 어떤 요소가 도움이 되는지를 분석한다.