The anomaly detection technique for distinguishing anomalies from normal data is being used in various area, such as quality inspection in production line, surveillance system, and disease diagnosis in medical field. Several deep neural network based techniques have been proposed to model the pattern or the distribution of normal data. At the evaluation stage, normal and
abnormal data are distinguished in terms of the reconstruction error of the trained model. When using the reconstruction task for anomaly detection, noises included in normal data degrade the performance. In this work, to alleviate such problem, a data augmentation technique using frequency masking is employed, which can imitate the background noise in spectrogram. Also, a novel anomaly score is introduced and ensembled with the existing method to improve the detection performance for various types of anomalies. The models trained and evaluated by six kinds of sound datasets demonstrate performance improvement for all types of datasets.
비정상 신호 판정은 데이터의 정상, 비정상을 구분하는 문제로 공정 라인에서의 제품 검사, 감시, 의료 분야의 질병 진단 등 다양한 분야에서 응용되고 있다. 심층학습을 이용한 비정상 신호 판정의 경우 정상 데이터의 패턴을 학습하기 위해 심층신경망을 사용하거나, 직접 정상 데이터의 분포를 학습하는 등의 접근 방식을 통해 비정상 신호 판정을 수행한다. 복원 학습을 이용해 정상 모델링을 하여 비정상 신호 판정을 하는 경우, 정상 데이터에 포함되어 있는 소음으로 인해 성능이 떨어지는 문제가 있다. 본 연구에서는 이러한 문제를 완화하기 위해 스펙트로그램 상에서의 배경소음을 모사할 수 있는 주파수 마스킹을 이용한 데이터 증강을 사용할 것을 제안한다. 또한, 시간과 주파수별 다양한 비정상에 에 대해 좋은 성능을 낼 수 있도록 새로운 비정상 점수를 정의하고 기존의 비정상점수와 앙상블하여 사용할 것을 제안한다. 6가지 기계 소리에 대해 성능 평가를 진행했으며, 평균 성능을 향상 시켰다.