Time-series anomaly detection is a study that finds unusual data in a series of observed, chronologically listed data. Anomaly detection in time-series data has become an important task in many applications. It can provide valuable insights into the underlying process or system being monitored, helping to prevent catastrophic events, reduce costs, and improve overall efficiency. As time-series data becomes increasingly complex and larger, there are some limitations in the quality of time-series data, such as a lack of labels, inaccurate labels, and contamination of training data. Therefore, in this work, we propose to cluster dimensions of multivariate time series into meaningful groups to train anomaly detection models for each cluster. We also take advantage of a few anomaly labels included in the training dataset to proceed with this process. We confirm that real-world data can be separated into several groups that share similar patterns and that, in fact, anomaly detection performance increases when the model is trained for each cluster.
시계열 이상치 탐지는 시간 순으로 관측된 데이터에서 비정상적인 데이터를 찾는 연구입니다. 시계열 데이 터의 이상치 탐지는 많은 응용 분야에서 중요한 연구로 자리매김하고 있습니다. 이는 모니터링되는 잠재적인 프로세스 또는 시스템에 대한 가치있는 통찰력을 제공하여 재해를 방지하거나 비용을 절감하는 등 전반적 인 효율성을 향상시킬 수 있습니다. 시계열 데이터가 점점 복잡해지고 크기가 커짐에 따라 레이블 부족, 부정확한 레이블 및 훈련 데이터 오염 현상과 같은 시계열 데이터의 품질에 관한 문제가 발생하고 있습니다. 따라서 본 연구에서는 적은 이상치 레이블을 포함하고 있는 다변량 시계열의 차원을 유의미한 그룹으로 클러스터링하여 각 클러스터에 대한 이상치 탐지 모델을 훈련할 것을 제안합니다. 실제 데이터가 유사한 패턴을 공유하는 몇 개의 그룹으로 분리될 수 있음을 확인하고, 실험을 통해 분리한 각 클러스터에 대해 이상치 탐지 모델을 훈련하는 것이 시계열 이상치 탐지 성능 개선을 확인합니다.