Obtaining ground truth data in medical imaging has difficulties due to the fact that it requires a lot of annotating time from the experts in the field. Also, when trained with supervised learning, it detects only the cases included in the labels. In real practice, we want to also open to other possibilities than the named cases while examining the medical images. As a solution, the need for anomaly detection that can detect and localize abnormalities by learning the normal characteristics using only normal images is emerging. With medical image data, we can design either 2D or 3D networks of self-supervised learning for ‘Anomaly Detection’ task. Although 3D networks, which learns 3D structures of the human body, show good performance in 3D medical image anomaly detection, they cannot be stacked in deeper layers due to memory problems. While 2D networks have advantage in feature detection, they lack 3D context information. In this paper, we develop a method for combining the strength of the 3D network and the strength of the 2D network through joint embedding. We also propose the pretask of self-supervised learning to make it possible for the networks to learn efficiently. Through the experiments, we show that the proposed method achieves better performance in both classification and segmentation tasks compared to the SoTA method.
의료영상을 위한 표지는 해당 분야 전문가의 많은 시간이 소모되므로 획득이 어려운 문제가 있다. 또한 지도 학습으로 학습된 경우 표지에 포함된 병만 찾아낼 수 있으므로 실제 의료 진단 보조로써 사용하기 어려울 수 있다. 이를 위한 방법으로 정상 이미지들만을 가지고 정상군의 특징들을 학습하여 이상을 판단할 수 있도록 하는 이상 탐지 분야의 필요성이 대두되고 있다. 이러한 방법은 인체의 3차원 구조를 학습할 수 있는 3D 방법이 좋은 성능을 보이지만, 메모리 문제상 2D 네트워크보다 깊게 쌓을 수 없다는 단점이 있다. 따라서 본 논문에 서는 조인트 임베딩을 통해 3차원 네트워크의 장점인 삼차원 컨텍스트 학습과 2차원 네트워크의 장점인 깊은 특징 추출기를 상호보완적으로 활용할 수 있도록 하는 방법을 제안한다. 또한 자기지도 학습의 사전 작업을 제안하여, 이를 통해 빠르게 학습할 수 있도록 하였다. 본 연구에서 제안한 방법의 유효성을 위한 실험을 통하여 이상 감지(detection)와 검출(segmentation)에서 모두 우수한 성능을 보임을 입증하였다.