With the advancements of deep learning, specifically convolutional neural networks (CNNs), researchers utilize CNNs for classifying the whole slide images. To make use of CNNs, researchers follow a two-stage scheme. First, they divide whole slide images into patches to train a CNN called patch level model, and in the second stage, they aggregate CNN's output for all patches to assign the final label called slide level model. Different forms of CNNs managed to deliver promising results highlighting the potential of deep learning. However, most of the work has been done to improve the CNNs performance using different architectures and ignored the error propagation in whole slide image analysis frameworks. This research highlights how errors can propagate between different stages of the whole slide image analysis framework and proposes methods to mitigate such errors. We have identified data-driven and model-driven errors in stage 1 and stage 2, respectively. To reduce the intensity of errors, we first proposed a loss-based method called LossDiff to address data-driven errors. Secondly, an unsupervised method WSI-GAD based on graph autoencoders is incorporated to mitigate model-driven errors.
Several evaluation methods were applied, highlighting the presence of error and showing that the proposed methods significantly improve the classification performance. The dissertation provides valuable contributions to computer-aided whole slide image analysis literature. This study's findings will direct the research community to consider the uncertainty injected by the training data and understand how the model-driven errors can affect the final predictions of the whole slide image. This will help researchers to develop not only accurate models but also deliver generalized performance.
딥 러닝, 특히 컨볼류션 신경망(CNN)의 발전으로 조직 슬라이드 이미지 분류를 위해 CNN을 활용할수 있게되었다. CNN을 활용하기 위해서 일반적으로 2단계의 과정을 따른다. 먼저, 조직 슬라이드 이미지를 작은 이미지인 패치로 분할하여 패치 이미지를 분류하는 CNN을 훈련시키고, 두 번째 과정에서는 모든 패치에 대한 CNN의 출력 결과를 집계하여, 슬라이드를 분류하는 CNN이 최종 레이블을 예측하도록 한다. 다양한 형태의 CNN은 딥러닝 가능성을 증명하는 유망한 결과를 성공적으로 보여주었다. 그러나 대부분의 선행연구는 수정된 아키텍쳐를 통해 CNN의 성능을 개선하고자 하였으나, 조직 슬라이드 이미지 분석 프레임워크에서의 오류 전파는 고려하지 못했다. 이 연구는 조직 슬라이드 이미지 분석 프레임워크의 각 단계 간에 오류가 전파될수 있는 경우를 고려하고, 이러한 오류의 완화 방법을 제안한다. 우리는 1단계와 2단계에서 데이터 중심오류와 모델 중심오류를 구분했다. 먼저, 데이터 중심 오류의 완화를 위해서, LossDiff라는 손실 기반 방법을 제안했다. 다음으로, 모델 중심 오류의 완화를 위해서, 그래프 오토인코더를 기반으로 WSI-GAD라는 방법을 제안했다. 우리는 몇가지 평가 방법을 통해서, 오류의 존재를 확인하고 제안된 방법이 분류 성능을 향상키킴을 보였다. 본 논문은 컴퓨터 기반 조직 슬라이드 이미지 분석에 중요한 기여를 기대한다. 본 연구의 결과는 모델 훈련에서 투입될수 있는 불확실성을 고려하고, 모델 중심 에러가 슬라이드 분류 결과에 어떤 영향을 주는지 이해할수 있도록 돕는다. 이는 연구자들이 정확한 모델을 개발할 뿐 아니라 일반화된 성능에 도달하도록 돕는다.