Slot-mixup with subsampling: a simple regularization for WSI classification = 서브샘플링에 기반한 슬롯-믹스업: 전체 슬라이드 이미지 분류를 위한 간단한 정규화
Slot-mixup with subsampling: a simple regularization for WSI classification = 서브샘플링에 기반한 슬롯-믹스업: 전체 슬라이드 이미지 분류를 위한 간단한 정규화 / Seongho Keum.
발행사항 [대전 : 한국과학기술원, 2024].
MAI 24012

Whole slide image (WSI) classification requires repetitive zoom-in and out for pathologists, as only small portions of the slide may be relevant to detecting cancer. Due to the lack of patch-level labels, multiple instance learning (MIL) is a common practice for training a WSI classifier. One of the challenges in MIL for WSIs is the weak supervision coming only from the slide-level labels, often resulting in severe overfitting. In response, researchers have considered adopting patch-level augmentation or applying mixup augmentation, but their applicability remains unverified. Our approach augments the training dataset by sampling a subset of patches in the WSI without significantly altering the underlying semantics of the original slides. Additionally, we introduce an efficient model (Slot-MIL) that organizes patches into a fixed number of slots, the abstract representation of patches, using an attention mechanism. We empirically demonstrate that the subsampling augmentation helps to make more informative slots by restricting the over-concentration of attention and to improve interpretability. Finally, we illustrate that combining our attention-based aggregation model with subsampling and mixup, which has shown limited compatibility in existing MIL methods, can enhance both generalization and calibration. Our proposed methods achieve the state-of-the-art performance across various benchmark datasets including class imbalance and distribution shifts.

슬라이드의 작은 부분이 암의 존재 여부를 결정하기에, 전체 슬라이드 이미지 분류는 병리학자에게 반복적인 확대와 축소를 요구로한다. 패치 레이블이 존재하지 않고 슬라이드 레이블만 존재하기에, 다중 인스턴스 학습은 전체 슬라이드 이미지 분류기를 학습하는데 주로 쓰인다. 이런 특수한 문제 환경상, 과적합은 전체 슬라이드 이미지 분류의 주요한 난제이다. 이를 해결하기 위해 기존의 연구들은 패치에 변형을 주거나 슬라이드별로 동일한 갯수의 패치를 골라 믹스업을 적용하려고 했으나, 이 시도들의 타당성과 실효성은 불분명하다. 우리의 접근법은 전체 슬라이드 이미지 패치의 일부분만 사용함으로써(서브샘플링) 원본 슬라이드의 내재된 의미를 크게 변형시키지 않으면서도 새로운 유사 슬라이드 만들어낸다. 또한 우리는 전체 슬라이드 이미지를 어텐션 방법론을 이용해 고정된 갯수의 슬롯으로 요약한다. 우리는 서브샘플링이 어텐션 스코어의 초과 분포를 억제함으로서 더 의미있는 슬롯을 만들어낸다는 것을 실험적으로 보인다. 또한 패치를 고정된 갯수로 요약하는 우리의 슬롯모델에 서브샘플링과 믹스업을 동시에 적용하면, 일반화와 교정 성능이 모두 향상된다는 것을 밝혀낸다. 우리의 방법론은 클래스 불균형과 분포 변화가 있는 3가지의 데이터셋에서 모두 세계 최고의 성능을 보여준다.


형태사항 ii, 21 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 금성호
지도교수의 영문표기 : Juho Lee
지도교수의 한글표기 : 이주호
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 김재철AI대학원,
서지주기 References : p. 17-19
주제 Multiple instance learning
Attention mechanism
Weakly-supervised learning
다중 인스턴스 학습
어텐션 방법론
조직 병리학
약한 지도학습





