Framework studies on the application of deep active learning to pathology for field optimization = 현업 최적화를 위한 심층 능동 학습의 병리학 적용 프레임워크 연구
발행사항 [대전 : 한국과학기술원, 2024].
Cancer is one of the world's leading causes of death. Pathologists manually review biopsy slides to diagnose cancer. In order to reduce the workload of pathologists, Deep learning based diagnostic assistance system is used. However, convolutional neural network-based models require a large number of training data. Deep active learning is a method to effectively train deep learning classification models through active learning, with the goal of allowing deep learning models train with only a small amount of data to achieve high performance. However, there is a problem when active learning is performed in the field, the effect may decrease. Therefore, this study conducted two studies to perform active learning more effectively in the field. In the first study, we identify the difference between the dataset used in prior studies and the dataset in the field, and propose a method to mitigate the effect reduction caused by the difference. The pathology field dataset can include noise data during the manufacturing process. Therefore, in order to effectively perform deep active learning on noisy dataset, we propose a method to compute thresholds using predictive loss values and select informative data in intervals where less noise data is distributed. As a result, proposed method reduced the probability of noise data being selected, and achieved better classification accuracy of trained model. A second study proposes a deep active learning framework that can infuse expert knowledge about informative data. This study actually identifies that there is a difference between expert selection and model selection for informative data to model training. And we train a selection model that learns expert selection records to reflects expertise of pathologist. As a result, we can develop a framework that includes the corresponding selection model to perform effective deep active learning in the field. Overall these studies contribute to supporting field pathologists and improving the effectiveness of their work, by providing practical and effective deep active learning in the field.

암은 전세계 주요 사망 원인 중 하나이다. 병리학자는 수동으로 생검 슬라이드를 검토하여 암을 진단한다. 병리학자의 업무 강도 감소를 위해서, 심층 학습 기반의 진단 보조 시스템이 활용된다. 하지만 컨볼루션 뉴럴 네트워크 기반 모델은 많은 수의 학습 데이터를 필요로 한다. 심층 능동 학습은 능동 학습을 통해, 심층 학습 분류 모델을 효과적으로 학습시키는 방법으로, 모델이 유익한 데이터를 선택하여 적은 데이터만으로 학습시킨 심층 학습 모델이 높은 성능을 획득하게 하는 것이 목적이다. 하지만, 현업에서 능동 학습을 수행하면, 효과가 감소 할 수 있다는 문제가 있다. 따라서, 본 연구는 현업에서 능동 학습이 더 효과적으로 수행하기 위한 두가지 연구를 수행하였다. 첫 번째 연구에서는 기존 연구에서 사용한 데이터 집합과 현업 데이터 집합의 차이를 파악하고, 차이로 인해 발생하는 효과 감소를 완화하는 방법을 제안했다. 조직병리 현업 데이터는 제작 과정에서 노이즈 데이터가 발생 할 수 있다. 따라서, 노이즈 데이터를 포함하는 데이터 집합에서 심층 능동 학습을 효과적으로 수행하기 위해서, 예측 손실 값을 활용하여 임계값을 연산하고, 노이즈 데이터가 적게 분포하는 구간에서 유익한 데이터를 선택하는 방법을 제안했다. 그 결과 제안된 방법을 통해 데이터를 선택하면, 노이즈 데이터가 선택 되는 확률이 감소 했으며, 더 좋은 분류 정확도를 달성했다. 두 번째 연구에서는 유익한 데이터에 대한 전문가 지식이 반영 가능한 심층 능동 학습 프레임워크를 제안한다. 본 연구는 모델 학습에 유익한 데이터에 대한 전문가 선택과 모델의 선택이 차이가 있음을 실제로 확인했다. 그리고 전문가 선택 기록을 학습하는 모델을 생성하여, 전문가 지식이 반영된 유익한 데이터 선택 모델을 구현하고자 한다. 우리는 해당 선택 모델을 포함하는 프레임워크를 생성하여, 현업에서 효과적인 심층 능동 학습을 수행하고자 한다. 본 연구는 현업에서 실제로 활용 가능하며 효과적인 심층 능동 학습을 제안하여, 현장 전문가인 병리학자의 업무 강도 개선을 도울 것으로 기대한다


청구기호 {DDS 24001
형태사항 v, 105 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김무진
지도교수의 영문표기 : Mun Yong Yi
지도교수의 한글표기 : 이문용
Including appendix
학위논문 학위논문(박사) - 한국과학기술원 : 데이터사이언스대학원,
서지주기 References : p. 100-104
주제 Pathology image classification
Deep learning
Deep active learning
Clinical decision supporting system
조직 병리학 이미지 분류
딥 러닝
심층 능동 학습
의료 진단 지원





