서지주요정보
Text-guided few-shot multi-organ segmentation for chest X-ray images using vision-language pre-training = 비전-언어 사전 훈련을 이용한 흉부 X선 영상의 텍스트 기반 퓨-샷 다기관 분할
서명 / 저자 Text-guided few-shot multi-organ segmentation for chest X-ray images using vision-language pre-training = 비전-언어 사전 훈련을 이용한 흉부 X선 영상의 텍스트 기반 퓨-샷 다기관 분할 / Hyokyoung Bae.
발행사항 [대전 : 한국과학기술원, 2023].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8040599

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MBIS 23009

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Recently, many deep learning-based segmentation algorithms have been developed for Chest X-ray (CXR) images. Unfortunately, existing methods have limitations in that one can get segmentation results for the designated organs only when sufficient number of training data are available. In addition, the size of the required training dataset grows rapidly with multi-organ segmentation. To address this, here we present a novel segmentation method based on Vision Language Pre-training (VLP). Thanks to the semantic alignment of images and texts in VLP, our method can generate reliable segmentation results even with extremely scarce label data set, enabling few-shot and even a single-shot segmentation, which is not possible with existing approaches. Furthermore, our method can generate flexible segmentation results for various organs mentioned in the input sentence. Experimental results confirmed that our method significantly outperforms the existing methods when the number of training data is scarce. Furthermore, even with sufficient number of training dataset, the proposed method provides comparable segmentation results to the existing methods, using various kind of input sentences including sentences with multi-organ, overlapping organs, practical expression, and misspelled word.

최근 딥러닝에 기반한 흉부 X선(CXR) 영상에서의 장기 분할 알고리즘이 많이 개발되고 있다. 하지만, 기존의 방법은 대부분 충분한 수의 훈련 데이터가 있어야 지정된 장기에 대한 분할 결과를 얻을 수 있다는 한계가 있다. 또한, 필요한 훈련 데이터 세트의 크기는 개별 장기 분할보다는 다중 장기 분할을 목표로 할 때 더욱 증가한다. 이를 해결하기 위해, 우리는 비전-언어 사전 훈련(VLP)을 기반으로 하는 새로운 다중 장기 분할 방법을 제시한다. 비전-언어 사전 훈련에서 이뤄지는 이미지와 텍스트의 의미론적 정렬 덕분에, 우리의 방법은 극히 적은 훈련 데이터 세트로도 신뢰할 수 있는 분할 결과를 생성할 수 있으며, 기존 접근 방식으로는 불가능한 퓨-샷 및 싱글-샷 분할을 가능하게 한다. 또한, 우리의 방법은 입력 문장에 언급된 다양한 장기에 대한 보다 유연한 분할 결과를 생성할 수 있다. 실험 결과를 통해 훈련 데이터의 수가 부족할 때 우리의 방법이 기존 방법을 크게 능가한다는 것을 확인했다. 또한, 제안된 방법은 충분한 수의 훈련 데이터 세트를 사용하더라도 기존 방법과 유사한 분할 결과를 보여주며, 다중 장기, 중복된 장기, 실용적 표현, 그리고 철자가 틀린 단어를 포함한 다양한 종류의 입력 문장에 따라 장기를 분할하는 것을 보였다.

서지기타정보

서지기타정보
청구기호 {MBIS 23009
형태사항 iv, 29 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 배효경
지도교수의 영문표기 : Jong Chul Ye
지도교수의 한글표기 : 예종철
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 바이오및뇌공학과,
서지주기 References : p. 25-27
주제 Multi-organ segmentation
Vision-language pre-training
Chest X-ray
Few-shot Learning
다중 장기 분할
비전-언어 사전 훈련
흉부 X선
퓨-샷 학습
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서