Given the semantic segmentation problem of 3D medical body scan images, it is necessary to grasp not only the correlation between pixels in a 2D frame but also the sequential contexts between frames so that the pixel-labeling can be more accurately performed. In this thesis, we adopt Convolutional LSTMs to consider the sequential contexts and propose a U-Net-based architecture which includes them. We have studied how to maximize the effects of convolutional LSTMs while minimizing the number of trainable parameters. Compared to the basic U-Net and the previous studies that take into account the sequential contexts, our model achieves high dice scores when solving multi-organ segmentation tasks of SegTHOR dataset.
3차원 의료 영상의 의미론적 분할 문제가 주어졌을 때, 2차원 프레임 내 픽셀들간의 상관관계를 고려하는 것뿐만 아니라 프레임들간의 순차적 맥락까지 파악해야 보다 정확하게 분할할 수 있다. 이 논문에서는 순차적 맥락을 고려하기 위하여 컨볼루셔널 LSTM을 도입하였고, 이를 포함하는 U-Net 기반의 아키텍처를 제안한다. 이 과정에서 컨볼루셔널 LSTM의 효과를 극대화하면서도 모델의 파라미터를 최소화할 수 있는 방법에 대해 고찰하였다. 기본 U-Net 및 순차적 맥락을 고려하는 연구들과 견주어보았을 때, SegTHOR 데이터셋을 활용한 다중 장기 세그멘테이션 문제를 해결함에 있어 우리의 모델은 높은 다이스 스코어를 보여주었다.