This thesis considers the End-to-end Residual Instance Segmentation (ERIS) network for improving the mask prediction performance as well as the inference speed by addressing the challenges involved in integrating multi-stage detection into segmentation. Compared to existing multi-stage instance segmentation methods, the proposed ERIS differs in two aspects: (1) it enhances sample diversity and model capacity in the mask branch using a single deep mask subnetwork shared across the detection stages, and (2) it enhances information flow through the network using residual blocks for the mask (and possibly box) heads. Extensive experiments on the MSCOCO dataset show that the proposed ERIS achieves better segmentation performance compared to state-of-the-art methods while having faster inference speed. In particular, without bells and whistles, ERIS achieves respectively 1.3% and 0.5% mask AP gains over Cascade Mask R-CNN and Hybrid Task Cascade while being 10% faster.
이 논문은 다단계 검출을 세분화로 통합하는 것과 관련된 작업을 제시함으로써 추론 속도뿐만 아니라 마스크 예측 성능을 향상시키는 ERIS (End-to-End Residual Instance Segmentation) 네트워크를 제안합니다. 기존의 다단계 객체 분할 방법과 비교하여 제안 하는 ERIS는 (1) 객체 분할 단계에서 공유되는 단일 깊은 마스크 서브 네트워크를 사용하여 마스크 브랜치에서 샘플 다양성과 모델 용량을 향상시키고 (2) 마스크 (및 상자) 헤드에 레지듀얼 블록을 사용하여 네트워크가 그래디언트 정보를 효율적으로 사용할 수 있게 합니다. MSCOCO 데이터 셋에 대한 다양한 실험을 통해, 제안 된 ERIS는 더 빠른 추론 속도를 가지면서 최신 객체 분할 방법에 비해 더 나은 객체 분할 성능을 달성한다는 것을 보여줍니다. 특히, 별 다른 추가 기술 없이 ERIS는 캐스케이드 마스크 R-CNN 및 하이브리드 태스크 캐스케이드 (HTC)보다 각각 1.3 % 및 0.5 % 마스크 AP 향상을 10 % 더 빠르게 달성합니다.