We propose a novel approach for the weakly-supervised instance segmentation using only image-level labels.
We aim to properly reflect instance-level information without off-the-shelf proposal techniques that most of the existing works depend on.
First, we exploit CAMs to generate initial pseudo labels representing each instance as a center point and 2D offset vectors.
To generate more reliable labels from CAMs, we present two modules that control the discriminative region and produce dense and sparse CAMs, respectively.
Second, we propose a self-learning strategy named a \textit{cyclic self-guidance} that allows the network to produce refined pseudo labels and employ them for training in a self-supervised and cyclic learning manner.
Extensive experiments on PASCAL VOC 2012 show the effectiveness of our approach in instance segmentation only using image-level labels.
On the instance segmentation benchmark, our new attempt in this field achieves 41.5% $mAP_{50}$ surpassing existing works without off-the-shelf proposal techniques.
Also, we achieve a comparable performance of 67.1% mIoU on the semantic segmentation benchmark.
이 논문에서는 이미지 단위 레이블만 사용하여 약하게 지도되는 인스턴스 분할에 대한 새로운 접근 방식을 제안합니다.
기존 작업 대부분이 의존하는 제안 기법없이 인스턴스 수준의 정보를 적절히 반영하는 것을 목표로합니다.
먼저 CAM을 활용하여 각 인스턴스를 중심점 및 2D 오프셋 벡터로 나타내는 초기 학습 레이블을 생성합니다. CAM으로부터 보다 신뢰할 수있는 라벨을 생성하기 위해 특징 영역을 제어하여 각각 고밀도 및 희소 CAM을 생성하는 두 개의 모듈을 제시합니다.
둘째, 우리는 네트워크 스스로가 정제된 학습 레이블을 생성하고 이를 자체 지도 및 순환 학습 방식으로 훈련에 사용할 수 있도록하는 순환형 자체 지도 라는 학습 전략을 제안합니다.
PASCAL VOC 2012에 대한 광범위한 실험은 이미지 단위 레이블만 사용하는 인스턴스 세분화에서 우리의 접근 방식의 효과를 보여줍니다. 인스턴스 분할 벤치 마크에서이 분야의 우리의 방법은 제안 기술없이 기존 작업을 능가하는 41.5%의 $mAP_{50}$을 달성합니다.
또한 의미론적 분할 벤치 마크에서 67.1% mIoU의 합리적인 성능을 달성합니다.