In this thesis, a fast and robust infrared remote target detection network is proposed based on deep learning. Furthermore, we construct our own IR image database imitating humans in remote maritime rescue situations using the FLIR M232 IR camera. First, data augmentation is performed by applying domain adaptation from the game data to the real data. By conducting target-background separated domain adaptation, the shapes and locations of the objects maintain and only adapt the data distribution, leading to a proper algorithm for the small objects. Second, multi-scale feature extraction is performed combined with fixed weighted kernels and convolutional neural network layers. By utilizing fixed-weight kernels, background, and noise which are uniform in general are removed and enhance the gradient at the direction of the center of the objects, increasing signal-to-noise ratio. Lastly, the feature map is mapped into a likelihood map indicating the potential locations of the targets. Experimental result reveals that the proposed method can detect remote targets even under complex backgrounds which existing algorithms fail to detect. Moreover, the network trained on augmented data with game shows higher performance than that with only real data.
본 논문에서는 딥러닝을 기반으로 빠르고 강건한 적외선 원거리 표적 탐지 네트워크를 제안한다. 또한 M232 IR 카메라(FLIR사)를 사용하여 원격 해상 구조 상황에서 인간을 모방한 자체 IR 이미지 데이터셋을 구축하였다. 첫째, 구축된 데이터셋에 게임-현실 도메인 변환 기반 기법을 적용하여 데이터를 증강하였다. 객체-배경 분리 방식의 도메인 변환 기법을 바탕으로 객체의 모양과 위치는 유지시키고 데이터 분포만 변환되기에 소형 객체의 탐지에 적합한 알고리즘을 설계하였다. 둘째, 다중 스케일 특징 추출은 고정 가중 커널 및 컨볼루션 신경망 계층과 결합하여 수행된다. 가중치가 고정된 커널을 이용하여 균일한 배경 및 잡음을 제거하고 객체 중심 방향으로 생기는 경사 흐름을 강화하여 이미지의 신호 대 잡음비를 증가시켰다. 마지막으로, 형상 맵은 대상의 잠재적 위치를 나타내는 확률 맵에 매핑된다. 실험 결과에 따르면 제안된 방법은 기존 딥러닝 기반 분할 알고리즘으로 탐지하지 못하는 복잡한 환경에서도 원거리의 대상을 탐지할 수 있다. 또한, 게임 데이터로 데이터를 증강하여 훈련시킨 네트워크가 그렇지 않은 네트워크에 비해 성능이 더욱 향상되었다.