Visual object tracking algorithm is an important problem for many applications like surveillance system, robot vision system, and augmented reality system. Particularly, in the object tracking algorithm, it is important that the algorithm is robust to occlusions, motion blurring, and object deformation. The trackers using CNN is robust to object deformations, but it is weak to occlusion and motion blurring. However, trackers using LSTM is robust to occlusion and motion blurring, but relatively weak to object deformations. In this work, we developed an multimodal object tracking algorithm that can track an object stably by using CNN and Deep LSTM, which can learn more complex features than single LSTM. We used OTB-30 dataset to evaluate our tracker, and verified that our tracker has the highest performance than the other trackers.
물체 추적 알고리즘은 감시 시스템, 로봇 비전 시스템, 증강 현실 시스템 등의 어플리케이션에서 쓰이는 중요한 알고리즘이다. 특히 물체 추적 알고리즘에서는 물체 가림, 흐릿함, 물체의 변형 등에 강인한 특성이 중요하다. CNN을 이용한 추적기의 경우 물체의 변형에 강인한 반면에 물체의 가림이나 흐릿함에 약한 특성이 있다. 반면에, LSTM을 이용한 추적기의 경우 물체의 가림이나 흐릿함에 강인하지만 물체의 변형에는 상대적으로 약한 특성이 있다. 이번 연구에서는 single LSTM보다 더 다양한 특징을 학습할 수 있는 Deep LSTM과 CNN의 멀티모달 모델을 이용하여 다양한 환경에서도 목표 물체를 놓치지 않는 추적 알고리즘을 개발하였다. 우리는 우리의 추적기의 성능을 검증하기 위하여 OTB-30 Dataset을 사용하였으며 다른 추적기들보다 더 높은 성능을 보이는 것을 확인하였다.