서지주요정보
Learning to align multi-camera domains using part-aware clustering for unsupervised video person re-identification = 비지도 비디오 사람 재식별을 위한 부위 인식 군집화를 이용한 다중 카메라 도메인 정렬 방법
서명 / 저자 Learning to align multi-camera domains using part-aware clustering for unsupervised video person re-identification = 비지도 비디오 사람 재식별을 위한 부위 인식 군집화를 이용한 다중 카메라 도메인 정렬 방법 / Youngeun Kim.
발행사항 [대전 : 한국과학기술원, 2020].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8036040

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 20026

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

리뷰정보

초록정보

Most video person re-identification (re-ID) methods are mainly based on supervised learning, which requires cross-camera ID labeling. Since the cost of labeling increases dramatically as the number of cameras increases, it is difficult to apply the re-identification algorithm to a large camera network. In this paper, we address the scalability issue by presenting deep representation learning without ID information across multiple cameras. Technically, we train neural networks to generate both ID-discriminative and camera-invariant features. To achieve the ID discrimination ability of the embedding features, we maximize feature distances between different person IDs within a camera by using a metric learning approach. At the same time, considering each camera as a different domain, we apply adversarial learning across multiple camera domains for generating camera-invariant features. We also propose a part-aware adaptation module, which effectively performs multi-camera domain invariant feature learning in different spatial regions. We carry out comprehensive experiments on three public re-ID datasets (i.e., PRID-2011, iLIDS-VID, and MARS). Our method outperforms state-of-the-art methods by a large margin of about 20\% in terms of rank-1 accuracy on the large-scale MARS dataset.

대부분의 비디오 사람 재식별 방법들은 많은 레이블링 작업이 필요한 지도학습에 기반하고 있다. 카메라 수가 증가함에 따라 레이블링 비용이 급격히 증가하기 때문에, 지도학습 기반의 비디오 사람 재식별 방법들은 대형 카메라 네트워크에 적용하기 어렵다. 본 논문에서는, 별도의 사람 신원에 대한 지도없이 특징 맵 학습을 할 수 있는 방법을 제안하여 대형 카메라 네트워크로의 확장성 문제를 해결한다. 기술적으로, 심층 신경망을 학습시켜 신원을 구별할 수 있고, 각 카메라 도메인에 강인한 특징을 만들어낸다. 신원을 잘 구별할 수 있는 심층 신경망을 학습하기 위하여, 본 논문에서는 각각의 카메라 안에서 서로 다른 신원의 특징 사이의 거리를 최대화한다. 동시에 각 카메라를 서로 다른 도메인으로 고려하여 도메인 적대 학습을 통하여 카메라 도메인에 강인한 특징을 생성한다. 또한 사람의 신체 부위 마다 확률 분포가 다르다는 것을 이용하여 서로 다른 공간 영역마다 도메인 적대 학습을 진행하는 방법을 제안하였다. 실험을 통해서 제안하는 방법이 여러 데이터에 대해서 비지도 비디오 사람 재식별 방법에 대해서 좋은 성능을 달성할 수 있음을 보였다.

서지기타정보

서지기타정보
청구기호 {MEE 20026
형태사항 v, 50 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김영은
지도교수의 영문표기 : Changick Kim
지도교수의 한글표기 : 김창익
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 42-47
QR CODE qr code