서지주요정보
Temporal flow mask attention neural network for open-set long-tailed image recognition of wild animals in camera-trap = 카메라 트랩 영상에서 야생 동물의 개방형 긴꼬리 데이터 인식을 위한 시간 흐름 마스크 어텐션 딥러닝 네트워크
서명 / 저자 Temporal flow mask attention neural network for open-set long-tailed image recognition of wild animals in camera-trap = 카메라 트랩 영상에서 야생 동물의 개방형 긴꼬리 데이터 인식을 위한 시간 흐름 마스크 어텐션 딥러닝 네트워크 / Jeongsoo Kim.
발행사항 [대전 : 한국과학기술원, 2022].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8039884

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MEE 22153

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Camera traps, unmanned observation devices, and deep learning-based image recognition systems have greatly reduced human effort in collecting and analyzing wildlife images. However, data collected via above apparatus exhibits 1) long-tailed and 2) open-ended distribution problems. To tackle the open-set long-tailed recognition problem, we propose the Temporal Flow Mask Attention Network that comprises three key building blocks: 1) an optical flow module, 2) an attention residual module, and 3) a meta-embedding classifier. We extract temporal features of sequential frames using the optical flow module and learn informative representation using attention residual blocks. Moreover, we show that applying the meta-embedding technique boosts the performance of the method in open-set longtailed recognition. We apply this method on a Korean Demilitarized Zone (DMZ) dataset. We conduct extensive experiments, and quantitative and qualitative analyses to prove that our method effectively tackles the open-set long-tailed recognition problem while being robust to unknown classes.

무인 관찰 장치인 트랩 카메라, 그리고 딥러닝 기반 이미지 인식 시스템은 야생 동물 이미지를 수집하고 분석하는 인간의 노력을 크게 줄였다. 그러나, 위의 장치를 통해 수집된 데이터는 1) 긴꼬리(Long-tailed) 및 2) 개방형(Open-ended) 분포로 인한 문제점을 갖고 있다. 데이터 불균형과 미지의 데이터로 인해 발생하는 개방형 긴 꼬리 인식 문제를 해결하기 위해 1) 광학 흐름(Optical Flow) 모듈, 2) 주의(Attention) 잔차 모듈 및 3) 메타 임베딩 분류기의 세 가지 핵심 블록으로 구성된 Temporal Flow Mask Attention Network를 제안한다. 논문에서 제안하는 네트워크는 광학 흐름 모듈을 활용하여 순차 프레임으로부터 시간적 특징을 추출하고 주의 잔차 블록을 사용하여 유익한 표현을 학습한다. 또한, 메타 임베딩 기법을 적용할 때 개방형 긴 꼬리 인식에서 성능이 더욱 향상됨을 보인다. 본 논문은 이 기법을 한국의 비무장 지대(DMZ) 데이터 세트에 적용한다. 실험을 통해 정량적 및 정성적 분석을 수행함으로써 제안한 딥러닝 네트워크가 미지의 클래스에 대해 강건하면서 개방형 긴 꼬리 인식 문제를 효과적으로 해결할 수 있음을 보인다.

서지기타정보

서지기타정보
청구기호 {MEE 22153
형태사항 iii, 28 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김정수
지도교수의 영문표기 : Changick Kim
지도교수의 한글표기 : 김창익
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 22-26
주제 Open-Set Long-tailed Recognition
Temporal Flow Mask Attention
DMZ Dataset
Image Classification
Camera Trap
개방형 긴 꼬리 인식
시간 흐름 마스크 어텐션
DMZ 데이터 세트
영상 분류
트랩 카메라
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서