서지주요정보
(A) study on segmentation-guided masked autoencoder learning for optical flow estimation = 광학 흐름 예측을 위한 영상 분할 유도 기반 마스크 오토인코더 학습 연구
서명 / 저자 (A) study on segmentation-guided masked autoencoder learning for optical flow estimation = 광학 흐름 예측을 위한 영상 분할 유도 기반 마스크 오토인코더 학습 연구 / Taewoo Suh.
발행사항 [대전 : 한국과학기술원, 2024].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8042236

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MEE 24124

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Masked autoencoding (MAE) can be valuable for state-of-the-art optical flow estimation models. FlowFormer++ introduced Masked Cost Volume Autoencoding (MCVA) to pretrain its transformer-based cost-volume encoder, along with a block-sharing masking strategy to prevent information leakage between highly correlated cost maps of neighboring source pixels. In this thesis, we propose a segment-sharing masking strategy to further suppress masked information leakage and promote the learning of relations between cost maps of source pixels at different semantic regions. We show that our pretraining task accelerates optical flow training and enables more accurate recovery of motion boundaries. We also show that the proposed segment-sharing MCVA is more difficult than the original block-sharing MCVA, and that it indeed facilitates the propagation of information between cost maps of source pixels in different semantic regions.

마스크 오토인코딩 사전훈련은 고정밀 광학 흐름 추정 모델의 훈련에 큰 도움이 될 수 있다. FlowFormer++는 코스트 볼륨에 대한 마스크 오토인코딩 기법을 도입하여 트랜스포머 기반의 인코더 부분의 사전 훈련을 수행했고, 이 과정에서 상관관계가 높은 인접한 픽셀들의 코스트 맵 사이에서 정보 누수를 방지하기 위해 블록 공유식 마스크 생성법을 제안하였다. 본 연구에서는 분할 영역 공유식 마스크 생성법을 제안하여 정보 누수를 더욱 감소시키고 서로 다른 시맨틱 영역에 위치한 픽셀들의 코스트 맵 사이에서의 상관관계를 학습하도록 한다. 제안한 사전 훈련 방법이 광학 흐름 추정 학습을 가속화시키고 모션 불연속면의 더 정확한 복원을 가능케 하였음을 보인다. 또한 제안한 분할 영역 공유식 마스크 생성법이 기존의 블록 공유식 마스크 생성법보다 더 어려운 사전 훈련 문제이며, 실제로 서로 다른 시맨틱 영역에 위치한 픽셀들의 코스트 맵 사이에서의 정보 전파의 학습이 유도되는 경향성을 확인한다.

서지기타정보

서지기타정보
청구기호 {MEE 24124
형태사항 vi, 45 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 서태우
지도교수의 영문표기 : Munchurl Kim
지도교수의 한글표기 : 김문철
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 41-43
주제 Optical flow estimation
Masked autoencoding
Self-supervision
Segmentation
Transformer
광학 흐름 추정
마스크 오토인코더
자기지도학습
영상 분할
트랜스포머
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서