서지주요정보
Visual comfort assessment for stereoscopic 3D contents by using binocular fusion deep network. = 양안 융합 심층 네트워크를 이용한 스테레오스코픽 3D 영상 불편감 측정
서명 / 저자 Visual comfort assessment for stereoscopic 3D contents by using binocular fusion deep network. = 양안 융합 심층 네트워크를 이용한 스테레오스코픽 3D 영상 불편감 측정 / Hyun Wook Jeong.
저자명 Jeong, Hyun Wook ; 정현욱
발행사항 [대전 : 한국과학기술원, 2017].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8031415

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 17140

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Stereoscopic three-dimensional (S3D) contents have received a significant interest from industries and research fields because they could provide enhanced viewing experiences. However, with the increasing interest of the S3D contents, the concerns are emerging for the safety of stereoscopic imaging. To address the issues of viewing safety in S3D contents, it is essential to develop a reliable objective visual comfort assessment (VCA), aiming to predict the visual discomfort of the displayed S3D contents. In this thesis, we propose a novel VCA method for S3D contents by using deep convolutional neural network (DCNN). To effectively predict visual discomfort in S3D contents viewing, the proposed network mainly consists of two parts; 1) spatial feature encoding part on monocular image: multi-level spatial features are encoded from each view (monocular image) to consider various type of spatial characteristics. 2) binocular feature encoding part: multi-level spatial features from left- and right views (binocular images) are combined to encode S3D discomfort factors. During training the proposed network, disparity information is used through knowledge transfer and regularization method to encode binocular features in S3D VCA, since disparity is main factor leading the S3D discomfort factors. By the extensive and comparative experiments using IEEE-SA dataset, the results show that the proposed binocular fusion deep networks yield excellent prediction performance.

스테레오스코픽 영상은 입체적인 시각 정보를 제공하여, 다양한 산업 및 연구분야에서 수요가 급증하고 있다. 그러나 최근 스테레오스코픽 영상 시청 시 발생하는 불편감 증상으로 인해, 시청 안전성에 관한 문제가 제기되었다. 스테레오스코픽 영상의 시청 안전성 문제를 다루기 위해선 스테레오 영상의 불편감을 자동으로 측정할 수 있는 기술 개발이 필요하다. 본 학위논문에서는, 심층 컨벌루션 신경망을 이용하여 스테레오스코픽 영상의 불편감을 자동으로 측정할 수 있는 새로운 방법을 제안한다. 스테레오스코픽 영상에서 불편감을 정확하게 측정하기 위해 제안하는 네트워크는 크게 두 부분으로 구성된다; 1) 단안 영상에서 공간정보를 추출하는 부분: 단안 영상의 다양한 공간 정보를 반영하기 위해 여러 단계의 공간 특징이 인코딩 된다. 2) 양안 특징을 추출하는 부분: 좌우 영상으로부터 각각 추출된 여러 단계의 공간 특징이 결합되어 스테레오스코픽 영상의 불편감 요소로 인코딩된다. 디스패리티는 스테레오스코픽 영상에서 불편감을 유발하는 주요 요소이기 때문에 제안하는 네트워크를 학습시키는 동안, 디스패리티 정보를 전이학습과 정규화 과정에 이용한다. IEEE-SA 데이터를 이용하여 광범위한 실험을 진행하였고, 그 결과 제안하는 방법이 우수한 성능을 보였다.

서지기타정보

서지기타정보
청구기호 {MEE 17140
형태사항 iii, 23 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 정현욱
지도교수의 영문표기 : Yong Man Ro
지도교수의 한글표기 : 노용만
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References: p. 18-20
주제 visual comfort assessment (VCA)
stereoscopic image
disparity
convolutional neural network (CNN)
deep learning
fusion network
영상 불편감 측정
스테레오스코픽 영상
디스패리티
컨벌루션 신경망
심층 학습
융합네트워크
QR CODE qr code