서지주요정보
A study of psychovisual image processing : image compression and content-based image processing = 시각 특성을 고려한 영상 처리에 관한 연구
서명 / 저자 A study of psychovisual image processing : image compression and content-based image processing = 시각 특성을 고려한 영상 처리에 관한 연구 : 영상 압축 및 내용 기반 영상 검색 / Kwang-Suh Jung.
발행사항 [대전 : 한국정보통신대학교, 2001].
Online Access 원문보기 원문인쇄

소장정보

등록번호

DM0000145

소장위치/청구기호

학술문화관(문화관) 보존서고

ICU/MS01-41 2001

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

There is now strong evidence for the presence of radial and angular sensitivity in the cells of the human visual cortex. Several psychophysical and physiological investigations have shown that response of visual of cortex is turned to a channel (band-limited portion) of the frequency domain and a large variety of human visual system models have been presented in literature. The representation proposed here has for main objective to respect this human like filter bank. Filter banks are defined in discrete Fourier domain. In order to improve the performances, many image coding schemes have been developed by including some of the psychovisual features. Following this line of direction, the purpose of this paper is to determine the efficiency of an image coding scheme which is entirely based on the psychophysical aspects. we purpose to describe a new image transform specifically designed for an efficient coding while preserving a psychovisual Fourier domain description. Also, proposed image coding scheme, based on HVS, can make us index and retrieve images effectively. An original signal is decomposed into basic signals, which include psychovisual features and subband coding, by using matching pursuit algorithm. The matching pursuit is a signals decomposition algorithm that decomposes input signal into a linear expansion of basic signals. Basic signals are selected from a redundancy dictionary of functions. Since basic signals in the dictionary are chosen greedily in order to match the signal, the signal can be decomposed into a few number of basic signals thereby providing compression of the signal. In this paper, we use 2-D matching pursuit algorithm. We show that proposed image coder is both well-suited for psychovisual quantization and channel adapted coding. Consequently, the whole algorithm is performed in the spatial domain. Finally, The results, obtained with a coding scheme which includes these basic features of the visual system, show that at low pSNR(peak Signal to Noise Rations) the visual quality of the reconstructed image reminds much better than for the "classical" schemes. Another particularity of this approach lies in the structure of the reconstruction image error. Indeed the latter is found to be highly correlated to the structure of the original image. The texture as an image content is a fundamental descriptor to represent an image. Among many texture feature description methods, a psychovisual filter such as a Gabor filter with octave frequency channels is popular and has been reported as a good texture descriptor. We use a texture featuring technique based on human visual system (HVS)[2][3] In this paper, psychovisual filtering is performed in polar frequency space, where sufficient sampled data is available in lower frequency regions. However, the filtering in Cartesian space has insufficient sampled data in those regions. Lower frequency regions are believed to be important for global texture extraction. To extract texture feature, we calculate energies in filter banks in frequency space. Then, the classification is performed to find texture indexing in the image database. To verify the usefulness of the proposed descriptor for contents featuring of texture, computer simulations and experiments with MPEG-7 standard image database were performed. We have implemented a novel MPEG-7 based multimedia indexing and retrieval system as application of MPEG-7 texture descriptors. As a specific application, we develop The Businesscard Retrieval System Using the MPEG-7 Standard Meta Data.

인간의 시각 특성은 방향성을 갖는다고 알려져 있다. 실제로 몇몇 정신물리학(뇌의 기능을 규명하는 학문)적 심리학적 실험들은 외부 자극에 대한 뇌의 시각관련 피질(Visual Cortex)의 반응이 몇개의 제한된 공간 주파수 대역(채널)에만 국한된다고 보고하고 있다. 즉, 외부 물체는 몇 개의 공간 주파수 채널로 분해(decomposition)되어 뇌에서 인식된다. 수 많은 실험을 통해 이제까지 알려진 가장 적절한 공간 주파수 분할은 각방향과 방사방향을 기본축으로 하고 공간 주파수 영역을 각방향으로 5~6개로 분할, 방사방향으로는 4~5개의 옥타브 밴드로 나누는 방법이다. 이러한 인간의 시각 특성을 고려한 압축 방법을 개발함으로써 압축 효율 및 화질 향상을 꾀하려는 코딩 알고리즘들이 개발되어 왔다. 이런 코딩 추세에 따라. 본 논문에서는 전적으로 인간의 시각 특성에 기반한 효율적인 코딩 기법을 소개하고 효율성을 결정할 것이다. 제안된 영상 압축 방법은 우선, 정합 추적 알고리즘에 의해 시각 특성을 가진 기본 신호들로 분해한다. 여기서 정합 추적 알고리즘은 단순히 주어진 신호를 과잉의 기본신호들을 가진 사전(기본 신호들의 집합)에서 정합이 가장 잘 되는 기본 신호들을 반복적으로 선택하여 결국, 입력신호를 기본 신호들의 선형 합으로 분해해내는 알고리즘으로 본 논문에서는 2차원 신호에 대하여 정합 추적 알고리즘을 사용하였다. 이렇게, 정합 추적 알고리즘에 의해 주어진 신호를 시각 특성을 가진 기본 신호들의 선형합으로 분해하기 때문에 인간의 시각 특성, 즉, 저주파 변화에 민간하고 고주파 변화에 둔감함 특성을 그대로 유지할 수 있으며, 정학 추적 알고리즘 자체가 가지는 의미, 즉, 주어진 영상 신호에 대해 가장 적합한 기본 신호를 뽑아내는 과정이라는 점에서 주어진 영상만이 가지는 고유한 특성을 특징지울수 있고 영상 색인과 검색에도 직접적인 응용이 가능하다, 제안한 시각 특성을 고려한 영상 신호의정합 추적 알고리즘이 시각 특성을 고려한 영상 압축 방법과 채널 코딩에 적합함을 보이기 위해, 고전적인 영상 압축 방법과의 pSNR 비교와 낮은 pSNR 에서 영상의 품질 비교를 수행하였다. 한편, 영상의 내용으로서의 질감(Texture)은 영상을 표현하기 위한 기본적인 기술자이다. 수 많은 질감 기술자중에 옥타브 주파수 대역에 가보 필터와 같은 시각 특성을 가진 필터를 씌우는 것이 가장 보편적이고 가장 좋은 질감 기술자라고 알려져 있다. 본 논문에서 시각 특성을 기반한 질감 기술자 구현을 위해 저주파 영역에 충분한 샘플링 된 데이터가 있는 극좌표 주파수 공간에 시각 특성을 고려한 필터링을 수행하였다. 질감 특징을 추출하기 위하여 주파수 대역의 필터 뱅크에서 각각 에너지, 에너지의편차를 계산하였다. 내용기반 질감 기술자로서의 유용성을 보이기 위해, MPEG-7 표준 영상 데이터들을 대상으로 컴퓨터 시뮬레이션을 수행하였다. 우리는 질감 기술자의 응용으로 멀티미디어 데이터 색인 및 검색 시스템을 구현하였고, 구체적인 응용 예로 MPEG-7 표준 메타데이타를 이용한 명함 검색 시스템을 개발하였다.

서지기타정보

서지기타정보
청구기호 {ICU/MS01-41 2001
형태사항 xi, 82 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 정광서
지도교수의 영문표기 : Yong-Man Ro
지도교수의 한글표기 : 노용만
학위논문 학위논문(석사) - 한국정보통신대학원대학교 : 공학부,
서지주기 References : p. 77-79
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서