일반화된 공분산모델에 근거한 영상데이타 감축에 관한 연구 = A study on image data compression based on a generalized covariance model
김남철.
[서울 : 한국과학기술원, 1984].
In this dissertation, a generalized exponential model for the covariance function of real images has been proposed, which is more realistic than the two conventional models, i.e. separable and isotropic models. It includes a separability factor between horizontal and vertical covariances, to accommodate the two extreme cases of separable and isotropic models. The validity of the model is investigated with respect to some coding performances, restoration filters, and statistical mismatch effects in image coding. First, various behaviours of the generalized covariance model in image processing have been investigated. It is shown that the coding performances based on the generalized covariance model agree quite well with the performances based on the real covariance function. Also, for homogeneous Gaussian images, their rate-distortion function and infinite order predictability have been discussed with the covariance function. Second, the performances of two restoration filters - Kak filter and scalar Wiener filter - appropriate to be combined with source encoders have been evaluated with the generalized covariance model, and compared to the well-known spectral Wiener filter and spatial averaging filter. It is found that the DCT Wiener filter performs much better than the spectral Wiener filter and other spatial domain filters. The 3rd order Kak filter is shown to be much better for low input SNR, but worse for high input SNR than the spatial averaging filter. Third, based on a generalized Gaussian probability density model and on the generalized covariance model, the mismatch effects of image data compression systems are investigated, where system parameters are mismatched to the statistics of signal. The mismatch effects are evaluated, and compared for a synthetic image and for a real image using mean square error and mismatch loss as performance criteria. The image data compression systems chosen for performance study are a 3rd order DPCM and a 2-dimensional 16×16 DCT coder. The mismatch effects are compared for the correlation and separability of covariance function, and for the variance and shape of the quantizer input distribution. These result in a more reliable way of setting the statistical parameters for a coder, e.g., higher correlation coefficients, greater variance, and sharper distribution for input statistics. Also, it is found to be more effective to adapt for the shape and variance of quantizer input signal rather than the correlation coefficients and separability of image data. For noisy image, the combinations of the Kak filter with a DPCM and the DCT Wiener filter with a DCT coder are shown to improve the performances of a DPCM or DCT coder significantly for low input SNR. Finally, based on a 3-dimensional exponential covariance model for image sequences, a 3-dimensional rate-distortion function has been obtained, and compared with some interframe transform and hybrid coding techniques. The computational problem of 3-dimensional complexity is reduced by the assumption that the covariance function is separable to the spatial and temporal covariances. It is shown that the interframe hybrid coding of moderate complexity is quite a good method for high bit rates.

본 논문에서는, 기존의 separable과 isotropic model보다 더 영상의 특성을 반영할 수 있는 generalized exponential의 covariance model이 제시되었다. 이 model에 근거하여, 영상 데이타 감축 시스템에서 시스템의 parameter들이 signal의 statistics에 mismatched 되었을 때 발생하는 현상들을 mean square error(MSE)를 척도로 하여 여러 각도에서 규명하였다. 또한 현재 연속적인 디지틀 영상의 효율적인 전송을 위하여 활발히 연구되고 있는 interframe image coding의 여러 방법들이 3-dimensional RDF와 함께 generalized covariance model에 근거하여 비교 검토되었다. 첫째로 영상의 실제 covariance function을 위한 generalized covariance model이 제시되었다. 이 model이 기존의 model들 보다 실제 covariance function과 잘 맞고 있음을 여러가지 관측을 통하여 밝혀 주었다. 또한 영상 데이타 감축 시스템에서 performance bound로써 사용될 수 있는 rate-distortion function과 infinite order predictability의 두 양이 generalized covariance model을 covariance function으로 갖는 homogeneous Gaussian 영상에 대해서 조사되었다. 앞의 여러가지 관측 결과에 의하면 기존의 separable model 및 isotropic model과 같이 실제 영상의 covariance function 에서 horizontal 및 vertical one-step correlation coefficient를 고려하는 것 외에도, 추가로 horizontal과 vertical 사이의 separarility까지 고려함으로써 실제 영상에서 일어나는 현상을 잘 설명할 수 있음이 알려졌다. 둘째로, 앞서 제시된 generalized covariance model에 근거하여 잡음이 섞인 영상에 대해서 효율적인 전송을 하기 위해서 DPCM 및 transform coder와 combined 하기에 적합한 Kak filter와 scalar Wiener filter의 성능과 특성이 기존의 spectral Wiener와 수행이 간편한 spatial averaging filter들과 비교 검토되었다. 그 결과 DPCM coder와 transform coder와 combined하기에 적합한 Kak filter 와 scalar Wiener filter는 대단히 우수한 성능을 가지며, 이들의 설계와 성능 분석에 generalized covariance model을 사용하면 매우 효과적임이 밝혀졌다. 셋째로, 영상 데이타 감축 시스템에서 signal의 statistics와 coder의 parameter들이 mismatch될 때의 성능 저하 현상이 generalized Gaussian pdf model과 여기서 제시된 generalized exponential covariance model의 두 통계적 model에 근거하여, mean square error (MSE)를 척도로 하는 mismatch loss로써 평가되고 실제 영상에 대해서 측정된 값들과 비교 규명하였다. 먼저 영상 데이타 감축 시스템에서 대표적인 3rd order DPCM과 16x16 DCT coder의 matched된 경우에 대해서 검토되었다. 다음으로 coder의 parameter들이 signal과 mismatch될 때의 성능 저하 현상이 correlation mismatch, separability mismatch, variance mismatch, 그리고 shape mismatch의 네가지 경우로 세분화되어 고찰되었다. 관측결과 coder에서 correlation coefficient는 실제보다 높게 추정하고, separability는 separable과 isotropic의 중간 정도로, variance는 실제보다 약간 크게, pdf의 shape는 실제보다 더 sharp한 형태로 추정하는 것이 robust 하다고 밝혀졌다. 또한 adaptive system에서 signal의 covariance보다는 quantizer 입력 pdf의 shape와 variance에 잘 따라가도록 하는 것이 좋은 것으로 나타났다. 끝으로 영상에 white Gaussian noise 가 섞였을 때의 성능 저하 현상을 규명하고, 3rd order Kak filter와 $16 \times 16$ DCT Wiener filter와 병용하여 각각 DPCM과 transform coding을 수행하면 시스템의 complexity가 그다지 증가하지 않으면서도 상당히 성능이 개선되는 것을 알 수 있었다. 넷째로, 연속적인 영상 sequences에 대해서 performance bound 로서 3-dimensional rate-distortion function을 제시된 generalized covariance model을 근거로 하여 계산하고, 이와 함께 몇가지 interframe transform 및 hybrid coder의 성능이 비교 검토되었다. 비교결과, 대단히 높은 complexity를 갖는 interframe transform coding 이 3-dimensional RDF에 약 4dB까지로 접근하는 것을 알 수 있었다. 또한 spatially 2-D DCT를 행하고 temporally DPCM을 행하는 interframe hybrid coding은 비교적 complexity가 낮으면서도 높은 bit rate에서는 interframe transform coder의 성능에 근접하는 것으로 나타났다.


{DEE 8405
형태사항 v, 150 p. : 삽화 ; 26 cm
언어 한국어
저자명의 영문표기 : Nam-Chul Kim
지도교수의 한글표기 : 김재균
지도교수의 영문표기 : Jae-Kyoon Kim
학위논문(박사) - 한국과학기술원 : 전기및전자공학과,
서지주기 참고문헌 : p. 142-150
주제 Analysis of covariance.
Image processing --Digital techniques.
Pulse-code modulation.
화상 압축. --과학기술용어시소러스
공분산. --과학기술용어시소러스
DPCM. --과학기술용어시소러스
상호 상관 함수. --과학기술용어시소러스
디지털 화상. --과학기술용어시소러스
Image compression.
Correlation (Statistics)





