This thesis paper addresses the problem of reconstructing a high resolution image from multiple low resolution text images. In general purpose image reconstruction area, Total Variation (TV) based regularization model is novel edge preserving and noise removing method for reconstructing high resolution image. Unfortunately, the total variation function was not efficient when it is applied for text image because of problems caused by specific properties of text images. Exposing those problems we proposed to solve them by using region complexity and stroke direction reflecting penalty function.
We proposed an anisotropic total variation (ATV) function which reflects region complexity and stroke direction by involving position and direction dependent parameters to the total variation. And we presented a method to calculate those parameters directly from structure tensor field of initial image. Also we developed value reusing technique for faster implementation, which approximates calculation in homogeneous region to save computational cost during optimization.
Experiments were performed with grayscale and color low resolution text images. Our method performed better with low computational cost than general purpose total variation in sense of minimizing Root Mean Square (RMS) error.
고해상화는 여러 장의 저해상도 영상들의 정보를 결합하여 고해상도 영상을 얻어내는 기법이다. 고해상화는 단일해가 존재하지 않는 ill-posed 문제임으로 정규화 방법을 도입하여 문제를 풀고 있다. 총변이 정규화 방법은 일반 영상의 고해상화를 위한 모델이다. 이 모델은 일반 영상에서 지금까지 우수한 성능을 보여 주고 있으며 연구가 제일 많이 이루어지고 있다. 그러나 총변이 모델은 일반 영상을 대상으로 개발된 모델이기 때문에 텍스트 영상의 특징들을 고려하지 않는다.
이 논문에서는 총변이 정규화 방법에 기반을 둔 텍스트 영상에 적합한 이방성 총변이 방법을 제안한다. 제안된 방법은 초기 영상의 structure tensor 정보를 통하여 지역적 특징들을 추출하고 픽셀마다 지역적 특징에 맞는 이방성 총변이 모델을 적용한다. 정규화 방법의 최종 결과는 반복 최적화 기법을 통하여 얻어진다. 제안된 방법은 반복 최적화 계산 중에 변하지 않는 픽셀들을 미리 예측하여 계산에서 제외함으로써 속도를 향상 시켰다.
실험을 흑백 및 컬러 텍스트 영상들을 대상으로 수행했다. 제안한 모델은 텍스트 영상에 의해서 기존의 총변이 모델보다 향상된 결과를 보여주었다. 평가는 RMS (Root Mean Square) 오차에 의해서 이루어졌다. 제안한 방법의 속도향상을 계산 비용과 RMS 오차를 비교해서 확인하였다. 오차 증가 없이 계산 비용을 $\frac{1}{3}$까지 줄일 수 있었다. 실제 시간상으로도 일반 텍스트 영상에서 평균적으로 2배 빠른 속도를 보였다. 제안한 방법이 텍스트 영상에 대해 적합하고 빠르다는 결론을 얻을 수 있었다.