In this thesis, we introduce a Hangul(Korean) recognition method for video text images. Hangul is composed of 2 or 3 graphemes and it has over 2000 target classes. So it is much harder to recognize Hangul than English. Furthermore, video Hangul images have low resolution quality, touching strokes and font variation.
To solve these problems, we first classify Hangul type from a given image based on Hangul structural layout. So type classier can handle structural similar groups. Based on Hangul type, its constituent grapheme with character image is recognized by multi-class support vector machine(SVM). And An angular directional feature vector is used for input of SVM. This recognition method works well for low resolution images, touching strokes and low frequent classes. But it has limits due to features extracted from character image.
In verification step, it re-recognizes segmented grapheme images for verifying the recognition result. Verifier can reduce errors of previous recognition step using font invariant characteristic of grapheme image compare to character image. For separating character image into grapheme images we use non-linear cutting path algorithm with Handul knowledge.
About 50,000 video text images captured in news program are used for the experiment. The recognition rate is 96.5% with the verification step. In the comparison with non-verification step, errors are decreased by 27.8%. From the result, we believe that the efficiency of video text recognition system would be better with the proposed method.
본 논문에서는 비디오 한글 영상을 인식하기 위한 방법을 제안하였다. 제안한 방법에서는 낱자영상에서 자소별 분할 없이 자소를 인식하여 조합하는 비분할 자소 인식 방법과 자소 영상으로 분할하여 인식하는 분할 자소 인식 방법을 통해 비디오 한글 영상을 인식하였다. 비분할 자소 인식 방법은 통계적인 방법을 통해 분할 없이 인식을 수행하므로 접촉이나 잡영으로 인해 생긴 글자의 변이를 흡수하는 장점이 있다. 이때 비분할 인식 결과 중 신뢰도가 낮은 인식 결과만을 검증하여 자소 분할에 따른 수행 시간을 절약하였다. 분할 자소 인식에 쓰일 자소 영상을 낱자 영상으로부터 구하기 위해 개선된 비선형 분할 기법을 적용하였다. 비분할 자소 인식과 분할 자소 인식기에 사용된 인식기는 다중 분류 서포트 벡터 머신을 이용하였고, 입력으로는 영상에서 추출한 방향각 특징 벡터를 이용하였다. 제안한 방법을 사용한 실험에서 96.5%의 인식률을 얻었고, 이는 낱자 특징 기반을 이용한 비분할 자소 인식만을 이용했을 때보다 27.8%정도 오류가 감소한 것이다. 이와 같은 방법을 통해서 기존 낱자 단위 인식이나 자소 단위 인식 방법을 비디오 영상에 그대로 적용했을 때 발생하는 오류를 감소할 수 있다. 또한 자소 분할을 통한 검증을 통해서 자소의 구조가 복잡한 낱자도 비교적 신뢰성 있게 인식 할 수 있다.