Handwritten word recognition usually involves segmentation into classifiable units, and assembling classification results of the segmented unit to recognize words. This thesis proposes a method of a lexicon driven handwritten Hangul word recognition by spotting grapheme hypotheses and finding their best combination. Since the results of grapheme segmentation are obtained from the grapheme spotter, the proposed method doesn't require any explicit segmentation. The contextual knowledge of a lexicon also participates in the grapheme spotting process.
The input image is recognized by matching with every word in the lexicon. One word is a handwritten-ordered sequence of graphemes and an image is represented as a set of strokes. The search of graphemes in a lexicon is done iteratively on the set of strokes. In every step of search, expectation window for the target grapheme is estimated from the current matching status and the lexicon. The grapheme search is performed only in the expectation window by the grapheme spotter, which gives a number of the target grapheme hypotheses as groups of strokes. Dynamic programming is used to find the best correspondence between the spotted grapheme hypotheses and the set of strokes every step of search. For efficiency, the lexicon is organized as a trie and the pruning technique for the grapheme hypotheses is used to reduce the search space.
From the experiment, the recognition accuracy 98.54% is achieved for the lexicon size of 39 on 618 postal words captured at 300 dpi.
필기 문자 인식은 인식할 요소 분할 과정과 그 분할된 요소의 인식 결과를 결합하는 과정이 필요하다. 본 논문은 영상에서 자모를 탐색하여 최적의 연결을 찾음으로써 제한된 어휘의 필기 단어 인식 방법을 제한한다. 자모 단위의 탐색 결과를 이용하므로 독립적인 분할 과정이 필요없다. 또한 문맥 정보인 사전은 자모 탐색 과정에서 인식할 단어를 제한하는 역할을 한다. 단어 인식은 입력 영상과 사전내의 모든 단어를 비교함으로써 이루어진다. 단어는 필기 순서로 정렬된 자모열로 영상은 획의 조합으로 표현된다. 사전안의 자모만을 순차적으로 영상에서 탐색한다. 자모 탐색을 위하여 사전과 이전 정합 상태로부터 각 자모의 정합 기대 영역을 설정한다. 이렇게 설정된 정합 기대 영역 위에서만 탐색을 하며 그 결과 많은 자모 후보를 얻게 된다. 단어를 구성하는 자모의 후보를 동적 프로그래밍을 이용하여 최적의 연결을 찾아 가장 높은 점수값을 얻은 단어를 인식결과로 한다. 효율적인 탐색을 위하여 사전은 trie로 구조화 시켰고 탐색 공간을 줄이기 위하여 자모 후보를 제거하는 방법을 적용하였다. 실험 결과로써 300dpi로 획득한 618개의 주소 단어와 39개의 사℃鰥L} 대하여 98.54%의 인식율을 얻었다.