서지주요정보
자모 결합 유형을 이용한 제한된 어휘의 필기 한글 단어 인식 = Lexicon driven handwritten Hangul word recognition using grapheme combination type
서명 / 저자 자모 결합 유형을 이용한 제한된 어휘의 필기 한글 단어 인식 = Lexicon driven handwritten Hangul word recognition using grapheme combination type / 진유호.
발행사항 [대전 : 한국과학기술원, 1999].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8009843

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 99039

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

등록번호

9006028

소장위치/청구기호

서울 학위논문 서가

MCS 99039 c. 2

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Handwritten word recognition usually involves segmentation into classifiable units, and assembling classification results of the segmented unit to recognize words. This thesis proposes a method of a lexicon driven handwritten Hangul word recognition by spotting grapheme hypotheses and finding their best combination. Since the results of grapheme segmentation are obtained from the grapheme spotter, the proposed method doesn't require any explicit segmentation. The contextual knowledge of a lexicon also participates in the grapheme spotting process. The input image is recognized by matching with every word in the lexicon. One word is a handwritten-ordered sequence of graphemes and an image is represented as a set of strokes. The search of graphemes in a lexicon is done iteratively on the set of strokes. In every step of search, expectation window for the target grapheme is estimated from the current matching status and the lexicon. The grapheme search is performed only in the expectation window by the grapheme spotter, which gives a number of the target grapheme hypotheses as groups of strokes. Dynamic programming is used to find the best correspondence between the spotted grapheme hypotheses and the set of strokes every step of search. For efficiency, the lexicon is organized as a trie and the pruning technique for the grapheme hypotheses is used to reduce the search space. From the experiment, the recognition accuracy 98.54% is achieved for the lexicon size of 39 on 618 postal words captured at 300 dpi.

필기 문자 인식은 인식할 요소 분할 과정과 그 분할된 요소의 인식 결과를 결합하는 과정이 필요하다. 본 논문은 영상에서 자모를 탐색하여 최적의 연결을 찾음으로써 제한된 어휘의 필기 단어 인식 방법을 제한한다. 자모 단위의 탐색 결과를 이용하므로 독립적인 분할 과정이 필요없다. 또한 문맥 정보인 사전은 자모 탐색 과정에서 인식할 단어를 제한하는 역할을 한다. 단어 인식은 입력 영상과 사전내의 모든 단어를 비교함으로써 이루어진다. 단어는 필기 순서로 정렬된 자모열로 영상은 획의 조합으로 표현된다. 사전안의 자모만을 순차적으로 영상에서 탐색한다. 자모 탐색을 위하여 사전과 이전 정합 상태로부터 각 자모의 정합 기대 영역을 설정한다. 이렇게 설정된 정합 기대 영역 위에서만 탐색을 하며 그 결과 많은 자모 후보를 얻게 된다. 단어를 구성하는 자모의 후보를 동적 프로그래밍을 이용하여 최적의 연결을 찾아 가장 높은 점수값을 얻은 단어를 인식결과로 한다. 효율적인 탐색을 위하여 사전은 trie로 구조화 시켰고 탐색 공간을 줄이기 위하여 자모 후보를 제거하는 방법을 적용하였다. 실험 결과로써 300dpi로 획득한 618개의 주소 단어와 39개의 사℃鰥L} 대하여 98.54%의 인식율을 얻었다.

서지기타정보

서지기타정보
청구기호 {MCS 99039
형태사항 iii, 39 p. : 삽화 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : Yu-Ho Jin
지도교수의 한글표기 : 김진형
지도교수의 영문표기 : Jin-Hyung Kim
학위논문 학위논문(석사) - 한국과학기술원 : 전산학과,
서지주기 참고문헌 : p. 37-39
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서