서지주요정보
Framework for integrating statistical and structural methods for on-line handwriting recognition = 온라인 문자 인식을 위한 통계적 방법과 구조적 방법의 결합
서명 / 저자 Framework for integrating statistical and structural methods for on-line handwriting recognition = 온라인 문자 인식을 위한 통계적 방법과 구조적 방법의 결합 / Jae-Ook Kwon.
발행사항 [대전 : 한국과학기술원, 1996].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8006938

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 96020

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

등록번호

9002941

소장위치/청구기호

서울 학위논문 서가

DCS 96020 c. 2

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In this thesis, we propose a hybrid recognition method, and show its usefulness in recognizing on-line cursive Hangul (the Korean writing system) characters. Although many successful handwriting recognizers using statistical method or structural method have been proposed, they could not overcome the limitation of single method. Since the advantage of one method appears to be the disadvantage of the other, many researchers have tried to make a hybrid model. The goal of this thesis is to design an effective framework combining the statistical method and the structural method that incorporates the advantages of the individual strengths of both. A stochastic attributed network is constructed to combine the statistical method and the structural method. The architecture consists of three layers of recognition scheme. The network in the baseline layer has a finite number of nodes and arcs representing the rules of character composition from graphemes. Each arc of baseline layer expands into a set of statistical models, in particular hidden Markov models in the statistical layer, and each node makes use of structural knowledge sources in the structural layer. The statistical recognizer produces intermediate recognition results including the label and the boundaries of grapheme. The intermediate results are passed to structural layer through baseline layer, then the structural recognizer analyze them. Shape analyzer representing global shape of grapheme, position analyzer representing relative position in a character, and pairwise discriminator representing discriminative features of confusing pair are used in the structural layer. Consequently, recognition of handwritings in the proposed method corresponds to finding the most probable path through the stochastic attributed network. Viterbi algorithm has been used, however, first-order Markov assumption and observation independence assumption applied to reduce complexity seem to create some errors due to missing global correlation. In order to complement the problems, the Markov assumption is complemented in order to incorporate the global information represented in the structural layer. The results from two layers are combined in a probabilistic framework by complementing the Markov assumption of hidden Markov modeling. In the experiments with three kinds of test sets amount to 17,500, 3,500, and 17,400 characters, respectively, an implementation of the model achieved 94.77% correct recognition at the top choice for all test data. As compared to that of statistical recognizer based on hidden Markov model, hybrid recognizer achieved 47.96% error reduction. Moreover, in recognition time, the proposed model spent 0.483 second to recognize one character in average, while the statistical recognizer spent 0.596 second. Surprisingly enough, we obtained 18.96% of time reduction with the additional structural analysis.

본 논문에서는 온라인 필기 문자를 인식하기 위한 혼합 인식 방법 (hybrid recognition method) 을 제안하고, 제안한 방법이 필기 한글을 효율적으로 인식할 수 있다는 것을 실험을 통하여 입증하였다. 비록 통계적인 방법이나 구조적인 방법을 사용한 기존의 연구가 높은 성능을 나타내기도 하였지만, 단일 방법을 사용한 인식에는 방법론 자체의 단점으로 인한 한계가 존재한다. 특히, 두 방법 사이에는 서로의 장점이 다른 방법의 단점이 되는 관계가 성립하기 때문에, 두 방법의 결합에 대한 연구가 활발하게 시도되어 왔다. 본 논문의 목적은 통계적 방법과 구조적 방법이 갖는 고유한 장점을 포함할 수 있는 효율적인 결합 방법을 설계하는 것이다. 본 논문에서는 세개의 계층으로 구성된 확률 속성 네트워크 (stochastic attributed network)를 이용하여, 두 방법을 효율적으로 결합하였다. 확률 속성 네트워크의 기본 층은 자소로부터 문자를 조합하는 규칙을 나타내는 유한 상태 네트워크 (finite state network, FSN) 이다. 기본 층의 각 아크 (arc) 는 통계적 모형의 집합, 즉 은닉 마르코프 모형 (hidden Markov model, HMM)의 집합으로 확장되어 통계 층을 형성하며, 각 노드 (node) 는 구조적 지식을 표현하는 구조층으로 확장된다. 통계 층의 인식기는 자소의 명칭과 현재 자소와 대응하는 입력 부분에 관한 정보를 포함하는 중간 인식 결과를 생성한다. 이 중간 결과는 기본층을 통하여 구조 층으로 전달되고, 구조 층의 인식기가 이를 분석한다. 자소의 전역적인 형태를 표현하는 형태 분석기와 문자 내에서 자소의 위치를 표현하는 위치 분석기, 그리고 매우 유사한 문자 쌍을 구분하는 특징을 표현하는 쌍구분기가 구조 층에 사용되었다. 이러한 모델에서 필기 문자를 인식하려면, 확률 속성 네트워크를 탐색하여 가장 확률이 높은 경로를 찾아야 한다. 그러나, 현재까지의 최적 경로 탐색 문제에 주로 사용되는 Viterbi 알고리즘은 복잡도를 줄이기 위하여 1차 마코프 가정과 관측 심벌 간의 독립 가정을 사용하는데, 이러한 가정을 사용하면 문자 전체의 연관성에 관한 정보를 탐색 시에 반영할 수 없다. 이러한 문제점을 보완하기 위하여, 구조 층의 인식기에 표현되어 있는 전역적인 정보를 포함할 수 있도록 1차 마코프 가정을 완화하였다. 1차 마코프 가정을 완화함으로써 통계적인 정보와 구조적인 정보를 확률적인 방법으로 결합할 수 있다. 각각 17,500 문자, 3,500 문자, 그리고 17,400 문자로 구성된 세가지 데이타를 사용하여 실험한 결과, 본 논문에서 제안한 방법을 구현한 인식기는 94.77%의 문자를 정확하게 인식하였는데, 이는 HMM을 사용한 통계적 인식기와 비교하여 오인식의 47.96%를 제거한 것이다. 특히, 인식에 소요되는 시간에 있어서, 제안한 모형은 문자 당 평균 0.483 초를 소요하여, 평균 0.596 초를 소요하는 통계적 인식기보다 빠른 인식 속도를 나타내었다. 즉, 구조적인 정보를 사용함으로써 정확도를 높이는 동시에 인식에 소요되는 시간도 오히려 18.96% 감소시킬 수 있었다.

서지기타정보

서지기타정보
청구기호 {DCS 96020
형태사항 vi, 107 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 권재욱
지도교수의 영문표기 : Jin-Hyung Kim
지도교수의 한글표기 : 김진형
학위논문 학위논문(박사) - 한국과학기술원 : 전산학과,
서지주기 Reference : p. 91-102
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서