서지주요정보
On-line cursive script recognition using HMM-based letter spotting technique = 은닉 마르코프 모델 기반의 문자 검출 기법을 이용한 온라인 필기 단어 인식
서명 / 저자 On-line cursive script recognition using HMM-based letter spotting technique = 은닉 마르코프 모델 기반의 문자 검출 기법을 이용한 온라인 필기 단어 인식 / Seung-Ho Lee.
저자명 Lee, Seung-Ho ; 이승호
발행사항 [대전 : 한국과학기술원, 1995].
Online Access 제한공개(로그인 후 원문보기 가능)원문

소장정보

등록번호

8005965

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 95019

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

등록번호

9001900

소장위치/청구기호

서울 학위논문 서가

DCS 95019 c. 2

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

In this thesis, a new framework is proposed for the problem of on-line cursive script recognition. In the proposed framework, the process of word recognition is guided by the psychological model of the human reading process proposed by Taylor and Taylor. It is initially chosen from a lexicon a smaller list of candidate words which have global features equivalent to the unknown input pattern. The reduced lexicon is utilized as linguistic constrains to lattice search. Next, all letter components within the unknown pattern are detected using a letter spotting technique utilizing hidden Markov models (HMM), which has been successfully applied in speech recognition and language modeling problems. A letter hypothesis lattice is generated as a result of letter spotting. Then an island-driven search technique is applied to find the optimal path on the letter hypothesis lattice. In case that lattice search fails to find a complete path covering the entire input data, an error-tolerant word matching procedure is followed to rank all candidate words in the reduced lexicon. The proposed framework can be easily incorporated with other recognition methods such as neural network models. For instance, in order to increase the discrimination power of letter models we may use neural network models in the place of HMMs. Thus, we can find on a letter hypothesis lattice the optimal path that maximizes a global criterion with respect to HMM-based latter segmentation and neural network model-based letter classification. This hybrid framework provides a nice recognition scheme of integrating the temporal structure of HMMs with the discrimination power of neural networks. It is shown by an experiment that the proposed framework is promising for recognizing English cursive words.

흘림체 필기 단어 인식은 패턴 인식 분야의 주요한 연구 과제중의 하나로서 60 년대 초 하몬 등에 의하여 첫 연구가 시작된 이래로 지난 30 여년간 수많은 연구가 진행되어 왔다. 하지만 필기 패턴의 다양성, 인식 대상 문자 집합 내에 존재하는 모호성, 그리고 단어를 구성하고 있는 문자간 경계의 불분명성 등으로 인하여 아직도 성공적인 인식 방법론이 개발되지 못하고 있는 실정이다. 한편, 인지 심리학 분야에서도 인간의 시각적 패턴 인식 과정에 관하여 많은 연구가 진행되어 왔다. 이 연구의 대부분은 인간의 인식 과정중에서 단편적인 부분만을 규명한 것이었으나, 테일러에 의하여 전체적 인지 과정에 대한 심리학적 모델이 처음으로 제안되었다. 테일러의 모델에 의하면 인간이 단어 패턴을 인식할 때 먼저 자기가 기억하고 있는 모든 단어들 중에서 그 입력 패턴과 전체적인 모양상으로 유사한 단어만을 모아 집합으로 만든 다음, 입력 패턴내에서 개개의 문자 요소를 검출해가는 과정을 통하여 입력 패턴과 가장 유사한 후보 단어를 찾아내는 방식으로 단어 인식을 수행한다고 한다. 기존의 필기 인식에 관한 연구에서는 실제로 인간이 어떻게 필기 패턴을 인식하는 가에 대한 고찰은 전혀 없이 단지 널리 알려진 계산 모형만을 가지고서 보다 높은 인식률을 얻고자 하는데 치중해 왔으나, 본 논문에서는 테일러의 심리학적 모델을 기반으로 한 필기 인식 방법론을 제안하였다. 필기 단어 인식의 첫째 단계는 전역적 특성에 의한 사전 축약 과정으로서 후보 단어집합 생성 단계에 해당한다. 둘째 단계는 입력 패턴 내에 포함되어 있는 구성 문자 요소를 추출해내는 과정이다. 본 논문에서는 순환적으로 상호연결된 은닉 마르코프 모델을 이용하여 필기 단어내의 모든 문자 요소를 검출하였다. 셋째 단계는 문자 추출 결과를 가지고서 사전 단어중에서 입력 패턴과 가장 유사한 후보 단어를 찾는 과정이다. 본 논문에서는 필기 단어 인식 과정에서의 정확성을 높이기 위하여 island-driven 탐색 기법을 사용하였다. 이 탐색 기법은 흘림체와 같이 단어내 구성 문자의 왜곡이 심한 경우에 적합한 탐색 방법으로서, 입력 패턴내의 일부 문자가 심하게 왜곡되어도 그 부분을 제외한 나머지 문자 부분들에 대한 탐색을 계속 진행할 수 있다는 장점을 가지고 있다. 본 논문에서 제안하고 있는 인식 방법론의 유용성을 평가하기 위하여 구현된 인식 시스템을 가지고서 단어 인식 실험을 수행한 결과, 훈련에 참가하지 않은 10 명의 필기자들이 쓴 1,800여 개의 단어 데이타에 대하여 평균 88.5%의 높은 단어 인식률을 얻었다.

서지기타정보

서지기타정보
청구기호 {DCS 95019
형태사항 v, 101 p. : 삽도 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 이승호
지도교수의 영문표기 : Jin-Hyung Kim
지도교수의 한글표기 : 김진형
학위논문 학위논문(박사) - 한국과학기술원 : 전산학과,
서지주기 Reference : p. 87-99
QR CODE qr code