서지주요정보
Handwritten chinese character recognition using statistical structure modeling and stroke weighting = 통계적 문자 구조 모델링과 획 가중치 지정을 이용한 필기 한자 인식
서명 / 저자 Handwritten chinese character recognition using statistical structure modeling and stroke weighting = 통계적 문자 구조 모델링과 획 가중치 지정을 이용한 필기 한자 인식 / In-Jung Kim.
저자명 Kim, In-Jung ; 김인중
발행사항 [대전 : 한국과학기술원, 2001].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8012378

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 01006

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

등록번호

9007665

소장위치/청구기호

서울 학위논문 서가

DCS 01006 c. 2

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Handwritten Chinese character recognition is difficult because of the following reasons. Firstly, there are many writing variations. Secondly, the character set is huge, and therefore, it contains many similar characters. Thirdly, many Chinese characters are very complex in shape. The degradation of the character image makes it worse. In order to overcome the above difficulties, this dissertation proposes a handwritten Chinese character recognition system that is distinguished from conventional systems in character structure modeling, preprocessing, and discriminating similar characters. The proposed character model represents the character structure with a statistical framework. Each stroke is modeled by a distribution of pixels, while the stroke relation is reflected by the statistical dependency among the strokes. Based on such a representation, it automatically selects important relations among all possible stroke relations. It is not only effective to tolerate writing variations but also concrete in formulation. Especially, it is outstanding in extracting and representing various kinds of stroke neighbor relations such as cross, T-junction, parallelism, etc. The preprocessor of the proposed system detects the degraded region and processes it differently from the clean region, in order to cope with the stroke touching and the image blurring. It extracts pseudo strokes from the degraded region, while it extracts normal strokes from the clean region. A pseudo stroke is a line segment that is not certain but likely to be a stroke. The matching algorithm tries to match the normal strokes as many as possible. In contrast, the pseudo stroke participates the matching only if it is profitable to the matching. In order to discriminate similar characters, the proposed system performs a pair-wise discrimination in postprocessing. If the recognition result belongs to one of pre-defined confusion pairs, the pair-wise discriminator verifies it against its competitor. The confusion pair consists of a pair of characters that are same in shape except a small number of discriminative strokes. The proposed pair-wise discriminator effectively discriminates the confusion pair by focusing on the discriminative strokes. It assigns a weight to each stroke according to the importance in discrimination. By assigning heavier weights to the discriminative strokes than the other strokes, the proposed system prevents the difference of the discriminative strokes from being buried by the writing variation. The stroke weights are decided by a training algorithm using a neural network. The effectiveness of the proposed methods was confirmed by the experiments. The proposed modeling method extracted and reflected the character structure successfully. The preprocessor successfully separated degraded regions and extracted pseudo strokes from them. The weight training algorithm of the pair-wise discriminator assigned heavy weights to the discriminative strokes, which was consistent to human intuition. The overall recognition rate was 99.46% for KAIST Hanja database, which shows the proposed methods are promising.

손으로 쓴 한자를 인식하는 것은 매우 어렵다. 그 이유는 다음과 같다. 첫째, 필기자에 따른 필기 변형이 심하다. 둘째, 문자의 수가 매우 많고 구분하기 어려운 유사한 문자들이 많다. 셋째, 형태가 복잡한 문자들이 많다. 특히, 획의 접촉이나 영상의 훼손에 의해 왜곡된 문자 영상을 인식하는 것은 매우 어려운 일이다. 본 논문에서는 이와 같은 어려움을 극복하기 위한 필기 한자 인식 방법을 제안한다. 제안하는 방법은 문자 구조 모델링, 전처리, 그리고 유사 문자의 구분 방법에 있어서 기존의 인식기보다 향상된 방법을 적용한다. 제안하는 문자 모델링 방법은 문자의 구조를 통계적으로 표현한다. 각 획은 화소들의 분포로 모델링 되고, 획들간의 관계는 그 분포간의 통계적 의존성에 의해 반영된다. 또한, 이 같은 표현 방법에 기반하여 획들간에 존재하는 모든 관계들 중에서 중요한 획간 이웃 관계를 자동으로 선택하는 방법을 제안한다. 제안하는 문자 모델링 방법은 필기 변형을 흡수하는데 효과적일 뿐 아니라, 이론적으로도 견고하다. 특히 획들의 교차, T-분기점, 평행 등 다양한 획간 관계를 찾아내고 표현하는데 있어서 탁월하다. 제안하는 전처리 과정에서는 문자 영상 중에서 왜곡된 영역을 찾아서 별도로 처리하므로 획의 접촉이나 영상의 훼손에 의해 왜곡된 문자 영상을 효과적으로 처리할 수 있다. 제안하는 방법은 깨끗한 영역으로부터는 획을 추출하는 반면, 왜곡된 영역으로부터는 가획(pseudo stroke)을 추출한다. 가획은 반드시 획이라고는 할 수 없지만 획일 가능성이 높은 선분으로써 왜곡된 영역의 외곽선 정보로부터 추출된다. 본 시스템의 매칭 단계에서는 깨끗한 영역에서 추출한 획들은 최대한 매칭되는 반면, 가획은 매칭에 유리한 경우만 선택적으로 매칭됨으로써 획 추출 과정에서의 오류가 전체 인식 과정에 악영향을 끼치는 것을 방지한다. 또한 제안하는 시스템은 유사한 문자를 구분하기 위해 후처리 단계에서 인식 결과를 재확인한다. 인식 결과가 미리 정의된 혼동 문자쌍에 해당할 경우 유사 문자쌍 구분기를 이용하여 그 상대 문자와 다시 한 번 비교함으로써 더 나은 인식 성능을 갖는다. 제안하는 유사 문자쌍 구분 방법은 두 문자의 차이점에 집중하여 구분하기 때문에 유사 문자를 매우 효과적으로 구분할 수 있다. 입력 문자와 모델의 매칭 스코어를 계산하기 위해 각 획간 매칭 스코어를 통합할 때 각 획에 가중치를 지정함으로써 그 획의 중요도를 반영한다. 두 문자를 구분해주는 구분획(discriminative stroke)에는 다른 획보다 큰 가중치를 지정함으로써 두 문자의 차이점에 중점을 두고 문자를 비교한다. 따라서 구분획들의 구조적 차이가 작더라도 필기 변형에 묻혀버리는 것을 방지한다. 이 때 각 획의 가중치는 신경망 훈련 알고리즘을 통해 훈련 데이터로부터 체계적으로 학습한다. 실험을 통해 제안하는 방법이 필기 한자 인식에 효과적임을 보였다. 제안하는 문자 모델링 방법은 문자의 구조를 효과적으로 추출, 반영하였다. 제안하는 전처리 방법은 문자 영상으로부터 왜곡된 영상을 효과적을 찾아내서 가획들을 추출함으로써 왜곡된 영역으로부터 펜의 궤적을 상당히 복구할 수 있었다. 제안하는 유사 문자쌍 구분 방법의 획 가중치 훈련 방법은 직관적으로 중요하다고 생각되는 획들에게 큰 가중치를 할당하였고, 실제 인식기에 적용시켰을 때 많은 성능 향상을 보였다. KAIST 한자 영상 데이터베이스에 대하여 실험한 결과 99.46%의 높은 인식율을 보여 제안하는 방법들이 매우 효과적임을 보였다.

서지기타정보

서지기타정보
청구기호 {DCS 01006
형태사항 vi, 101 p. : 삽도 ; 26 cm
언어 영어
일반주기 Includes appendix
저자명의 한글표기 : 김인중
지도교수의 영문표기 : Jin-Hyung Kim
지도교수의 한글표기 : 김진형
학위논문 학위논문(박사) - 한국과학기술원 : 전산학전공,
서지주기 Reference : p. 87-92
주제 Character Recognition
Statistical Character Structure Model
Pair-wise Discrimination
Stroke Importance
Preprocessing
문자 인식
통계적 문자 구조 모델
유사 문자쌍 구분
획 중요도
전처리
QR CODE qr code