3D online handwriting character recognition is recognition of characters written in the air. The information of 3D trace is given by 3D input device which has inertial sensors such as accelerators and gyroscopes. 3D input device with recognizer of characters written in 3D space will provide one of best interface between computer and human.
In this work, recognition system of online handwriting in 3D space is proposed. In order to recognize handwriting character in 3D space, we use Bayesian network based 2D handwriting character model. We found that the most different part between handwriting in 3D space and 2D handwriting is the shape of ligature. Therefore by adding ligature model of handwriting in 3D space to 2D handwriting character model, we can implement recognizer of handwriting in 3D space with little effort. We found that the shape of ligature does not depend on each character but much depends on incoming vector and outgoing vector of ligature. We constructed ligature model so that ligature shape should be estimated by incoming and outgoing vectors of ligature. Ligature extraction step for collecting ligature data is automated by using model matching with ignoring detail ligature shape, ligature training step is also automated in much part by adopting EM-like method. In order to recognize Hangul handwriting in 3D space, we adopted recognition by segmentation and developed external segmentator with Hidden Markov Model.
Experiments are performed with one-stroke handwriting digits and Hangul characters. The experimental result show 2D handwriting model with trained ligature model provides promising result for characters which have ligatures.
모바일 기기로 대표되는 차세대 PC시장에서는 소형이면서도 사용하기에 적합한 입력도구가 필수적이다. 3차원 필기입력장치는 3차원상의 궤적을 전달해주는 장치로, 필기를 하는데 있어서 공간상의 제약이 적고, 장치의 크기가 작아 차세대 PC의 입력도구로서 큰 주목을 받고 있다. 이러한 3차원 입력장치가 실용화되기 위해서는 공간 필기 문자 인식기술이 필수적이다.
본 논문에서는 공간상의 단일획 궤적을 입력으로 하여 사용자의 다양한 필기 패턴을 인식할 수 있는 방법론을 제안한다. 다양한 필기 패턴을 모두 훈련시키는 대신 잘 모델링된 기존의 베이지안 망 기반 2차원 필기 모델에, 기존 2차원 필기와 단일획 필기의 가장 큰 차이점이라고 할 수 있는 연결획 부분만을 모델링하여 추가함으로써, 이미 만들어진 모델을 제사용하고, 새로 모델링하는데 드는 비용을 줄일 수 있다. 연결획은 낱자마다 특이한 모양을 가지지 않고, 연결획의 이전획과 다음획의 위치와 모양에 의해 세부 모양이 결정되므로, 낱자에 상관없이 적은 수의 연결획 모델로서 다양한 연결획을 모델링할 수 있다. 연결획 모델링을 위한 훈련데이터는 3차원 필기로부터 모델 정합에 의해 자동으로 추출할 수 있으며, 연결획의 훈련에서도 파라메터 재추정 기법을 통해 사람이 수동으로 해야 하는 일을 최대한 줄일 수 있다. 한글 필기 인식을 위하여 단일획 필기 입력에 특화된 자소 분할기를 은닉마으코프 모델을 기반으로 구현한다. 모델의 구조는 본 논문에서 제안한 방식으로 구성된 베이지안 망 기반 단일획 필기모델의 획의 수에 대응하여 일괄적으로 결정되며, 자소분할기를 훈련하는 데에도 다량의 단일획 필기 데이터를 이용하지 않고, 베이지안 망 기반 단일획 필기모델로부터 샘플링을 통해 얻어 냄으로써, 단일획 필기 모델 내 연결획을 훈련할 수 있을 정도의 적은 양의 데이터로도 자소 분할기를 구현할 수 있도록 하였다.
실험결과, 숫자의 경우 93.27%의 인식률을 얻을 수 있었으며, 이는 단일획 필기의 연결획 모델이 없는 기존 2차원 획구분 필기 모텔과 비교하였을 때보다 24%이상의 오류가 감소된 결과이다. 특히, 연결획이 있는 글자인, ‘4’, ‘5’, ‘7’ 에 대하여 오류감소가 크게 일어났다. 한글 필기의 경우 인식률의 절대적인 값은 인시대상이 900자인 경우 약 79%로, 다소 낮은 인식률을 보였으나, 인식대상의 한정 및 언어모델의 도입을 통해 인식률을 개선할 수 있음을 알 수 있었다.