서지주요정보
Two-phase stroke extraction by bottom-up and top-down processing = Bottom-up 방식과 top-down 방식을 결합한 2단계 획추출기법
서명 / 저자 Two-phase stroke extraction by bottom-up and top-down processing = Bottom-up 방식과 top-down 방식을 결합한 2단계 획추출기법 / Duc Minh Quan Do.
저자명 Do, Duc Minh Quan
발행사항 [대전 : 한국과학기술원, 2005].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8016718

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 05048

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Stroke is one of the most important features in oriental languages processing and recognition. The structure of a character in oriental languages can be characterized by orientation and the order of strokes. Therefore, extracting strokes from input images is one of the first and important steps for any structural character recognition system. There are several re-searches on stroke extraction, but all of them provide only one output. The output may contain incorrect strokes or miss some strokes when there are noises or blurred areas in the input images. In this work, a two-phase stroke extraction method is proposed. In the first phase, the proposed method utilizes the information of the boundary, the direction of each boundary point to extract clear strokes. This phase is designed to be general enough to be applied in any oriental languages. In the second phase, we propose a mechanism to add some knowledge on the structure of the character set to double check strokes extracted from the first phase and to extract some missing strokes due to blurring. These noisy strokes or missing strokes are quite ambiguous, however, it is nearly impossible to eliminate all noisy strokes and extract all missing strokes for all cases. With the help from top-down knowledge, we produce several alternatives which are most likely to be the correct results. Moreover, we also define a way to give score for each alternative. This will help much as we can use language model to find out the most correct result later. Experiments are performed with Hangul video text images. These images are captured from video. Therefore, they are low-resolution and have so many noises as well as blurred areas. The experimental results show the advances of our proposed two-phase extraction method in the sense of producing several possible results for low quality images.

획은 동양 언어의 처리나 인식에서 가장 중요한 특징 중의 하나이다. 동양 언어의 글자의 구조는 획의 순서와 방향에 의해 결정된다. 따라서, 입력 영상에서 획을 추출하는 것은 많은 구조적 문자 인식 시스템에서 가장 기초적인 중요한 단계 중 하나이다. 획 추출 방법에 대해서 그간 많은 연구가 있었지만, 모두 한 가지의 결과만을 내는 방식이었다. 입력 영상에 잡음 등으로 인해 흐려진 부분이 있다면 획추출 결과는 정확하지 않을 수 있다. 이 논문에서는 2단계 획 추출 기법을 제안한다. 제안한 첫번째 단계에서는, 영상의 경계선의 방향을 이용하여 명확한 획을 추출했다. 이 단계는 동양 언어에 일반적으로 적용될 수 있도록 설계되었다. 두번째 단계에서는 첫번째 단계에서 추출된 획들을 재확인하기 위해 문자 구조의 특성을 이용하고, 흐려짐에 따른 불확실한 획들을 추출한다. 그러나 잡음으로 인한 획이나 없어진 획들은 불명확하기 때문에, 모든 경우에 대해 완벽한 획을 추출하는 것은 사실상 불가능하다. 그러므로 top-down 방식을 이용하여 정확한 결과라고 생각되어지는 여러 대안들을 생성하고 각각의 결과에 대해 점수를 매기는 방법을 고안하였다. 이를 통하여 후에 가장 정확한 결과를 얻을 수 있도록 언어모델을 사용할 수 있다. 실험은 비디오 영상에서 추출한 한글 영상들을 대상으로 수행했다. 비디오 영상에서 추출되었기 때문에 글자 영상들은 저해상도이고, 많은 잡음과 흐려진 부분들을 포함한다. 실험을 통해 제안된 2단계 획 추출기법이 질이 낮은 글자 영상들에 대해서도 적합하다는 결론을 얻을 수 있었다.

서지기타정보

서지기타정보
청구기호 {MCS 05048
형태사항 vi, 33 p. : 삽도 ; 26 cm
언어 영어
일반주기 지도교수의 영문표기 : Jin-Hyung Kim
지도교수의 한글표기 : 김진형
학위논문 학위논문(석사) - 한국과학기술원 : 전산학전공,
서지주기 Includes reference
주제 Stroke extraction
boundary-based stroke extraction
cross-section
character recognition
pattern recognition
획추출기법
경계기반 획추출기법
횡단면
문자인식
패턴인식
QR CODE qr code