서지주요정보
회색조 영상의 획 검증을 통한 한글 비디오 문자 인식 = Stroke verification with gray level image for hangul video text recognition
서명 / 저자 회색조 영상의 획 검증을 통한 한글 비디오 문자 인식 = Stroke verification with gray level image for hangul video text recognition / 김진식.
발행사항 [대전 : 한국과학기술원, 2006].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8017468

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 06014

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Video text recognition is the key technology for multimedia database auto-indexing. Our research target is video text OCR which is the last step of video text recognition. To improve the accuracy of video text OCR, we studied and built OCR system from recent researches. After analyzing the OCR system, we found that most of the recognition errors are from confusing grapheme pair errors. And it's still hard to distinguish the confused grapheme with our own eyes because stroke information is missing on binarization step. The reason to use binarization is that so many samples are needed to train with gray-level image feature, because it usually contains lots of variation. So we proposed following stroke verification system. From recent recognizer technology we can get several recognition candidates for target character image. And if there is confusing grapheme pair on those candidates, the base stroke of the confusing stroke is detected using Hangul character information and edge characteristics on gray level image. After finding the base stroke, we define the measure that how possible the confusing stroke exists there by analyzing the edge histogram of the base stroke boundary area. And the stroke verification result is combined with original recognizer by converting each score into probability and multiplying them based on isotonic regression. we successfully improve the accuracy of Hangul video text recognizer with this method by using gray-level image information which was disappeared on binarization step.

비디오 문자 인식은 다양한 디지털 영상정보로부터 검색을 위한 키워드를 추출해낼 수 있는 중요한 기술이다. 다양한 해상도와 다양한 크기를 지닌 비디오 문자의 인식률을 높이기 위해서 기존 인식기의 오류를 분석한 결과 혼동획 쌍 오류가 많았다. 이는 전통적인 문자 인식 오류의 원인이기도 했지만, 원래의 회색조 영상을 이진 영상으로 바꾼 경우에 본래 지니고 있는 정보를 상실하거나 왜곡하기 때문이었다. 그러나 이진 영상보다 정보량이 많은 회색조 영상을 처리하기 위해서는 다량의 데이터가 필요한 등의 한계가 있었다. 따라서 본 논문에서는 다음과 같은 방법을 제안한다. 기존 인식기의 10순위 인식률이 99.8%에 달하는 만큼 기존 인식기의 인식후보를 기반으로 하여 어떤 특정획이 혼동되는지를 미리 가정한다. 그런 후 두가지 과정을 거쳐 해당 혼동획의 존재정도를 알아낸다. 1단계에서는 혼동되는 획의 중심획을 찾는다. 이는 중심획의 경계면에 강한 에지가 생성된다는 것과 우리가 가정하고 있는 해당 문자 중심획의 위치/길이 정보등에 기반해 에너지 함수를 정의하고, 적절한 방법으로 후보 중심획을 찾아 가장 에너지 함수가 낮은 획을 중심획으로 확정한다. 2단계에서는 찾아낸 중심획 경계면의 에지 히스토그램을 마할라노비스 거리에 기반해서 분석해 혼동획의 존재 정도를 계산한다. 이렇게 계산된 값은 기존 인식기의 인식점수와 같이 동조회귀방법을 사용해서 확률로 변환된 후 결합되어, 가장 확률이 높은 문자를 최종 결과로 선택하게 된다. 위와 같이 제안한 방법으로 이진화 단계에서 왜곡된 회색조 영상의 정보를 활용하여 효과적으로 혼동쌍 오류를 확인하여 전체적인 인식률을 높이는데 기여했음을 보였다.

서지기타정보

서지기타정보
청구기호 {MCS 06014
형태사항 vi, 51 p. : 삽화 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : Jin-Sik Kim
지도교수의 한글표기 : 김진형
지도교수의 영문표기 : Jin-Hyung Kim
학위논문 학위논문(석사) - 한국과학기술원 : 전산학전공,
서지주기 참고문헌 : p. 50-51
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서