서지주요정보
주소 영상에서의 문맥 정보를 이용한 문자 인식 후보 재정렬 = Reordering of character recognition candidates using contextual information in address image
서명 / 저자 주소 영상에서의 문맥 정보를 이용한 문자 인식 후보 재정렬 = Reordering of character recognition candidates using contextual information in address image / 강자영.
발행사항 [대전 : 한국과학기술원, 2004].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8015247

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 04001

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

After recognition in segmented images was performed, all combination of these results are made as address candidates. If the recognition result in a segmented image have many candidates, recognition rates will increase. However, both time and space complexities for searching an optimal address result will also increase. Therefore, we should find a proper method to reduce recognition candidates with high recognition rates. One of these methods is to reorder character recognition candidates. Reordering of character recognition candidates is to change original ranks of recognition candidates with high accuracy. In this thesis, we propose a method of reordering character recognition candidates using character n-gram language model. The character n-gram language model can represent local contextual information of address as conditional probabilities. We also use dynamic programming techniques such as the forward rescoring and combination rescoring so that can make a global consideration without the dictionary of address. As a result, we can save time and space to search address candidates. We used 51,969 addresses for training n-gram language model and 105 addresses for testing a proposed method. Experiment showed that a proposed method has increasing effect of a correct candidate rank. The results of a proposed method was increased by 79.71% comparing with no rescoring 76.85%. In case of changing dynamic programming techniques or n-gram language model, the recognition rates is also changed. Therefore, we will have effective results as changing experiment environment such as the processing speed, result accuracy, and so on.

우편 영상 내 수신 부분 주소 인식을 위해서 기본 낱자 인식기의 저조한 1순위 인식률을 충분히 보완할 수 있는 방법이 필요하다. 따라서 주소열을 분할한 분할 요소별로 다수의 인식 후보를 가지는데, 인식 후보의 개수가 증가함에 따라 고려해야 하는 주소열 후보의 수가 기하 급수적으로 증가하는 문제점이 발생하게 된다. 이는 빠른 우편물 처리가 요구되는우편물 영상의 인식에서 바람직하지 못하다. 본 논문에서는 이를 해결하기 위한 방법으로, 문맥 정보를 이용한 인식 후보 재정렬 방법을 제안했다.주소는 제한된 어휘와 정형화된 구조를 가지기 때문에 이웃한 분할 요소들의 문맥 정보를 고려하면 주소열을 인식하는데 효과적으로 도움이 될 수 있다. 문맥 정보를 이용하기 위하여 낱자 n-gram 언어 모델을 사용하였는데, 이는 방대한 주소 정보를 모두 저장하고 있는 복잡한 주소 사전 방식 대신, 빈도수에 기반한 간단한 조건부 확률로 표현된다. 그러나 낱자 n-gram 모델만을 이용하여 인식 후보를 재정렬할 시, 지역적으로 빈도수가 많은 조합에 대해 인식 후보의 순위가 높아지는 문제점이 발생한다. 따라서 동적 프로그래밍 기법을 이용하여 문맥 정보를 전역적으로 확장해서 주소열 전체를 고려한 효과를 내도록 하였다. 실험을 통하여 제안한 방법이 효율적인 정답 순위 상승 효과가 있다는 것을 알았다. rescoring 방법 중에는 forward rescoring 방법이 인식률 향상이 높았으며, 언어 모델은 실행 속도 측면에서는 bigram 언어 모델이, 인식률 향상 측면에서는 trigram 언어 모델을 사용하는 것이 효과가 있었다. 이는 제안한 방법으로 실용적인 주소 인식 후처리를 실현할 수 있다는 것을 의미하며, 궁극적으로는 분할 요소별 인식 후보 갯수의 축소를 통하여 효과적으로 주소열 탐색 시간과 공간을 절약할 수 있다는 의의가 있다.

서지기타정보

서지기타정보
청구기호 {MCS 04001
형태사항 vii, 35 p. : 삽화 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : Ja-Young Kang
지도교수의 한글표기 : 김진형
지도교수의 영문표기 : Jin-Hyung Kim
학위논문 학위논문(석사) - 한국과학기술원 : 전산학전공,
서지주기 참고문헌 : p. 34-35
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서