서지주요정보
(A) real-time text detection network via convolution decomposition in natural scene images = 컨볼루션 분해를 통한 자연영상에서의 실시간 문자 검출 네트워크
서명 / 저자 (A) real-time text detection network via convolution decomposition in natural scene images = 컨볼루션 분해를 통한 자연영상에서의 실시간 문자 검출 네트워크 / Jinsu Kim.
발행사항 [대전 : 한국과학기술원, 2018].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8034516

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 18159

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Text detection has received considerable attention because of its high usability. Recently proposed methods exhibit powerful detection performance using deep networks, requiring a complex computation process that is becoming an obstacle to commercializing the technology. The proposed method aims to localize text in real-time while maintaining competitive detection performance. To this end, we decompose a typical $M \times M$ convolution kernel into smaller kernels. We introduce a depthwise cross convolution method for convolution decomposition. By doing this, the proposed method can process 40 images per second. It is three times as fast as the previous fastest deep-network-based method. The proposed method not only localizes text, but also predicts text line orientation. This allows the proposed method to increase utilization because text is not always horizontally aligned.

영상에서의 문자 검출은 높은 활용성으로 인해 많은 관심을 받고 있다. 최근에 제안된 방법들은 딥 네트워크를 사용하여 높은 성능을 달성하였고 복잡한 계산량을 필요로 한다. 이러한 복잡한 계산량은 해당 기술이 상업화 하는데 장애물이 되고 있다. 본 논문에서는 딥 네트워크를 이용하여 경쟁력 있는 성능을 보여주면서, 실시간 처리가 가능한 방법을 목표로 하고 있다. 이를 실현하기 위해 일반적인 $M \times M$ 컨볼루션 커널을 분해 하여 계산 복잡도를 줄였다. 컨볼루션을 분해하기 위하여 깊이마다 분해된 교차 컨볼루션을 제안하였다. 이로 인하여 본 논문에서 제안하는 방법은 초당 40장의 이미지를 처리할수 있다. 이는 기존에 제안된 가장 빠른 방법보다 3배 빠른 방법이다. 또한 제안하는 방법의 활용성을 높이기 위하여 문자 위치를 검출하는 것 뿐만 아니라 문자의 각도 또한 예측할 수 있도록 하였다. 문자가 영상내에서 항상 수평 방향으로 정렬되어 있는 것이 아니기 때문에 문자의 각도를 예측하는 것은 제안 하는 방법의 활용도를 높여준다.

서지기타정보

서지기타정보
청구기호 {MEE 18159
형태사항 iii, 35 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김진수
지도교수의 영문표기 : Changick Kim
지도교수의 한글표기 : 김창익
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 31-33
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서