서지주요정보
Algorithms of lane detection and prediction using deep learning with modified convolution architecture = 변형된 콘볼루션구조를 갖는 딥러닝기반 차선 검출 및 예측 알고리즘
서명 / 저자 Algorithms of lane detection and prediction using deep learning with modified convolution architecture = 변형된 콘볼루션구조를 갖는 딥러닝기반 차선 검출 및 예측 알고리즘 / Pranjay Shyam.
저자명 Shyam, Pranjay ; 시암 프란 제이
발행사항 [대전 : 한국과학기술원, 2018].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8032838

소장위치/청구기호

학술문화관(도서관)2층 패컬티라운지(학위논문)

MME 18093

SMS전송 소장위치

도서상태

이용가능

대출가능

반납예정일

초록정보

Image Understanding is becoming a vital feature in ever more applications ranging from early stage cancer detection to autonomous vehicles. Applications in the domain of autonomous vehicles demand for embedded solutions that integrate into existing systems with tight real time and power constraints. Convolutional Neural Networks currently achieve state of the art results on all the image understanding benchmarks, however the computational complexity and memory overhead restrict their usage and thus embedded CNN’s are focused upon which are small yet efficient systems. This master thesis explores the architectural changes that can be made in a feed forward convolutional neural network in order to make it small yet powerful and its potential on being deployed on embedded platforms such as Nvidia Jetson TX2. The network architecture is designed for detecting the current lane of the vehicle and predict the possible paths where the vehicle can maneuver. The proposed architecture is a highly efficient CNN topology having a Top 5 accuracy of 92.59\% on the ImageNet 1000 dataset using 2.016 Million parameters at a computational complexity of 285 million multiply accumulate operations. The proposed topology is highly regular and consists of exclusively convolutional layers, scaling layers, batch normalization, Leaky ReLU nonlinearity and a global pooling layer. The proposed network is developed using CAFFE library and deployed on the Jetson TX2 using the Nvidia TensorRT application that is an optimizer focusing on performance tuning.

이미지 이해(Image Understanding)는 질병의 진단부터 차량의 자율주행을 위한 판단 등에 이르기 까지 점점 많은 분야에서 필수적인 기능으로 자리잡고 있다. 그 중 컨볼류젼 뉴럴 네트워크(Convolution Neural Network) 기반의 알고리즘은 현재 모든 이미지 이해 벤치마크에서 최상의 결과를 보여주지만, 계산의 복잡성이 높고 메모리의 사용이 커서 모바일 플랫폼에서의 사용이 제한된다. 한편, 자율주행차량의 어플리케이션으로써 이미지 이해의 효용성은 사용되는 하드웨어의 사용가능성에 달려 있다. 실시간 사용을 보장하여야 함과 동시에 전력소비율의 제한이 있다. 그러므로 본 연구에서는 작고 효율적인 임베디드 CNN을 활용한 효율적인 알고리즘의 개발에 중점을 둔다. 즉, 소형의 고성능 피드포워드 컨볼루션 신경망(Feedforward Convolusion Neural Network)의 새로운 아키텍처를 제안한다. 본 연구에서 제안하는 네트워크 아키텍처는 차량의 현재 차선을 감지하고 차량이 기동가능한 경로를 예측하도록 설계되었다. Nvidia Jetson TX2로 대표되는 GPU기반 임베디드 플롯폼을 위한 새로운 아키텍처로 2 억 2 천 5 백만 건의 매개 변수를 사용하여 2 억 8 천 5 백만 건의 다중 누적 작업을 계산하여 ImageNet 1000 데이터 세트의 Top 5 정확도가 92.59 \% 인 매우 효율적인 CNN이다. 제안된 토폴로지는 규칙적이며 독점적으로 컨벌루션 레이어, 스케일링 레이어, 배치 정규화, 누설 ReLU 비선형 및 글로벌 풀링 레이어로 구성된다. 본 연구에서 네트워크는 CAFFE 라이브러리를 사용하여 개발되었으며 성능 튜닝에 중점을 둔 최적화 프로그램 인 Nvidia TensorRT 응용 프로그램을 이용하여 목표 하드웨어에 최적화된 소프트웨어를 개발하였다.

서지기타정보

서지기타정보
청구기호 {MME 18093
형태사항 v, 58 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 시암 프란 제이
지도교수의 영문표기 : Kyung Soo Kim
지도교수의 한글표기 : 김경수
학위논문 학위논문(석사) - 한국과학기술원 : 기계공학과,
서지주기 References : p. 52-57
주제 Deep learning
semantic segmentation
object classification
computer vision
심층 학습
시맨틱 세분화
객체 분류
컴퓨터 비전
QR CODE qr code