서지주요정보
Robust navigation for racing drones based on imitation learning = 모방 학습에 기반한 강건한 경주용 드론 내비게이션
서명 / 저자 Robust navigation for racing drones based on imitation learning = 모방 학습에 기반한 강건한 경주용 드론 내비게이션 / Tianqi Wang.
발행사항 [대전 : 한국과학기술원, 2020].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8036652

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 20164

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Deep learning based approaches have shown impressive performance in robotics applications in recent years. Nevertheless, the demand for huge training data and the lack of the explainability and safety guarantee of the trained policy still limit its usage in safety-critical applications such as autonomous cars, surgical robots, etc. In this thesis, we focus on developing the navigation methods for the racing drones, which need to fly through complex tracks formed by gates at high speed. We use a modularized approach to divide the whole system into perception, planning, and control module. The focus of this thesis is on the perception module which takes the camera image and drone states as input and generates high-level navigation commands such as the navigation direction and speed. As for the planning and control module, we leverage well-studied state-of-the-art methods for path planning and drone control. This modularization choice combines the advantages of the learning-based methods for a robust perception module and the model-based methods for precise planning and control. An expert policy that automatically maneuvers the drone through the track is proposed in this thesis based on the accurate positions of the drone and the gates which are available in the simulator. While the expert policy generates navigation command only based on the accurate positions of the drone and the gates, informative auxiliary data like the camera images and drone states can still be collected at the same time along with the expert policy’s decisions. We then use imitation learning to train a customized neural network to map from the camera images and drone states to the high-level commands including the navigation direction and speed. Moreover, the extensive domain randomization involved during data collection makes the trained policy robust enough and successfully directly transferred to environments that were unseen during training.

근래에 들어, 심층 학습 기반 기술들이 로보틱스 연구 분야에서 뛰어난 성능을 입증하고 있다. 하지만 이러한 접근법은 대량의 학습자료가 필요하며, 설명이 불가능하고, 학습된 행동 정책의 위험성을 가늠할 수 없다는 단점으로 인해 자율주행차, 수술 로봇 등 안전에 민감한 분야에 실제로 적용하기에는 어려운 상황이다. 본 논문은 레이싱 드론이 다수의 게이트로 이루어진 복잡한 비행 트랙을 고속 비행하기 위한 자율 항법 기술 개발에 초점을 둔다. 자율 비행 시스템은 인지 모듈과 계획 모듈, 제어 모듈로 모듈화할 수 있으며, 그 중에서 인지 모듈은 카메라 영상과 드론의 상태를 입력받아 비행 방향, 속도와 같은 고급 명령을 출력한다. 본 논문은 인지 모듈의 연구에 중점을 두며, 계획 모듈 및 제어 모듈은 경로 계획과 드론 제어 주제에서 심화 연구된 최첨단 기술을 사용한다. 이와 같은 시스템 모듈화를 통해 강인한 인지 모듈을 구성하는 학습 기반 방법의 장점과 정확한 계획 및 제어를 구현하는 모델 기반 방법의 장점을 융합한다. 본 논문은 모의 환경에서 제공하는 드론 및 게이트의 정확한 위치 정보를 기반으로 트랙을 자율 비행하는 드론 전문가 행동 정책을 제안한다. 전문가 행동 정책을 통해 드론과 게이트의 정확한 위치 정보 입력만으로 자율비행을 수행하면서, 드론은 카메라 영상, 드론 상태 및 전문가 행동 정책의 행동 결과 등 정보량이 풍부한 부가 자료를 수집한다. 본 논문에서는 모방 학습 방법을 이용하여 카메라 영상과 드론 상태 정보를 비행 방향 및 속도와 같은 고급 명령으로 매핑하는 인지 특화 심층 신경망을 학습하는 방법을 제안한다. 뿐만 아니라, 학습 과정 중 자료 수집 단계에서 도메인 랜덤화를 광범위하게 적용하여 강인한 행동 정책을 학습하고, 학습 과정 중에 관측하지 않은 환경에서도 성공적으로 임무를 수행하는 드론 자율항법 인지 모듈을 개발한다.

서지기타정보

서지기타정보
청구기호 {MEE 20164
형태사항 iii, 26 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 왕천기
지도교수의 영문표기 : Dong Eui Chang
지도교수의 한글표기 : 장동의
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 24-26
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서