As technology advances, more intelligent robots are being used in real world applications. Intelligent robots need an understanding of the surrounding environment to provide people with a high level of ser- vice, and understanding of the environment contains semantic and geometric information. A combination of semantic information and geometric information to intelligent robots can provide a high level of ser- vice, and methods for collecting semantic and geometric information together are presented. SimVODIS was proposed to extract both semantic and geometric information from surrounding environments by training data-driven semantic VO. However, there is a common problem with VO algorithms that do not have robust pose estimation in a dynamic environment and that overfitting occurs by learning only one camera parameter. To overcome these problems we propose SimVODIS++. SimVODIS++ achieved robust pose estimation by applying attention mechanism and prevent overfitting to single camera param- eters by data augmentation and camera parameter estimation. SimVODIS++ achieved very accurate pose estimation results and trajectory estimations compared to baselines and ablation studies.
기술이 발전함에 따라 실전에서 사용되는 지능 로봇들이 늘어나고 있다. 지능 로봇들이 사람들에게 높은 수 준의 서비스를 제공하기 위해서는 주변의 환경에 대한 이해를 필요로하고 주변 환경에 대한 이해는 의미적인 정보와 기하학적인 정보를 포함하고 있다. 지능 로봇에게 의미적인 정보와 기하학적인 정보를 결합해서 전달 을 해줘야 높은 수준의 서비스를 제공할 수 있고 이를 위해 의미적인 정보와 기하학적인 정보를 함께 모으는 방법들이 제시되었다. SimVODIS도 의미적인 정보와 기하학적인 정보를 동시에 제공가능한 딥러능으로 학 습된 시각적 변위 추정 알고리즘이다. 하지만 시각적 변위 추정 알고리즘들에는 공통적인 문제점이 있는데 그것은 동적인 환경에서 원활한 변위 추정이 이뤄지지 않고 하나의 카메라 파라미터에 대해서만 학습을 하여 과적합이 일어난다는 것이다. 이 한계점은 SimVODIS에도 공통적으로 적용되는 사항이다. 이를 극복하기 위해서 우리는 SimVODIS++를 제안한다. SimVODIS++는 집중 모듈과 카메라 인수 예측을 통해 동적인 환경에서의 강인한 변위 추정이 가능하도록 하고 카메라 파라미터가 계속 바뀌는 환경에서도 학습이 가능 하게 한다. SimVODIS++는 다른 딥러닝으로 학습된 VO 연구들 중에서도 가장 정확한 변위 추정 결과를 얻었고 각각의 연구들을 시험 경로에 따른 예측 결과로부터 차량이 움직인 궤도를 그려서 비교해봤을 때도 최고 수준의 성능을 얻는다.