Mobile Edge Computing is a network architecture concept that aims to move existing cloud infrastructure closer to users, it has a lower latency compared to the cloud by being located in the access network. With this feature, mobile edge computing enables new kinds of applications that were not possible in the cloud. In Smart Factory, a typical scenario where mobile edge computing can be applied, the applications often require analysis based on image recognition algorithm. We first proposed a SIFT-CNN model for image recognition. This model aims at maintaining high accuracy and improving processing speed of image recognition in mobile edge computing environment. In addition, this thesis deals with the problem of scheduling tasks related to image recognition energy-efficiently while satisfying processing time requirement in FPGA-GPU hybrid system. Various studies have been conducted to schedule tasks energy-efficiently in heterogeneous clusters. However, conventional studies apply the scheduling by just allocating the tasks to the clusters. In this thesis, we consider a task partition that divides a CNN task into several subtasks and assigns them into several accelerators. By applying the task partition, energy efficiency and throughput can be further improved by exploiting the differences in processing characteristics for each CNN layer on FPGA and GPU. Using this features, we proposed a dynamic partition scheduling scheme for CNN inference in FPGA-GPU hybrid system. Since this thesis aims at real-time service in edge computing environment, the scheduler adaptively schedules according to the amount of input task. As long as the processing time requirement of an input task is met, the scheduler maximizes energy efficiency by dynamically changing the scheduling. To verify the proposed scheme, we compared the proposed scheduling with the conventional task scheduling in the system composed of several FPGAs and GPUs through a simulator. Experimental results showed that about 48% improvement of energy efficiency was identified with comparison of the conventional schemes under the edge computing environment with 4 FPGAs and 2 GPUs.
모바일 엣지 컴퓨팅은 기존의 클라우드 인프라를 사용자와 가까운 곳으로 옮기자는 네트워크 아키텍처 컨셉으로, 액세스 네트워크에 위치하여 통신 지연이 클라우드에 비해 매우 짧다는 특징을 가지고 있다. 이러한 특징으로 모바일 엣지 컴퓨팅은 클라우드에서는 가능하지 않던 새로운 종류의 응용들을 실현 가능하게 한다. 모바일 엣지 컴퓨팅이 적용될 수 있는 대표적인 시나리오인 스마트 팩토리에서 관련 응용들은 영상 인식 알고리즘을 기반으로 한 분석을 필요로 하는 경우가 많다. 우리는 먼저 영상 인식을 위한 SIFT-CNN 모델을 제안했다. 이 모델은 모바일 엣지 컴퓨팅 환경에서 영상 인식에서의 높은 정확도를 유지하고, 처리 속도를 향상시키는 것을 목표로 한다. 또한, 본 논문에서는 FPGA-GPU 하이브리드 시스템에서 실행 시간 제한을 만족시키면서 에너지 효율적으로 영상 인식과 관련된 태스크들을 스케줄링하는 문제에 대해 서술했다. 기존에도 이기종 클러스터에 태스크를 에너지 효율적으로 스케줄링하는 다양한 연구들이 진행되었지만, 기존 연구들은 태스크를 단순히 배정하는 방식으로 스케줄링을 적용한다. 본 논문에서는 하나의 CNN 태스크를 여러 서브 태스크로 쪼개서 여러 가속기에 나눠서 스케줄링하는 태스크 파티션에 대해 고려하고 있다. 태스크 파티션을 적용하면 FPGA 및 GPU에서 각 CNN 계층에 대한 컴퓨팅 특성 차이를 이용하여 에너지 효율성과 처리 속도를 더욱 향상시킬 수 있다. 이러한 특징을 이용하여, FPGA-GPU 하이브리드 시스템에서 CNN 추론을 위한 동적 파티션 스케줄링 기법을 제안했다. 본 논문은 엣지 컴퓨팅 환경에서의 실시간 서비스를 고려하고 있기 때문에, 스케줄러는 입력 태스크의 양에 따라 적응적으로 스케줄링 한다. 입력 태스크의 처리 시간 요구 사항이 충족되는 선에서 스케줄러는 파티셔닝 기점을 동적으로 변경하여 에너지 효율을 최대화한다. 제안한 방법에 대한 검증을 위해 시뮬레이터를 통해 여러 개의 FPGA와 GPU로 구성된 시스템에서 기존의 태스크 배정 스케줄링과 제안된 파티셔닝 기법이 추가로 적용된 스케줄링을 비교하였다. 실험 결과 4개의 FPGA와 2개의 GPU로 구성된 시스템에서 태스크의 실행 시간 제한을 만족시키면서 기존 방법 대비 최대 48%의 에너지 효율 개선이 일어남을 확인하였다.