Recent advances in embedded processors and software technologies have fostered the development of complex cyber-physical systems (CPS) such as autonomous driving vehicles. CPS typically rely on networks that interconnect sensors, controllers, and actuators to interact with physical worlds through real-time sensing and actuating. The last several years have seen a growing interest in developing networking technologies to provide deterministic and reliable communication, which is an essential requirement of safety-critical real-time applications in CPS. Beyond the essential requirement, another important requirement is efficient resource use. However, CPS networks often face inefficiency in resource use, because of the resource over-provisioning as follows: 1) pessimistic resource usage estimate for deterministic communication and 2) redundant transmission for reliable communication. To address such problems, many studies in the literature have proposed various resource-efficient real-time scheduling algorithms and fault management techniques, indicating that the adaptation is a key principle to deal with the problem. For each over-provisioning issue, some promising adaptation techniques have proposed including 1) mode-based scheduling and 2) on-demand fault recovery. However, applying those adaptation techniques into the CPS network yet raises a significant challenge. This is because it takes a long and unpredictable delay to dynamically update packet forwarding policy of the CPS network. Such a delay makes the networking system impossible to guarantee deterministic and reliable communication.
This dissertation proposes a novel CPS networking system that effectively addresses the challenge to realize the adaptation approaches. To this end, we analyze delay factors of each adaptation step, then reduce and bound each delay factor by totally changing the way of adaptation. The proposed networking system consists of two parts: MC-SDN and RoD-SDN. MC-SDN realizes mode-based mixed-criticality scheduling which addresses the over-provisioning from the pessimistic resource usage estimate. It effectively supports mode-based dynamic packet scheduling with fast and predictable adaptation (i.e., mode change), and improves resource efficiency while preserving timing guarantee of real-time flows even in the worst case. RoD-SDN enables on-demand real-time fault recovery which addresses the over-provisioning due to the redundant transmission. With fast and predictable adaptation (i.e., path restoration), it can adaptively change the path of each flow to recover the communication from the link failure; it can improve resource utilization while providing reliability guarantee of real-time flows against network failure. We evaluated the proposed system with full implementation on top of a software switch (i.e., Open vSwitch) running on a network testbed composed of multiple single-board computers. In addition, we deployed the networking system into a 1/10 scale autonomous vehicle, and conducted case studies; the result shows that the proposed system improves resource efficiency while preserving system safety in a real-world application scenario.
최근 임베디드 시스템 및 통신 기술의 발전에 힘입어 자율 주행 자동차와 같은 사이버-물리 시스템이 크게 대두되고 있다. 사이버-물리 시스템은 다수의 컴퓨팅 요소와 물리적 요소가 네트워크를 통해 연결되어 복잡한 작업을 수행하며 물리 세계와 상호 작용하는 시스템을 통칭한다. 특히 시스템의 규모가 날로 커져감에 따라 내부 요소 간 통신을 위한 네트워크의 중요성이 크게 부각되고 있다. 사이버-물리 시스템의 네트워크는 물리 세계와 상호 작용하는 특성으로 인하여 전송의 실시간성 및 신뢰성을 반드시 보장할 수 있어야 하며, 비용 및 공간 등의 문제로 인하여 제한될 수 밖에 없는 통신 자원을 최대한 효율적으로 활용할 수 있어야 한다. 하지만 현재 사이버-물리 시스템 네트워크는 1) 실시간성 보장을 위한 자원 사용량 과다 추정 및 2) 신뢰성 보장을 위한 트래픽 중복 전송에 의해 발생하는 통신 자원의 과다 할당으로 인한 자원 낭비 문제에 직면해있다. 이러한 문제는 비단 사이버-물리 시스템의 네트워크 뿐만 아니라 다양한 분야에서 발생해 왔기 때문에, 이를 해결하기 위한 다양한 연구들이 제시되어 왔다. 특히, 1) 모드 기반 적응형 스케줄링 및 2) 적응형 경로 복구와 같은 적응형 자원 관리 기법들이 자원 과다 사용 문제에 매우 효과적인 것으로 알려져 있다. 하지만 이런 적응형 기법들을 사이버-물리 시스템 네트워크에 적용하는 것에는 큰 어려움이 수반된다. 특히, 각 네트워크 장비의 트래픽 전송 규칙을 동적으로 변경하는 과정이 매우 느리고 심지어 예측 불가능하기 때문에 시스템이 요구하는 실시간성 및 신뢰성을 보장 하는 것에 큰 어려움을 만든다.
본 논문은 이러한 어려움을 극복하여 사이버-물리 시스템 네트워크에서 1) 모드 기반 적응형 트래픽 스케줄링 및 2) 적응형 실시간 경로 복구 기법을 실현 가능하게 하는 네트워크 시스템을 제시한다. 제시하는 네트워크 시스템은 모드 변경 및 경로 복구 과정에서 각각 필연적으로 수반되는 지연 시간 요소들을 밝혀내어, 이들을 크게 감소시키며 동시에 예측 가능한 상한값 미만으로 제한할 수 있도록 하였다. 첫 번째 세부 연구에서 적응형 스케줄링 시 모드 변경 지연 시간이 감소되고 예측 가능해짐에 따라, 최악의 경우에도 트래픽 전송의 실시간성을 보장하면서 자원 사용의 효율성을 높일 수 있음을 보였다. 두 번째 세부 연구에서 경로 복구의 지연 시간이 감소되고 예측 가능해짐에 따라, 네트워크 요소가 고장이 난 경우에도 일정 수준 이상의 신뢰성을 보장하면서 자원 사용의 효율성을 높일 수 있음을 보였다. 제안한 네트워크 시스템은 소프트웨어 스위치를 사용하여 실제 구현하였으며, 다수의 싱글보드 컴퓨터를 연결하여 구성한 네트워크 테스트베드에서 실험을 통해 성능을 검증하였다. 또한, 1/10 비율의 자동차 테스트베드를 사용하여 수행한 자율 주행 사례 연구를 통해, 제안한 네트워크 시스템이 현실 세계의 시스템에서도 효과적인 안전성 보장 및 자원 효율성 향상을 동시에 가능하게 함을 증명하였다.