Synthesizing optimal controllers for dynamical systems often involves solving optimization problems with hard real–time constraints. These constraints determine the class of numerical methods that can be applied: computationally expensive but accurate numerical routines are replaced by fast and inaccurate methods, trading inference time for solution accuracy. This thesis provides techniques to improve the quality of optimized control policies given a fixed computational budget. We achieve the above via a hypersolvers approach, which hybridizes a differential equation solver and a neural network. The performance is evaluated in direct and receding–horizon optimal control tasks in both low and high dimensions, where the proposed approach shows consistent Pareto improvements in solution accuracy and control performance.
동적 시스템을 위한 최적제어기를 합성하는 것은 종종 어려운 제약 조건을 포함한 최적화 문제를 실시간으로 해결하는 것을 포함한다. 이러한 제약 조건은 적용할 수 있는 수치 방법의 클래스를 결정한다. 계산 비용이 많이 들지만 정확한 수치 루틴은 빠르고 부정확한 방법으로 대체되고 추론 시간을 솔루션 정확도로 교환한다. 이 논문은 고정된 계산 자원이 주어졌을 때 최적화된 제어 정책의 품질을 향상시키는 기술을 제공한다. 우리는 미분 방정식 솔버와 신경망을 결합하는 하이퍼 솔버 접근 방식을 통해 위의 사항을 달성한다. 솔버의 성능은 direct 최적 제어 방식과 MPC 방식을 사용하여 평가되었으며, 제안된 접근 방식은 솔루션 정확도 및 제어 성능에서 일관된 Pareto 개선을 보여준다.