In this thesis, we propose a new approach to design the fuzzy logic controller, which is based on time-delay information such as time-delay control scheme and a time-delay reward. The proposed new design methods are applied to system stability and multi-objective control problems, depending on the different type of time-delay information, respectively, and show their effectiveness compared wth the previous research results.
For a problem statement and an initial research result on stability problem, HRIV (Hybrid Rule Interval Variation) method is presented, as a means of stabilizing a class of fuzzy control-based nonlinear systems. The HRIV method consists of two modes: I-mode (Minimum Approximation Error-based control) and R-mode (Rule Interval Variation-based control). In I-mode, sliding mode control is used to compensate for the minimum approximation error caused by heuristic characteristics of fuzzy logic control. In R-mode, RIV (Rule Interval Variation) method reduces the interval lengths of rules as the states converge to an equilibrium point. The HRIV method considers the analytic upper bound of the minimum approximation error and reduces its effect in the control input, which is considered to be advantageous compared with the previous results. To show effectiveness of the proposed method, a simulation experiment is conducted to stabilize a simple nonlinear system and a modified inverted pendulum system.
Design of Mamdani-type FLC (Fuzzy Logic Control) heavily depends on a priori knowledge while TSK-type FLC requires determination of a common matrix ' P ' for stability. On the other hand, the TDC (Time Delay Control) method shows guaranteed stability depending on a sufficiently large time span and a sufficiently small time-delay. In this paper, the TDC scheme is combined with FLC in two different ways to resolve those disadvantages of FLC and TDC schemes. In case of Mamdani-type TDFLC, SMC (Sliding Mode Control) and ADC (Adaptive Control) are incorporated to secure robust stability, while, for the TSK-type TDFLC, it is shown that, even when a stability condition of TDC may not be satisfied, SMC can be applied to make the closed-loop system stable under a pre-specified bound of time-delay error. Finally, the proposed method is tested in simulations for the problem of stabilizing a mass-spring-damper system with unknown parameters.
A multi-objective control problem has been handled in many different ways such as fuzzy, neural network and reinforcement learning etc. Among them, a reinforcement learning method solves a multi-objective control problem without any priori knowledge. In the paper, a new reinforcement learning method for a multi-objective control problem is proposed in consideration of its convergence. The proposed method, in which objective eligibility is considered for handling multi-rewards, reformulates a multi-objective control problem in a form of a reinforcement learning problem under non-Markov environment. Using a similar relation to eligibility, the convergence of the proposed method is analyzed based on the previous research results of eligibility.
본 논문에서는 시간 지연 정보를 이용하여 기존의 접근 방법과는 다른 퍼지 제어기의 새로운 설계 방법을 제시하였으며, 시간 지연 제어와 시간 지연 강화 학습과 같은 시간 지연 정보를 이용한 설계 방법을 사용하여 기존의 퍼지 제어와 학습 방법 등에서 문제가 되어 왔던 시스템 안정성 및 다목적 문제에 적용되어 효과적인 연구 결과를 얻을 수 있음을 확인하였다.
퍼지 제어 시스템의 안정성 문제와 관련하여, 본 논문에서는 먼저 기존의 적응 제어 방법과 슬라이딩 모드 제어 방법을 사용한 초기 연구 결과와 기존의 접근 방법이 내포하고 있는 문제점을 제시하였다. 비선형 시스템을 안정시키기 위한 HRIV (Hybrid Rule-Interval Variation) 방법에서는 기존의 제어 분야에서 폭 넓게 연구되어 온 슬라이딩 제어와 적응 제어 기법 등이 퍼지 제어 방법과 결합되어, 퍼지 제어기가 가지고 있는 불안정성의 특성을 극복하고자 하였다. HRIV방법은 크게 I-mode (Integral Sliding Mode FLC)와 R-mode (RIV method)로 나뉘어져 있다. I-mode에서는 슬라이딩 제어기가 퍼지 제어기에 의하여 발생되는 MAE (Minimum Approximation Error)를 보정함으로써, 안정성을 보장하도록 되어 있으며, R-mode에서는 퍼지 멤버쉽 함수들간의 간격을 제안된 리아프노프 함수가 감소되도록 줄임으로써, MAE의 크기를 줄이고, 따라서, 슬라이딩 제어 입력을 줄이는 작용이 수행된다. 제안된 HRIV방법은 시뮬레이션으로 간단한 비선형 제어 플랜트와 역진자 등에 적용되어 그 특성과 이점이 확인되었다.
기존의 시스템의 안정성을 위한 퍼지 제어 설계 방법은 전문가 지식에 대한 지나친 의존성, 측정하기 어려운 MAE의 이론적 보정, LMI(Linear Matrix Inequality)의 복잡성이라는 문제점등을 각각 Mamdani 형태의 제어 시스템과 TSK형태의 제어 시스템에서 내포하고 있어왔다. 본 논문에서는 기존의 제어 분야에서 시스템의 불확실성에 유용하게 사용되어 왔던 시간 지연 제어 방법을 퍼지 제어기를 설계하여 이전의 문제점들을 해결하고자 하였다. 퍼지 제어기를 설계하는데 있어서, 이러한 시간 지연 정보를 이용한 시간 지연 제어 방법의 적용은 Mamdani 형태의 경우에 주어진 상태 변수들의 허용 변위 안에서 범용 퍼지 제어기의 가능성을 제시하였으며, TSK 형태의 경우에는 LMI의 고려 없이도 새롭게 제시된 측정 가능한 시간 지연 에러의 보정을 통하여 안정성 문제를 해결할 수 있음을 보였다.
최근에 활발하게 연구되고 있는 다목적 제어의 경우, 기존에 많은 지능 제어 기법들이 주어진 목적들을 동시에 최적화하도록 적용되어 왔음에도 불구하고, 이론적 접근 방법과 물리적 접근 방법에 있어서 많은 차이를 보여왔다. 본 논문에서는 사용되어온 지능 제어 기법들 중에서 강화 학습 방법을 퍼지 제어 설계에 적용하여 다목적 제어를 위한 이론적 설계와 물리적 설계의 차이를 극복하고자 하였다. 특별히, 강화 학습 방법 중에서 본 논문에서는 시간 지연 보상을 이용하는 Eligibility Trace(ET)를 사용함으로써, 학습의 수렴성을 위하여 새롭게 제시된 Objective Markov Property(OMP)를 완화하여 제어 시스템에 적용할 수 있도록 하였다. 또한, 강화 학습된 퍼지 제어기 이외에 수렴성을 위하여 제시된 OMP를 만족하도록 부가적인 Decoupled Fuzzy Sliding Mode Controller를 변형한 Biased-NN을 제안하였으며, OMP와 supporting strategy와의 상호 관련성을 통하여 강화 학습 퍼지 제어기의 이론적, 물리적 통합 접근의 가능성을 제시하였다.