1. Descripción del problema

Sea la ecuación de estado del objeto de control
$\dot{\boldsymbol{x}}_{p}=\boldsymbol{A}_{p }(t) x_{p}+\boldsymbol{b}_{p}(t) u \tag{1}$
式中
$\boldsymbol{A}_{p}=\left[\begin{array}{cc} 0 & 1 \\ -6 & -7 \end{matriz}\right], \quad \boldsymbol{b}_{p}=\left[\begin{matriz}{l} 2 \\ 4 \end{matriz}\right ] \etiqueta{2}$
La ecuación de estado del modelo de referencia es
$\dot{\boldsymbol{x}}_{m}=\boldsymbol{A}_{m} x_{m}+ \boldsymbol {b}_{m} r \tag{3}$
式中
$\boldsymbol{A}_{m}=\left[\begin{array}{cc} 0 & 1 \\ -10 & -5 \end{matriz}\right], \quad \boldsymbol{b}_{m}=\left[\begin{matriz}{l} 1 \\ 2 \end{matriz}\right ] \etiqueta{4}$
diseñar la ley adaptativa con la teoría de la estabilidad de Lyapunov

2. Modelado de problemas

Debido a los parámetros del objeto de control (matriz de estado $\boldsymbol{A}_{p}$ Y matriz de control $\boldsymbol{b}_{p}$ ) generalmente se desconoce y no se puede ajustar directamente. Por lo tanto, para cambiar las características dinámicas del objeto de control, es necesario adoptar el control anticipativo más el control de retroalimentación.

señal de control $u$ está determinado por la señal de avance $Kr$ y señal de realimentación $Fx_p$ Composición, concretamente
$\boldsymbol{x}_{p} \tag{5}$
En la fórmula $($ $5$ $)$ $r$ es $vector de entrada m-$ dimensional, $\boldsymbol{x}_{p}$ para $vector de estado n-$ dimensional, $K$ 为 $\times m$ matriz de ganancia realimentada $m$ $F$ 为 $\times n$ matriz de ganancia de retroalimentación; específicamente en este experimento de simulación, la dimensión del vector de entrada $metro = 1$ , dimensión del vector de estado $norte = 2$ _

Sustituyendo la fórmula (5) en la ecuación de estado del objeto de control, podemos obtener
$\dot{\boldsymbol {x} }_{p}=\left[\boldsymbol{A}_{p}(t)+\boldsymbol{b}_{p}(t) F\right] \boldsymbol{x}_{p} +\boldsymbol {b}_{p}(t) K r \tag{6}$
Sea el vector de error de estado generalizado del sistema
$\boldsymbol{e}=\boldsymbol{x}_{m}-\boldsymbol{x}_{p} \tag{7 }$
De la ecuación de estado del modelo de referencia, combinada con las fórmulas (6) y (7), se puede obtener:
$\dot{\boldsymbol{e}}=\boldsymbol{A}_{m} \boldsymbol{e}+\left(\boldsymbol{A}_{m}-\boldsymbol{A} _{p}- \boldsymbol{b}_{p} F\right) \boldsymbol{x}_{p}+\left(\boldsymbol{b}_{m}-\boldsymbol{b}_{p} K\right) r \tag{8}$
En una situación ideal, es decir, $\rightarrow 0$ , los dos últimos elementos del lado derecho del signo igual en (8) deben ser iguales a 0. Establece la matriz de ganancia feed-forward $K$ y matriz de ganancia de retroalimentación $Los valores ideales de F$ son respectivamente $\bar{K}$ y $\bar{F}$ 。

Entonces, la fórmula (8) finalmente se puede escribir como
$\dot{\boldsymbol{e}}=\boldsymbol{A}_ { m} \boldsymbol{e}+\boldsymbol{b}_{m} \bar{K}^{-1} \Phi \boldsymbol{x}_{p}+\boldsymbol{b}_{m} \ barra {K}^{-1} \Psi r \tag{9}$
En la fórmula $($ $9$ $)$ $\Phi=\bar{F}-F$ 为 $\times n$ matriz, $\Psi=\bar{K}-K$ 为 $\times m$ -matriz.

Seleccione la función de Lyapunov como:
$V=\frac{1}{2}\ left [\boldsymbol{e}^{T} \boldsymbol{P} \boldsymbol{e}+\operatorname{tr}\left(\Phi^{T} \Gamma_{1}^{-1} \Phi+\Psi ^ {T} \Gamma_{2}^{-1} \Psi\right)\right] \tag{10}$
En la fórmula $($ $10$ $)$ $\boldsymbol{P}$ es $\times n$ dimensional, $\Gamma_{1}$ y $\Gamma_{2}$ Ambos son $\times m$ -matriz simétrica definida positiva dimensional, símbolo $\operatorname{tr}$ representa la traza de la matriz.

Si (10) está en el continuo, entonces
$\dot{V}=\frac{1}{2}\left[\dot{\símbolo de bola{e}} \símbolo de bola{ P } \ballsymbol{e}+\ballsymbol{e}^{T} \ballsymbol{P} \dot{\ballsymbol{e}}+\operatorname{tr}\left(\dot{\Phi}^{T} \ Gamma_{1}^{-1} \Phi+\Phi^{T} \Gamma_{1}^{-1} \dot{\Phi}+\dot{\Psi}^{T} \Gamma_{2} ^ {-1} \Psi+\Psi^{T}\Gamma_{2}^{-1}\dot{\Psi}\right)\right] \tag{11}$
Sustituya la ecuación (9) en la ecuación (11), y luego de acuerdo con las propiedades de la traza de la matriz,
$\begin{alineado} \dot{V}=& \frac {1}{2} \boldsymbol{e}^{T}\left(\boldsymbol{P} \boldsymbol{A}_{m}+\boldsymbol{A}_{m}^{\boldsymbol{T }} \boldsymbol{P}\right) \boldsymbol{e}+\operatorname{tr}\left(\dot{\Phi}^{T} \Gamma_{1}^{-1} \Phi+\boldsymbol{x }_ {p} \boldsymbol{e}^{T} \boldsymbol{P} \boldsymbol{b}_{m} \bar{K}^{-1} \Phi\right) \\ &+\operatorname{ tr} \left(\dot{\Psi}^{T} \Gamma_{2}^{-1} \Psi+r \boldsymbol{e}^{T} \boldsymbol{P} \boldsymbol{b}_{ m} \bar{K}^{-1} \Psi\right) \end{alineado} \tag{12}$
Para satisfacer el segundo método de Lyapunov, es necesario asegurarse de que la fórmula (12) sea definida negativa, y la situación correspondiente es que el primer término de la fórmula (12) sea definido negativo, y los dos últimos términos sean ambos cero.

Porque $\boldsymbol{A}_{m}$ es una matriz estable, la matriz simétrica definida positiva $Q$ ，使 $\boldsymbol{P} \boldsymbol{A}_{m}+\boldsymbol{A}_{m}^{\boldsymbol{T}} \boldsymbol{P}= -\boldsymbol{Q}$ se establece. Al mismo tiempo, de acuerdo con la situación correspondiente anterior, $\Phi$ 和 $\Psi$ 的选择如下：
$\begin{alineado} \dot{\Phi }&=-\Gamma_{1}\left(\boldsymbol{b}_{m} \bar{K}^{-1}\right)^{T} \boldsymbol{P} \boldsymbol{e} \boldsymbol {x}_{p}^{T} \\ \dot{\Psi}&=-\Gamma_{2}\left(\boldsymbol{b}_{m} \bar{K}^{-1}\ derecha)^{T} \boldsymbol{P} \boldsymbol{e} r^{T} \end{alineado} \tag{13}$
当 $\boldsymbol{A}_{p}$ y $\boldsymbol{b}_{p}$ Cuando es un valor constante o cambia lentamente, se puede obtener la ley de regulación adaptativa:
$\begin{aligned} F(t)&=\int_{0}^{t} \Gamma_{1}\left( \boldsymbol {b}_{m} \bar{K}^{-1}\right)^{T} \boldsymbol{P e} \boldsymbol{x}_{p}^{T} d \tau+F (0) \\ K(t)&=\int_{0}^{t} \Gamma_{2}\left(\boldsymbol{b}_{m} \bar{K}^{-1}\right) ^{ T} \boldsymbol{P e} rd \tau+K(0) \end{alineado} \tag{14}$
Lo que debe agregarse es que la ley de ajuste autoadaptativa derivada de los pasos anteriores requiere $\boldsymbol{x}_{p}$ con $r$ es linealmente independiente. La condición para que los dos sean independientes es $r (t)$ es una señal de onda cuadrada con una cierta frecuencia o $Una señal continua por partes compuesta por q$ señales sinusoidales de diferentes frecuencias, donde $q > n /2$ 或 $q > (n - 1) /2$ 。

3. Resolución de problemas

De la derivación anterior, se puede ver que para adoptar la teoría de la estabilidad de Lyapunov para diseñar el MRACS, es necesario introducir la matriz de ganancia de avance $K$ y matriz de ganancia de retroalimentación $F$ , el objetivo del diseño es determinar $K$ ycoeficiente $F.$

Después de introducir dos matrices de ganancia para el control adaptativo, la ecuación de estado del sistema ajustable se convierte en:
$\ dot{\ boldsymbol{x}}_{p}=\left[\boldsymbol{A}_{p}(t)+\boldsymbol{b}_{p}(t) F\right] \boldsymbol{x}_{p }+\boldsymbol{b}_{p}(t) K r \tag{15}$
De acuerdo con la derivación anterior, $\boldsymbol{b}_{m} \bar{K}^{-1}$ y $\boldsymbol{b}_{p}$ La relación es la siguiente:
$\boldsymbol{b}_{m} \bar{K}^{-1}=\boldsymbol{b}_{p} =\boldsymbol{b}_{p}=\ izquierda[\begin{array}{l} 2 \\ 4 \end{array}\right] \tag{16}$
Seleccione parte de los parámetros adaptativos en la fórmula (14) como sigue:
$\boldsymbol{P}=\left[\begin{array} { ll} 3 y 1 \\ 1 y 1 \end{matriz}\right], \quad \Gamma_{1}=\Gamma_{2}=1 \tag{17}$
_
$\begin{aligned} F(t)&=\int_{0}^{t}\left[\begin{array}{ll} 2 & 4 \end{matriz}\right]\left[\begin{matriz}{ll} 3 & 1 \\ 1 & 1 \end{matriz}\right] \boldsymbol{e} \boldsymbol{x}_{p} ^{T} d \tau+F(0) \\ K(t)&=\int_{0}^{t}\left[\begin{array}{ll} 2 & 4 \end{array}\right ]\left[\begin{array}{ll} 3 & 1 \\ 1 & 1 \end{array}\right] \boldsymbol{erd} \tau+K(0) \end{alineado} \tag{18}$
, la ley adaptativa continua anterior se discretiza y se utiliza en experimentos de simulación numérica reales. Deje que el tamaño del paso de integración numérica sea $h$ , el vector de estado del modelo de referencia y el vector de estado del objeto de control en cada momento son los siguientes:
$\begin{alineado} \boldsymbol{x} _ {m}(k+1)&=\boldsymbol{x}_{m}(k)+h\left[\boldsymbol{A}_{m}(k) \boldsymbol{x}_{m}( k) +\boldsymbol{B}_{m}(k) r(k)\right] \\ \boldsymbol{x}_{p}(k+1)&=\boldsymbol{x}_{p}( k) +h\left[\boldsymbol{A}_{p}(k) \boldsymbol{x}_{p}(k)+\boldsymbol{B}_{p}(k) u(k)\right ] \ end{alineado} \tag{19}$
Debido a la ley de control adaptativo derivada anterior, se requiere $\boldsymbol{x}_{p}$ con $r$ es linealmente independiente, es decir, $r (t)$ es una señal de onda cuadrada con una cierta frecuencia o $Una señal continua por partes compuesta por q$ señales sinusoidales de diferentes frecuencias, donde $q > n /2$ 或 $q > (n - 1) /2$ . En este experimento, $norte = 2$ , requiere correspondientemente $q > 1$ , por lo que en este experimento, se selecciona una señal continua por partes compuesta por 3 señales sinusoidales con diferentes frecuencias.La señal de entrada específica tiene la siguiente forma:
$r(k)=\sin (0.01 \pi k)+4 \sin (0.2 \pi k)+\sin (\pi k) \tag{20}$
introducida cuando diseñamos la ley adaptativaLa forma de discretización de $u$
$\boldsymbol{x}_{p}(k) \tag{21}$
Finalmente, es necesario discretizar la ley adaptativa:
$\begin{aligned} F(k)&=h \cdot \sum_{j=0}^{k} \boldsymbol{ b}_{p}^{T} \boldsymbol{P} \boldsymbol{e}(k)\left(\boldsymbol{x}_{p}(k)\right)^{T}+F(0) \\ K(k)&=h \cdot \sum_{j=0}^{k} \boldsymbol{b}_{p}^{T} \boldsymbol{P} \boldsymbol{e}(k) r( k)+K(0) \end{alineado} \tag{22}$
Después de derivar todas las leyes adaptativas y discretizar las leyes correspondientes, MATLAB lleva a cabo los experimentos de simulación pertinentes.

Los valores del modelo de referencia y los valores ajustables del sistema de los vectores de estado bidimensionales se pueden obtener de la siguiente manera:

inserte la descripción de la imagen aquí

Figura 1. Modelo de referencia y valores del sistema sintonizable para vectores de estado

Se puede ver que el sistema sintonizable no rastrea muy bien el modelo de referencia, ya que no hay una coincidencia óptima en este ejemplo.

Apéndice: Implementación del código MATLAB

% 课本习题3.4-用李雅普诺夫稳定性理论设计自适应规律
clear, clc;
close all;

h=0.01;L=100/h;     % 数值积分步长和仿真步数
% 可调系统的系数矩阵
Ap = [0 1;-6 -7];
Bp = [2; 4];
% 参考模型的系数矩阵
Am = [0 1;-10 -5];
Bm = [1; 2];
% n为行向量维数、m为列向量维数，Bp是n*m的矩阵
n = size(Bp, 1);
m = size(Bp, 2);

P = [3 1;1 1];              % 经计算得到的用于自适应规律的正定对称矩阵

% 设定所有参数的初始值
yr0 = zeros(m, 1);
xp0 = zeros(n, 1);
xm0 = zeros(n, 1);
u0 = zeros(m, 1);
e0 = zeros(n, 1);
F0 = zeros(m, n);           % 反馈增益矩阵初始值
K0 = zeros(m, m);           % 前馈增益矩阵初始值

% 初始分配参数空间
time = zeros(1, L);         % 用于记录仿真的时刻，对应绘图的横轴
yr = zeros(m, L);           % 输入信号(L个m维向量)
xp = zeros(n, L);           % 可调系统的状态向量(L个n维向量)
xm = zeros(n, L);           % 参考模型的状态向量(L个n维向量)
u = zeros(m, L);            % 控制信号(L个m维向量)
e = zeros(n, L);            % 系统的广义状态误差向量(L个n维向量)

for k = 1:L
    time(k) = k*h;
    % 输入信号
    yr(k) = 1*sin(0.01*pi*time(k))+4*sin(0.2*pi*time(k))+sin(1*pi*time(k));
    xp(:,k) = xp0+h*(Ap*xp0+Bp*u0);     % 计算xp
    xm(:,k) = xm0+h*(Am*xm0+Bm*yr0);    % 计算xm
    e(:,k) = xm(:,k)-xp(:,k);           % e=xm-xp
    
    % 代入F和K的自适应控制规律
    F = F0+h*(Bp'*P*e0*xp0');
    K = K0+h*(Bp'*P*e0*yr0);

    % 控制信号u=K*r+F*xp（K是前馈增益矩阵，F是反馈增益矩阵）
    u(:,k) = K*yr(k)+F*xp(:,k);
    
    % 将本轮求解得到的参数赋值给参数初始值，方便下一轮迭代使用
    yr0 = yr(:,k);
    u0 = u(:,k);
    e0 = e(:,k);
    xp0 = xp(:,k);
    xm0 = xm(:,k);
    F0 = F;
    K0 = K;
end

subplot(2,1,1);
plot(time, xm(1,:), 'Color', 'b', 'LineWidth', 0.9);
hold on
plot(time, xp(1,:), 'Color', 'r', 'LineStyle', '--', 'LineWidth', 1.1);
xlabel('t');
ylabel('x_m_1(t)、x_p_1(t)');
legend('x_m_1(t)','x_p_1(t)');
hold off
subplot(2,1,2);
plot(time, xm(2,:), 'Color', 'b', 'LineWidth', 0.9)
hold on
plot(time, xp(2,:), 'Color', 'r', 'LineStyle', '--', 'LineWidth', 1.1)
xlabel('t');
ylabel('x_m_2(t)、x_p_2(t)');
legend('x_m_2(t)', 'x_p_2(t)');
hold off

bibliografía

Li Yanjun, Zhang Ke. Teoría y aplicación del control adaptativo[M].Northwestern Polytechnical University Press, 2005.

Control Adaptativo——Experimento de Simulación 1 Usando la Teoría de Estabilidad de Lyapunov para Diseñar Leyes Adaptativas