摘要
针对一类具有外部干扰的离散时间非线性全驱系统的跟踪控制问题, 本文提出一种全驱系统抗干扰预测控制方法. 首先, 在低保守性干扰假设下, 利用差分算子及其高阶形式设计高阶干扰观测器来精确估计外部干扰, 从而为构建干扰预见提供良好基础; 其次, 利用Diophantine方程建立含有干扰预见的增量式全驱系统预测模型. 基于该预测模型, 推导多步超前预测来最小化目标函数, 进而获得最优抗干扰控制器以确保跟踪性能. 进一步的讨论提出分析闭环系统稳定性与跟踪性能的充分条件; 最后, 通过航天器姿态控制的数值仿真, 验证所提出方法的有效性.
Abstract
This paper considers a tracking control problem for a type of discrete-time nonlinear fully actuated systems with external disturbances. A fully actuated system (FAS) anti-disturbance predictive control method is proposed to address this problem. Firstly, a high-order disturbance observer is designed by adopting a difference operator and its high-order form to accurately estimate the external disturbances under a less conservatism assumption, which provides a better foundation to construct a disturbance preview. Secondly, an incremental FAS (IFAS) prediction model with the disturbance preview is established by utilizing a Diophantine Equation. Based on this IFAS prediction model, the multistep ahead predictions are derived to minimize an objective function for obtaining an optimal anti-disturbance controller, such that the tracking performance can be maintained. Then, a sufficient condition is presented to analyze the bounded stability and tracking performance of the closed-loop FASs in the further discussion. Finally, the proposed FAS anti-disturbance predictive control provides a solution to spacecraft attitude control for the verification of effectiveness.
1 引言
在实际系统中,干扰主要源自以下两个方面: 1)传感器测量噪声、执行器误差、结构振动及现场操作环境等因素导致的外部干扰和噪声; 2)系统中的不确定动态、参数摄动、未建模动态及相关动态耦合导致的模型不确定性.
干扰的存在会严重影响乃至破坏系统的稳定性、控制精度和其他控制性能. 因此,研究具有高精度和高可靠性的抗干扰控制方法对于改善控制性能,提高控制精度十分重要. 现有的抗干扰控制方法可以分为干扰补偿和干扰抑制两类. 与干扰抑制方法相比,干扰补偿方法因能获得更不保守的控制性能而广受关注 [1],其主要思想是先设计干扰观测器估计外部干扰,再构建基于干扰估计的前馈补偿器来主动补偿干扰,进而确保抗干扰控制性能.
在以往的研究中,基于干扰观测器的抗干扰控制吸引了诸多研究人员的密切关注并取得了丰富的代表性研究成果 [2-4] . 然而,不足之处在于文献 [2-4] 及其相关成果均是以状态空间模型为基础开展研究. 而常用于系统建模的 Kirchhoff 定律、Navier-Stokes方程、Euler-Lagrange方程、Newton运动学定律等基本物理定律均是二阶全驱的,由上述物理定律直接建模或耦合得到的实际系统模型则是二(高)阶全驱的. 状态空间方法则需将二(高)阶全驱模型先转换为一阶状态空间模型,再进行控制设计,这会导致原系统失去物理意义,还会造成病态矩阵、数值解不稳定、系统维数骤增等缺点,从而增加设计过程中的难度和复杂度,使之难以在实际工程中应用.
全驱系统理论 [5] 是解决上述问题的重要手段. 该理论是由段广仁院士创造性提出的一种全新的控制系统分析与综合的理论体系,可以简化控制设计,改善控制性能. 其关键步骤是构建控制系统的全驱系统模型,进而利用全驱特性对消开环系统的所有动态特性,建立具有期望性能的闭环系统. 而全驱特性可由上述基本物理定律直接建模或耦合得到; 也可通过数学意义的推广,由严反馈系统、非完整系统等欠驱系统通过升阶消元或微分同胚变换得到 [5] . 迄今为止,全驱系统理论已在理论研究 [6-7] 与实际应用 [8-9] 两方面取得重要进展. 在基于干扰观测器的抗干扰控制领域,全驱系统理论亦取得了重要成果. 文献 [10] 设计了有限时间干扰观测器来实现干扰的快速估计,进而构建了有限时间镇定控制器以保证干扰下链式非完整系统的稳定性. 文献 [11] 设计了固定时间干扰观测器估计模型不确定性和外部干扰,继而利用全驱系统理论和隐式Lyapunov稳定性理论建立了固定时间控制器并用于机械臂控制. 文献 [12] 针对输入端干扰和外部干扰建立了非线性干扰观测器来实现干扰估计和补偿,而后构建了全驱系统复合控制器来实现抗干扰控制. 文献 [13] 则针对三自由度欠驱直升机中的模型不确定性和外部干扰设计了降阶干扰观测器,而后基于全驱系统理论建立了鲁棒控制器用以确保升降角和偏航角轨迹跟踪. 文献 [14-15] 及其相关成果亦丰富了全驱系统理论框架下基于干扰观测器的抗干扰控制研究.
全驱系统预测控制是基于全驱系统理论开发的一类预测控制方法,在控制系统分析与综合中发挥了重要作用. 本团队致力于全驱系统预测控制的理论与应用基础研究,已获得了一批原创性研究成果. 具体地,文献 [16-17] 利用Diophantine方程构建了增量式全驱系统预测模型,解决了全驱系统预测控制的基本问题,使得预测控制律可以直接在全驱系统理论框架下设计和表示,避免了传统预测控制需在一阶状态空间模型上设计的窠臼. 在此基础上,本团队还深入研究了基于干扰观测器的全驱系统抗干扰预测控制问题 [18-20] . 文献 [18] 在干扰未知但有界的条件下设计了滑模干扰观测器来实现未知干扰的有界估计. 文献 [19] 则针对外源系统产生的干扰设计了干扰观测器,保证了干扰的精确估计和补偿. 文献 [20] 设计的干扰观测器则能估计和补偿慢时变集总干扰. 在干扰补偿的基础上,文献 [18-20] 进一步构建了全驱系统抗干扰预测控制律,并提出了考虑干扰估计误差收敛和保证闭环系统稳定性与跟踪性能的充分条件. 基于文献 [18-20],文献 [21] 设计了固定时间干扰观测器来实现干扰的快速估计,而后建立了带有预设性能的全驱系统抗干扰预测控制律以确保挠性航天器的姿态镇定与机动.
尽管文献 [10-15,18-21] 已在基于干扰观测器的全驱系统抗干扰控制领域取得重要进展,但仍存在以下两个问题亟待解决: 1)文献 [10-15,19-21] 虽实现了对外部干扰的精确估计,但对干扰假设的保守性要求较高,这与实际系统中的干扰不甚相符; 且在部分研究中,干扰估计性能依赖于初始状态,这导致干扰观测器设计较为复杂. 因此,上述成果难以在实际工程中应用. 文献 [18] 虽在干扰有界但未知的低保守性假设下设计了滑模干扰观测器,但干扰估计性能欠佳,仅能实现有界估计,难以用于高精度、高可靠性的控制任务; 2)文献 [18-21] 设计的全驱系统抗干扰预测控制律是先利用干扰估计实现前馈补偿再进行预测控制设计,这导致预测控制律本身不具有抗干扰能力,难以实现更好的控制性能. 综上可知,现阶段研究的难点在于如何在低保守性干扰假设下设计高精度的干扰观测器,以及如何在本质上提高预测控制律的抗干扰能力.
为了解决上述难点问题,本文提出一种含有干扰预见的全驱系统抗干扰预测控制方法,旨在在低保守性干扰假设下设计高阶干扰观测器来实现外部干扰的精确估计,进而构建含有干扰预见的全驱系统抗干扰预测控制律以在本质上提高抗干扰能力. 具体而言,首先提供描述控制系统实际动力学的全驱系统模型,从而保持原系统的全驱特征用以简化控制设计,改善控制性能. 其次,利用差分算子及其高阶形式对外部干扰进行高阶展开,并据此设计高阶干扰观测器来实现外部干扰的精确估计,从而为生成干扰预见奠定良好基础. 而后依据Diophantine方程建立含有干扰预见的增量式全驱系统预测模型,并获得多步超前预测用以最小化目标函数,进而得到最优抗干扰跟踪控制器. 进一步的分析构建确保闭环系统稳定性与跟踪性能的充分条件,该条件简单易行、便于在实际应用中推广. 最后,以航天器姿态控制为例,验证全驱系统抗干扰预测控制方法的有效性. 与文献 [10-15,18-21] 相比,本文的优势总结如下: 1)与文献 [10-15,18-21] 相比,本文利用差分算子及其高阶形式设计高阶干扰观测器,进而在低保守性干扰假设下实现未知外部干扰的精确估计; 2)与文献 [18-21] 相比,本文提出的全驱系统抗干扰预测控制律主动将干扰预见嵌入预测模型,有效地提高对未来干扰动态的预见性和对未来系统行为预测的准确性,从而在本质上增强了预测控制律的抗干扰能力.
符号说明: ℵx与ℵv为系统状态和控制输入的预测时域; Ts为采样周期; q为时间算子,即对于任意信号 ϖ(k),qµϖ(k)= ϖ(k+µ), µ ∈ ; ∆ = 1−q −1 为差分算子,则∆ϖ(k)= ϖ(k)−ϖ(k−1)表示ϖ(k)的增量; 表示差分算子的N阶形式,其中 为组合数; (k+µ|k)为ϖ(k)基于k 时刻的第µ步超前预测.
2 问题描述
基于文献 [22],一类离散时间受扰非线性全驱系统考虑如下:

(1)
其中:
系统(1)中: 分别表示状态向量、控制向量与干扰向量; 和 分别表示x(k)与u(k)的初值; nx,nu为正整数; 和 为已知的非线性向量函数.
假设 1 [23] 映射建立了从u(k)到M(k)的微分同胚,且存在逆映射
假设 2 [20] 1)x(k)在控制设计中是可获得的; 2)w(k)是未知但有界的干扰.
针对受扰非线性全驱系统(1),提出如下的全驱系统抗干扰预测控制方案:
(2)
其中:用于抵消系统(1)中的非线性项; 用于调节闭环系统性能,为待定的调节参数, [0,nx] 为整数; 则是由全驱系统抗干扰预测控制设计的抗干扰跟踪控制律. 将控制律(2)代入系统(1),可得如下的闭环系统:
(3)
为求解抗干扰跟踪控制律v(k),设计下述目标函数:
(4)
其中:
式(4)中: µ = 0,1,· · ·,ℵv分别表示状态向量x(k)和抗干扰跟踪控制增量∆v(k)的第µ步超前预测; r(k)表示给定的参考输入信号; R(k + ℵx)表示参考输入的多步超前序列; W1 ≻ 0,W2 ≻ 0 为权重系数矩阵. 在目标函数(4)中,第1项通过实现状态预测和参考输入的趋近来保证跟踪控制性能; 第2项则从算法设计的角度出发,提出了关于跟踪控制增量的变化速率和变化幅值的软约束,从而降低了设备的机械损耗,延长了使用寿命,有助于控制律的物理实现.
问题 1 给定满足假设 1 和假设 2 的受扰非线性全驱系统(1),本文通过最小化目标函数(4)设计如式(2)的全驱系统抗干扰预测控制律u(k,r(k)),使得闭环系统(3)实现有界稳定和跟踪性能,即
1)∀k ≥ 0,若 <∞,则 <∞;
2)
3 主要结果
3.1 高阶干扰观测器设计
针对受扰非线性全驱系统(1),设计如下的高阶干扰观测器:
(5a)
(5b)
其中为待定的干扰观测器增益.
定理 1 令表示干扰估计误差,则对于充分小的正数 ,当 时,干扰估计误差 ew(k)满足(即 )的充分条件是存在干扰观测器增益使得为关于q 的Schur多项式矩阵,其中:
(6a)
(6b)
(6c)
(6d)
证令表示状态估计误差,将式(1)与式(5b)作差可得
结合时间算子q,上式可表示为
(7)
基于差分算子∆,任意的干扰w(k)均可展开为
(8)
其中为干扰展开的最高阶次. 将式(8)与式(5a)作差可得
其中∆⌊0,Nd⌋与(∆⌊0,Nd⌋)见式(6c)与式(6d). 将式(7)代入上式可进一步推得
其中见式(6b),且上式可进一步表示为
其中见式(6a).
由于为Schur多项式矩阵且干扰w(k)有界,且对于充分小的正数 ϵ,时,这表明ew(k)可以收敛到由湮灭项定义的零的小邻域内,即证毕.
注 1 系统(1)可以进一步拓展为
(9)
其中为包含未建模动态、不确定动态、参数摄动等未知情形的模型不确定性. 基于文献 [20],集总干扰定义为 则系统(9)可表示为
本文提出的高阶干扰观测器(5a)仅需干扰有界但未知的低保守性假设,便能实现外部干扰的精确估计. 因此,当集总干扰d(k)满足该假设时,高阶干扰观测器(5a)能实现同样的干扰估计性能,故而高阶干扰观测器(5a)在抗干扰控制中具有较强的可扩展性和实用性.
3.2 全驱系统抗干扰预测控制设计
基于时间算子q,闭环系统(3)可以等价转换为下述多项式系统:
(10)
其中:. 根据文献 [16],Diophantine方程给出如下:
其中 和 是由闭环系统多项式矩阵 和预测时域ν 决定的多项式系数矩阵,具体地,在式(10)两边同乘 可得
将Diophantine方程代入上式,可得到如下的增量式全驱系统预测模型:
(11)
其中是由高阶干扰观测器(5a)生成的干扰估计增量预见值.
当预测时域ν = 1,2,· · ·,ℵx时,基于增量式全驱系统预测模型(11),状态向量x(k)的多步超前预测为
当故而因此,上述状态向量x(k)的多步超前预测可整理为
(12)
其中且
同时,∆v(k)的阶梯式约束定义如下:
其中:为阶梯因子矩阵,则其中,因此,状态预测(12)可进一步表示为
(13)
为求解最优抗干扰跟踪控制增量 ∆v(k),令,结合式(13),可得
其中. 上式进一步可推得
其中:
则最优抗干扰跟踪控制增量为,即
(14)
注 2 在控制律(2)中,通过镇定系统来调节闭环系统(3)的控制性能. 同时,还通过构建反馈校正来提升关于 x(k)的预测模型(11)的预测精度. 而求解Aµ的关键性原则是构建矩阵 使之相似于Schur矩阵Λ [17],其中
则Aµ可由下式求得(详见文献 [18])
(15)
其中,Z为任意的自由参数矩阵. 进一步地,给出下述算法 1(见表1)来求解完整的全驱系统抗干扰预测控制律.
注 3 在式(5a)中,Nd表示干扰观测器的最高阶次. 与以往设计的干扰观测器 [10-15,18-21] 相比,本文提出的高阶干扰观测器(5a)可在干扰未知但有界的低保守性假设下实现精确估计. 随着Nd逐渐增大,干扰估计误差可以确保收敛到零的较小收敛域内,进而显著地提高干扰估计的精度,即Nd→ ∞时,ew(k)→ 0. 因为干扰w(k)是有界的,则当Nd充分大时,干扰估计误差ew(k)即能收敛到零的期望小邻域内. 与文献 [18-21] 相比,本文提出的全驱系统抗干扰预测控制在预测模型(11)中引入了干扰预见项 有效地提高对未来干扰动态的预见性和对未来系统行为预测的准确性,从而在本质上增强了预测控制律的抗干扰能力.
3.3 稳定性和跟踪性能分析
令e(k)= x(k)− r(k)表示跟踪误差,则问题1中的条件1和条件2可转化为 因此,闭环系统(3)的有界稳定性和跟踪性能可等价为: 当k→ ∞时,e(k)→ 0. 据此,给出下述定理来分析闭环系统(3)的有界稳定性和跟踪性能.
定理 2 闭环系统(3)实现有界稳定和跟踪性能的充分条件是下述条件同时成立.
1) 使得式(6a)中的 是Schur多项式矩阵;
2) 使得 = 0且Ψ(q)是Schur多项式矩阵,其中
(16)
且
表1算法1 全驱系统抗干扰预测控制算法
Table1Algorithm 1: Anti-disturbance predictive control algorithm for all-drive system
证基于文献 [20],不失一般性地,假设 r(·)= r,则 ∆e(k)= ∆x(k),且
(17)
由式(10)可得
由于使得0,最优抗干扰跟踪控制增量可由式(14)求得. 将式(14)代入上式可得
(18)
根据干扰观测器(5a)可得
其中,则
(19)
其中 由式(19)和差分算子∆可得
因此,式(18)中可表示为
(20)
其中:
将式(20)代入式(18),可得
(21)
其中
将式(21)代入式(17)可得
(22)
其中Ψ(q−1)见式(16).
因为∃Lµ使得是Schur多项式矩阵,根据定理1可得:即当Nd → ∞时,∆ew(k)→ 0. 因此,当Nd→∞时,Σ(ew(k))→0,则系统(22)退化为 e(k + 1)= Ψ(q−1 )e(k). 又因为 ∃W1 ≻ 0,∃W2 ≻ 0,∃γ >0,使得Ψ(q −1)同样为Schur多项式矩阵,则当k → ∞时,e(k)→ 0.
综上,系统(22)的渐近稳定性得以实现,即闭环系统(3)是有界稳定的且能实现跟踪性能. 证毕.
4 数值仿真
本节采用航天器姿控制的数值仿真来验证所提出方法的有效性. 航天器姿态控制示意图及相关坐标系见图1,其中,和分别表示地球惯性坐标系与航天器体坐标系. 假设体坐标系与其惯性主轴重合,由文献 [24] 可知,三轴航天器的简化姿态运动方程为
(23)
其中: ϕ,θ,ψ分别为滚动角、俯仰角、偏航角; Ix,Iy,Iz 分别为航天器绕 3个坐标轴的转动惯量; Tx,Ty,Tz 分别为3个坐标轴方向的控制力矩; wx,wy,wz分别为3个坐标轴方向的干扰力矩; 为轨道角速度,µg为地球引力常数,Rts为轨道半径.
图1航天器姿态控制及其坐标系
Fig.1Spacecraft attitude control and its coordinate systems
利用中心差分
与离散化系统(23)可得到离散域内航天器姿态运动的全驱系统模型,即
采样周期Ts在相关表述中被省略. 令上式整理为
(24)
在系统(24)中,且
表2系统(24)的相关参数
Table2The related parameters of system (24)
情形 1 (无干扰)在此情形下,w(k)= 0. 基于式(2),全驱系统预测跟踪控制控制律设计为
(25)
其中: 由于没有干扰,预测模型(11)中不引入干扰预见项,即
(26)
结合定理 2,预测控制参数选取为: ℵχ = 5,ℵv = 3,W1 = I,W2 = 20I,γ = diag{2,2,2}.
情形 2(有干扰、无干扰预见)在此情形下,干扰w(k)按表1选取. 由于不考虑干扰预见,控制律选用式(25)且预测模型采用式(26),相应的设计参数与情形1相同.
情形 3 (有干扰、有干扰预见)在此情形下,干扰w(k)仍按表1选取,控制律仍选用式(25). 但由于考虑干扰预见,预测模型采用式(11),故而要先设计高阶干扰观测器. 选取Nd = 2,基于式(5),针对系统(24)的高阶干扰观测器设计如下:
(27)
根据定理 1,L0 = 0.656 1, L1 = 1.603 8,L2 = 2.600 1,L3 = 2.6,其他设计参数与情形1相同. 干扰估计结果见图2,3种情形下航天器姿态控制仿真结果见图3–4.
图2基于高阶干扰观测器(27)的干扰估计
Fig.2The disturbance estimations based on high-order disturbance observer (27)
图33种情形下基于控制律(25)的航天器姿态控制
Fig.3The spacecraft attitude control by using the control (25) under three cases
图2表明高阶干扰观测器(27)可以在低保守性假设下实现外部干扰的精确估计,从而说明了本文提出的高阶干扰观测器的有效性和优越性,并为构建干扰预见奠定了良好基础. 图3意味着本文提出的含有干扰预见的控制律(25)可以使有干扰情形下的跟踪控制性能与无干扰情形下的跟踪控制性能相同,从而确保有干扰情形下航天器姿态跟踪控制与机动任务顺利完成. 图4则表明3种情形下控制输入的消耗几乎相同,进而说明本文提出的含有干扰预见的控制律(25)能以相近的控制输入实现更好的抗干扰跟踪控制性能.
通过3种情形下航天器姿态控制的数值仿真,充分说明了本文提出的全驱系统抗干扰预测跟踪控制方法的有效性和优越性,为全驱系统抗干扰预测跟踪控制的在航天器姿态控制的实际应用提供了理论支撑和仿真基础.
图43种情形下控制律(25)产生的控制输入
Fig.4The control inputs generated by the control (25) under three cases
5 结论
本文研究了一类受扰非线性全驱系统的抗干扰跟踪控制问题,提出了全驱系统抗干扰预测跟踪控制方法. 该方法设计了高精度的高阶干扰观测器来实现外部干扰的精确估计,进而构建了含有干扰预见的全驱系统抗干扰预测控制方法来确保跟踪控制性能. 进一步的分析提出了闭环系统实现有界稳定和跟踪性能的充分条件,该条件简单易行、便于在实际工程中应用和推广. 本文的亮点之一是在低保守性干扰假设下设计了高精度的高阶干扰观测器以实现外部干扰的精确估计,这在工程中更具实用性; 亮点之二是通过引入干扰预见项,在本质上增强的全驱系统预测控制的抗干扰能力.
本文探讨了受扰非线性全驱系统抗干扰预测控制的基本问题,为后续相关研究的开展奠定了坚实基础. 未来工作将致力于多源干扰下非线性全驱系统的抗干扰预测控制,受扰非线性全驱多智能体系统的抗干扰预测协同控制等理论与应用研究.