受概率约束的离散时变不确定系统的随机模型预测控制
doi: 10.7641/CTA.2025.40522
张逸刚 , 黄道平 , 刘乙奇
华南理工大学自动化科学与工程学院自治系统与网络化控制教育部重点实验室, 广东 广州 510640
基金项目: 国家自然科学基金重大研究计划–培育项目(92467106), 国家自然科学基金面上项目(62273151, 62073145), 广东省基础与应用基础研究基金项目(2021B1515420003), 广东省普通高校创新团队项目(2023KCXTDO72), 先进造纸联合实验室开放课题项目(20241645)资助.
Stochastic model predictive control for discrete time-varying uncertain systems with chance constraint
ZHANG Yi-gang , HUANG Dao-ping , LIU Yi-qi
The Key Laboratory of Autonomous Systems and Networked Control, Ministry of Education, the School of Automation Science & Engineering, South China University of Technology, Guangzhou Guangdong 510640 , China
Funds: Supported by the National Natural Science Foundation of China (NSFC) Major Research Plan-Cultivation Project (92467106), the National Natural Science Foundation of China (62273151, 62073145), the Guangdong Basic and Applied Basic Research Foundation (2021B1515420003), the Guangdong Generic Institution Innovation Team Research Foundation (2023KCXTDO72) and the Open Project of the Advanced Papermaking Joint Laboratory (20241645).
摘要
在模型预测控制方法(MPC)中, 模型的不确定性主要源于外部干扰、输入噪声和时变参数等因素, 这些因素可能导致预测误差, 从而, 降低控制性能. 本文针对一类具有加性扰动的离散时变系统, 提出了一种新型随机模型预测控制(SMPC)算法. 该算法能够在特定约束条件下有效预测系统的未来行为, 并优化控制输入, 以实现预定的性能目标. 为实现本文所提出的控制方法, 本文采用李雅普诺夫稳定性理论保证系统的闭环稳定性, 运用凸组合技术应对系统参数的时变性, 并利用凸优化方法计算名义系统的控制增益. 此外, 使用逆累积分布函数将概率约束转化为确定性约束. 最后, 文章通过数值仿真实验对本文所提出的方法进行验证. 仿真结果表明, 随机模型预测控制策略能够更好地适应随机变化的环境, 并在面对随机干扰时保持较高的控制精度, 并且具有相对较低的保守性.
Abstract
The model uncertainty in the model predictive control (MPC) method mainly arises from factors such as external disturbances, input noise, and time-varying parameters, all of which may lead to prediction errors and thus reduce control performance. This paper proposes a novel stochastic model predictive control (SMPC) algorithm for a class of discrete time-varying systems with additive disturbances. The algorithm can effectively predict the system’s future behavior and optimize the control input under specific constraints to achieve predetermined performance goals. To implement the control method proposed in this paper, the Lyapunov stability theory is employed to ensure the closed-loop stability of the system, convex combination techniques are used to address the time-varying nature of the system parameters, and convex optimization methods are utilized to calculate the control gain of the nominal system. Additionally, the inverse cumulative distribution function is used to transform probabilistic constraints into deterministic constraints. Finally, the paper verifies the proposed method through numerical simulation experiments. The simulation results show that the SMPC strategy can better adapt to the randomly changing environment, maintain high control accuracy when facing random disturbances, and has relatively low conservatism.
1 引言
随着我国工业化技术水平的不断提高,智能制造系统愈加复杂的情况下,对于安全性、稳定性以及效率性的要求亦不断升高. 传统控制技术在应对当前不断发展的需求时表现出了诸多局限性. 例如典型的比例–积分–微分( proportional-integral-derivative,PID)控制方法对系统未来行为的预测能力较弱,参数整定过程较为复杂,并且在设计中往往难以同时兼顾和满足所有约束条件. 因此,多种先进控制策略相继被提出,如鲁棒控制 [1]、滑模控制 [2]、神经网络控制 [3] 以及模糊控制 [4] 等. 然而,这些控制技术在面对复杂系统时,往往难以平衡多样化且相互冲突的控制目标,尤其是在严格的物理限制和操作约束下表现出一定的局限性. 在此背景下,模型预测控制(model predictive control,MPC)被认为是一种理想的解决方案,它通过滚动时域优化框架,在每个采样周期求解包含系统动态模型、输入/状态约束及目标函数的有限时域最优控制问题,确保系统在有限的预测期限内能够稳定收敛至预期目标 [5-7],此外,MPC不依赖特定模型结构并且融合多种模型 [8-9] . 随着计算技术的发展和优化算法的不断改进,MPC的计算效率显著提升,在过去几十年中,MPC 已被广泛应用于过程控制领域,并发展成为一种兼具高性能与优化能力的先进控制策略 [10-12] . 然而,当系统受到不可忽略的随机扰动(如过程噪声、测量噪声或外部环境干扰)时,传统MPC的预测模型与实际动态过程间将产生显著偏差,导致控制性能下降,甚至失稳.
考虑到系统易受外界扰动的影响,研究人员提出了鲁棒模型预测控制(robust MPC,RMPC)策略,以应对模型中的参数不确定性和外部扰动. 例如,文献 [13] 介绍了一种新型RMPC算法,旨在处理受到有界干扰和输入限制影响下的时变不确定非线性系统. 然而,尽管目前已有大量关于RMPC的研究 [14-17],包括前述文献在内,这些研究通常未充分考虑随机干扰的分布特性和动态波动,导致控制策略偏向保守. 除此之外,在许多MPC应用案例中,硬性约束也容易导致控制器设计过于保守,从而降低了系统的性能及效率 [18] . 相比之下,概率约束为上述问题提供了一种有效的解决方案. 概率约束允许在一定概率范围内接受对约束的有限违背,并要求特定随机变量满足某一条件的概率达到或超过预设阈值. 这种方式能够以一定概率保证安全性或性能要求的实现,从而有效避免硬性约束带来的过度保守设计问题 [19-20] . 在这一背景下,随机模型预测控制(stochastic MPC,SMPC)策略应运而生,SMPC在传统MPC框架基础上,结合概率论、数理统计及随机过程等数学工具,将系统内在的随机干扰特性(如概率密度函数、期望值、方差等)有机地融入控制器设计中 [21-22]. SMPC利用概率统计信息和随机优化方法,为复杂动态系统提供了一种有效的控制框架,能够有效应对延迟、噪声和不确定参数等多种不确定性,从而实现对复杂动态系统的精准动态跟踪与控制. 因此,开发高效的SMPC策略,不仅具有重要的实际应用价值,同时也对理论研究的深化与技术应用的推广具有重要意义.
此外,在自动控制领域,时变系统的研究一直是一个复杂且重要的话题,由于时变系统的参数(如质量、阻尼系数、刚度、增益等)或结构随着时间变化,这为 MPC 的设计与实施带来额外的挑战 [23-24],这就要求控制策略必须能够灵活适应这种参数变化. 传统的鲁棒控制方法在处理此类问题时,往往因过度简化问题而损失控制精度,或因计算复杂度高而难以实现实时控制. 在本研究中,文章采用凸组合方法对时变系统参数进行近似,将复杂的时变行为分解为若干静态系统的组合. 这一方法不仅显著降低了计算复杂度,还提高了模型对时间变化的适应性和准确性,同时简化了模型的复杂度,使控制策略的实施过程中更加高效,尤其在实时应用场合中表现出卓越的性能 [25-27] .
综上所述,本研究的核心目标是,在随机干扰和时变系统参数不确定性等复杂环境下,优化系统的稳定性和控制性能,同时满足概率约束条件. 为应对这一挑战,本文提出了一种新型SMPC策略,以实现对目标变量的精确控制,并有效降低系统的保守性. 本文的主要贡献可以归纳为以下几点:
1)与文献 [28] 相比,本文采用凸组合方法拟合时变系统参数. 通过线性组合,凸组合将复杂的时变问题简化为一系列更易处理的子问题,从而降低计算复杂度. 同时,可以利用现有的高效算法(如梯度下降法、内点法等)进行求解,这在实际应用中具有良好的可操作性;
2)本文构建线性矩阵不等式(linear matrix inequality,LMI)约束,并结合凸组合技术,能够在同一优化框架内同时处理多个目标和约束. 此外,基于线性代数和控制理论的LMI方法提高了结果的可靠性;
3)与处理概率约束的松弛技术相比 [29],本文采用逆累积分布函数(inverse cumulative distribution function,ICDF)方法,能够更精确地描述和处理约束条件,并适用于任意分布. 相反,松弛技术通常需要对问题进行一定的简化或假设,这使得在SMPC算法的优化问题中处理概率约束变得更加复杂.
2 符号说明
∗是对称矩阵中的对称项; I表示具有合适维度的单位阵; Z是非负整数集合; R是实数域集合; P <0,P ≤0(P >0,P≥0)为矩阵 P 的负定、半负定(正定、半正定); P −1P T)为矩阵P的逆矩阵(或者转置); Hj 表示矩阵H的第j行; 表示空集; tr{P} 表示矩阵 P的迹; E [ωτ ] 表示对随机变量ωτ求期望值; 2AB表示 AB + BTAT; ωτNµσ2)表示随机变量服从均值为µ,方差为σ 2的正态分布.
3 问题陈述
考虑以下带有加性扰动的离散时变系统:
xτ+1=A(τ)xτ+B(τ)uτ+Gωτ,
(1)
其中: xτRnu是系统状态; uτRnu表示系统控制输入,并且满足条件 xτX ={xτRnx | Hxτh},uτU ={uτRnu |Duτd},HD是具有合适维度的常数矩阵,h d是给定常向量; Aτ),Bτ)是具有合适维度的系统参数矩阵,并且包含有界时变函数; G是系统常参数矩阵; 系统受到独立同分布(independent and identically distributed,i.i.d)的过程噪声 {ωτ }τ0 影响,并且其概率分布函数(probability distribution function,PDF)已知,或可以根据数据进行经验估计. 为后续讨论奠定基础,在此引入以下关键定义与假设.
假设 1 在时间τ时刻的系统状态xτ是可测的,且矩阵对(Aτ),Bτ))是可控的.
假设 2 加性扰动ωτ W是独立同分布(i.i.d)的零均值随机变量,并且服从截断正态分布,其支撑集W是一个包含原点的有界凸集.
假设 3 假定存在一个有界集合,该集合包含时变参数Aτ),Bτ),并且时变参数在其变化范围内所构成凸包在技术上是可行的.
由于Aτ),Bτ)包含有界时变函数,本文根据时变参数变化范围,采用凸组合方法构建凸包,得到状态方程系数矩阵的多胞体模型
Ω=CovA1 B1A2 B2AL BL,
(2)
并且有
[A(τ)B(τ)]=m=1L λmAm Bm,
(3)
其中L是常量,并且 m=1L λm=1,0λm1.
注 1 在假设3中,文章构建凸包以描述有界时变函数. 通过使用凸组合方法,将复杂的时变系统转化为更易于分析和求解的线性系统,这有助于运用线性控制理论进行设计. 同时,具备多面体支撑集的约束可以在MPC算法中被重新表述为计算效率更高的LMI约束.
假设 4 给定正定矩阵 QcRc,对于时变系统(1),存在正定矩阵P和反馈增益K使得下列不等式成立:
ΦTPΦ-P-Qc+KTRcK
(4)
其中Φ = Aτ)+ BτK.
定义 1(鲁棒正不变集(robust positively invariant,RPI))给定集合Xω,对于扰动系统 xτ+1 = fxτωτ ),若对于所有的状态 xτXω,扰动 ωτ W,有 xτ+1Xω,∀τZ,则集合是一个鲁棒正不变集.
4 随机模型预测控制器设计
在这部分中,文章将介绍SMPC优化问题的预测动态结构,首先将在采样时间τ时刻预测i步的预测状态和预测输入分别标记为 xi|τui|τi = 1,2,· · ·,N − 1),N为预测步长,∀τNZ; 此外,考虑到随机扰动ωτ,将目标函数定义为期望形式,并针对噪声序列{ωτ }τ0取值,在τ时刻预测N步的期望目标函数构建如下:
J(τ)=ELfxNτ+i=0N-1 Lxiτ,uiτ,
(5)
其中
Lxiτ,uiτ=xiτTQcxiτ+uiτTRcuiτ
(6)
表示阶段代价函数,并且
LfxNτ=xNτTPxNτ
(7)
表示终端代价函数,式中的QcRcP表示优化问题中的权重,其中矩阵P满足条件(4). 此外,考虑到不可预测的随机因素ωτ的影响,文章引入概率约束,表达式如下所示:
PrHjxi+1τhj1-βj,j=1,2,,nsZ,
(8)
其中: Hj是常数矩阵H的第j行,hj为给定标量,βj表示违反概率.
在给定采样时间τ可用的系统信息的基础上,SMPC旨在概率约束,输入约束以及随机预测模型的影响最小化成本的期望值(5),因此可以将其表述为以下优化问题:
minuiτ J (τ) ,
s.t. xi+1τ= A(τ)xiτ+B(τ)uiτ+Gωτ+i PrHjxi+1τhj1-βj xiτX,uiτU,xNτXf,
(9)
其中Xf是终端不变集,并且假定其是一个鲁棒正不变集(robust positively invariant set,RPI). 考虑到预测模型存在附加随机噪声,为了分离不确定性对系统的影响,将预测状态拆分为确定性项zi|τ 和零均值随机误差项ei|τe0|τ = 0(almost surely,a.s.),并且误差服从正态分布且具有概率ei+1|τPe. 因此,预测状态xi|τ 可改写成下列等式:
xiτ=ziτ+eiτ,e0τ=0 (a.s.) ,
(10)
此外,本文将受制于机会约束的控制任务制定为一个以滚动方式解决的约束优化问题,考虑具有N步预测范围的SMPC策略,通过采用误差反馈,不确定系统的预测控制策略可以表示为
uiτ=Keiτ+viτ,
(11)
其中: 控制器增益K是通过离线计算获得,并且可以通过求解线性二次调节器(linear quadratic regulator,LQR)问题来实现; vi|τ 是与zi|τ 对应的标称系统的预测控制输入; 标称系统控制输入vi|τ 可以表示如下:
viτ=Kziτ+ciτ,
(12)
其中ci|τ 是滚动时域最优控制问题中的决策变量. 基于预测控制律ui|τ =Kei|τ +vi|τvi|τ =Kzi|τ +ci|τ,标称状态和随机误差的系统动态则可以表示为
zi+1τ=A(τ)ziτ+B(τ)viτ,
(13)
ei+1τ=Φeiτ+Gωτ+i,
(14)
其中Φ = Aτ)+ BτK是Schur稳定的. 此外,概率约束(8)可以根据式(10)改写为
PrHjzi+1τhj-Hjei+1τ1-βj,
(15)
或者
Prηjhj-Hjei+1τ1-βj,
(16)
其中 ηj 表示一个待确定的上界. 该边界确保当 Hj zi+1|τhj Hj ei+1|τ 时满足概率约束(8). 因此,结合式(10)和(16),概率约束通过下列条件保证:
PrHjei+1τhj-ηj1-βj,
(17)
基于逆累积分布函数F −1 (·)和ei+1|τ 的概率分布,可以求出上界
Hjzi+1τF-11-βj=ηj.
(18)
注 2 ICDF 适用于应用于任何有定义的累积分布函数(cumulative distribution function,CDF)的随机变量,包括连续分布、离散分布、单峰或多峰分布. 然而,对于某些复杂的分布以及未知分布的随机变量无法直接使用. 此外,某些概率分布可能存在截断或有限性,例如在特定范围内界定的分布,这可能影响ICDF的有效性.
此外,将式(10)代入期望代价函数(5),则式(5)可改写为
J(τ)=Ei=0N-1 ziτTQcziτ+2ziτTQceiτ+eiτTQceiτ+viτTRcviτ+2viτTRcKeiτ+eiτTKTRcKeiτ+zNτTPzNτ+2zNτTPeNτ+eNτTPeNτ
(19)
考虑到E [ωτ ] = 0,所以带有ei|τ的相关期望值均为0. 则可以推出下列等式:
J(τ)=i=0N-1 ziτTQcziτ+viτTRcviτ+zNτTPzNτ+a,
(20)
其中a = Ei=0N-1 eiτTQc+KTRcKeiτ+eNτTPeNτ 是与控制无关的协方差项,所以该协方差项可以在求解期望优化问题可以被省略,那么只需求解下列代价函数:
J~τ=i=0N-1 ziτTQcziτ+viτTRcviτ+zNτTPzNτ,
(21)
结合上述分析,优化问题(9)则可以改写为下列形式:
minciτ J~τ,
s.t. zi+1τ=A(τ)ziτ+B(τ)viτei+1τ=Φeiτ+Gωτ+iziτZi,viτVi,zNτZf,
(22)
其中Zi=ziτHjzi+1τηjηj是通过ICDF求出的上界值. 对于控制输入的硬约束,采用基于tube的策略 [10],得到相应的约束集合结果如下:
Vi=UKi=0N-1ΦiGW,
(23)
优化问题(22)是一个具有线性约束的二次规划问题,可以通过现成的软件包(例如CVX)来求解; 概率约束和输入约束通过式(22)中的集合ZiVi保证. 在接下来的部分中,将讨论优化问题的递归可行性和稳定性. 首先,给出终端集定义:
定义 2(终端集)集合 Zf 对于系统zN|τ +1 = ΦzN|τ + τ+i 被定义为 RPI 集,对zN|τZf zN+1|τZf 并且满足终端约束Hj zN+1|τη~j 和 [DK] j zN+1|τς~jτZ 其中:
η~j=minωτ+i hj-Hji=0N-1 ΦN-i-1Gωτ+i, ς~j=minωτ+i dj-[DK]ji=0N-1 ΦN-i-1Gωτ+i.
在下列定理中,首先给出终端不变集的证明.
定理 1 给定常数矩阵HDQcRc,标量η~ς~ 假设存在正定对称矩阵P,对角矩阵ΛΥ,由Zf定义的椭圆集对于动态系统 zN|τ+1 = ΦzN|τ + τ+N 是正不变的,并且满足约束
Hjzi+1τη~j, [DK]jzi+1τς~j, τZ,
当且仅当矩阵P满足下列条件:
ΦTPΦ-P-Qc+KTRcK
(24)
-ΛHΦ*-P0,εjΛεjη~j2
(25)
-ΥDK*-P0,εjΥεjς~j2,
(26)
其中: j = 1,2,· · ·,ns; εj是单位矩阵的第j行.
证根据式(24)中的不等式有
zNτTΦTPΦzNτzNτTPzNτ1,
由此定义椭球集Zf; 接下来,证明式(25)–(26)提供了满足约束 Hj zi+1|τη~j和[DK] j zi+1|τς~j 的必要和充分条件; 首先,根据上述不等式和约束,可以得到
maxzNτ H~jzNτzNτTPzNτ1=H~jP-1H~jT12,
(27)
其中H~ = ,因此对所有的zN|τZf,当且仅当 H~ jP −1H~jTη~j2HjzN+1τη~j 这些条件可以通过正定对角矩阵上的条件来等表示
H~1P-1H~1T-Λ11 H~nsP-1H~nsT-Λnsns0,
(28)
Λnsns表示对角矩阵Λ的对角线上的元素,这使得下列不等式成立:
H~P-1H~T-Λ0,
(29)
对上式使用Schur补,并结合条件Λjjη~j2,得到
-ΛHΦ*-P0,εjΛεjη~j2,
(30)
同理,对于约束[DK]jzi+1τς~j,得到矩阵
-ΥDK*-P0,εjΥεjς~j2,
(31)
因此,上述定理证明完毕. 证毕.
5 递归可行性和闭环机会约束满足
5.1 递归可行性
定理 2(可行性)考虑时变系统(1)在控制律(11)–(12)的控制下,令Γτ 表示有限时域最优控制问题(22)在时间τ的可行域,如果Γ0,则在给定假设1–4下,有ΓττZ.给定 ΓττZ,需证明 Γτ+1. 假设在τ时刻预测N步的最优控制序列是cN:=c0τ*c1τ*cN-1τ*τ+1c1τ*cN-1τ*τ+1 时刻的最优控制序列定义为 c~N:=c1τ*c2τ*cN-1τ*0,那么根据式(12)和(13),相应的标称状态演变如下:
zi+1τ*=Φziτ*+B(τ)ciτ*,z0τ*=xτ,
(32)
接下来,基于τ + 1时刻的最优解序列推导标称状态演变,在τ + 1时刻有
z~0τ+1=xτ+1=A(τ)xτ+B(τ)uτ+Gωτ=Φxτ+B(τ)c0τ*+Gωτ=z1τ*+Gωτ.
(33)
基于上式(32)–(33),进一步得到以下等式:
z~1τ+1=Φz~0τ+1+B(τ)c~0τ+1=Φz1τ*+Gωτ+B(τ)c1τ*=z2τ*+ΦGωτ,
(34)
根据z~0τ+1=z1τ*+Gωτz~1τ+1=z2τ*+ΦGωτ,通过归纳法得到以下关系:
z~iτ+1=zi+1τ*+ΦiGωτ,i=0,1,,N-1,
(35)
同理,可以得到τ时刻的最优解与τ + 1时刻的候选解之间的关系,如下所示:
v~iτ+1=vi+1τ*+KΦiGωτ,
(36)
在名义系统是稳定的假设下,根据上述条件,可以推导出如下关系:
zi+1τZi+1ziτ+1Zi
(37)
vi+1τVi+1viτ+1Vi,
(38)
接下来,推导出终端时域的候选名义状态,如下所示:
z~Nτ+1=A(τ)z~N-1τ+1+B(τ)v~N-1τ+1=ΦzNτ*+ΦNGωτ
(39)
根据终端集的定义,推导出以下关系式:
zNτ*Zfz~Nτ+1Zf
(40)
接下来,给出式(30)–(31)的可行性证明. 假设在τ时刻控制序列 cN=c0τ*c1τ*cN-1τ* 可行的前提下有
Hjzi+1τηj,i=1,2,,N-1,
(41)
那么,基于上式,要证明Hj zN+1|τηj成立. 首先,根据式(41)有
zN+1τ=ΦzNτ*+B(τ)cNτ*
(42)
由于cNτ*=0并且Φ是Schur稳定的,根据终端集的定义,有HjzN+1τη~j,并且η~ηj,因此,得到下列条件成立:
HjzN+1τη~jηj,
(43)
同理,假设τ时刻控制序列可行,需要证明uN|τU,根据U的定义,即证明[DK] j zi+1|τ ζ~j,结合式(11)可以得到下列条件:
uNτ=KeNτ+vNτ=KΦNe0τ+Ki=0N-1 ΦN-i-1Gωτ+i+vNτ,
(44)
考虑到e0|τ = 0,结合约束[DK] j zN|τζ~j,从式(44)很容易得到vN|τVi ,再结合式(23),得到
uNτU,
(45)
因此,可行性证明完毕. 证毕.
由于附加扰动会产生持续激励,很明显系统不会渐近收敛到原点,而是在原点附近“振荡”,因此,闭环系统稳定性至关重要. 为了确保系统稳定性和收敛性方差有界,本文给出以下定理以提供渐近期望代价函数的界限.
5.2 闭环稳定性
定理 3 考虑时变系统(1),在假设1–4和控制律(11)–(12)下,闭环系统满足二次稳定性条件
limN 1Ni=0N ExiτTQcxiτtrGTPGΣ.
(46)
首先在τ时刻,定义Lyapunov函数
VNxτ,uτ=Ei=0N-1 Lxiτ,uiτ+LfxNτ,
(47)
τ + 1时间处的最优控制序列表示为
uτ+1*:=u1τ*,u2τ*,,uNτ*,
(48)
然后,考虑到cNτ*=0,通过控制序列的最后一个分量替换为KxN|τ来构建次优解决方案,从而得到为在 τ + 1时刻的候选控制序列为
u~τ+1:=u1τ*,u2τ*,,KxNτ,
(49)
其中K满足条件(4),根据定理2的证明,u~τ+1是可行解, τ + 1时刻的代价函数值记为VNxτ+1uτ+1*. 考虑到代价函数的最优性,有
VNxτ+1,uτ+1*VNxτ+1,u~τ+1,
(50)
此外,根据式(47)定义的Lyapunov函数,有
VNxτ+1,u~τ+1=VNxτ,uτ*-Ex0τTQcx0τ+u0τ*Qcu0τ*+ExNτTQcxNτ+KxNτTRcKxNτ-ExNτTPxNτ-xN+1τTPxN+1τ,
(51)
其中
xN+1τ=A(τ)xNτ+B(τ)uNτ+Gωτ+N=A(τ)xNτ+B(τ)KxNτ+Gωτ+N=ΦxNτ+Gωτ+N,
(52)
考虑到Lyapunov代数方程(4)中xN|τωτ+N相互独立,根据参考文献 [30] 中定理1的证明过程,式(51)可简化为
VNxτ+1,u~τ+1-VNxτ,uτ*=-Ex0τTQcx0τ+u0τ*TRcu0τ*+trGTPGΣ,
(53)
其中Σ是协方差矩阵. 结合式(50)和式(53),能够得到
VNxτ+1,uτ+1*-VNxτ,uτ*-Ex0τTQcx0τ+u0τ*TRcu0τ*+trGTPGΣ,
(54)
然后,通过取式(54)两边的极限,当N → ∞时,可以得出
limN 1Ni=0N ExiτTQcxiτ+uiτ*TRcuiτ*trGTPGΣ,
(55)
这意味着
limN 1Ni=0N ExiτTQcxiτtrGTPGΣ,
(56)
因此,证明了闭环系统是二次稳定的. 证毕.
定理 4 给定已知权重矩阵QcRc,假设存在合适维度的正定对称矩阵P,并满足下列线性矩阵不等式条件:
P-1>0,
(57)
-P-1P-1AmT+BmYTQcRc*-P-100**-I0***-I0,
(58)
其中Qc=P-1Qc12Rc=YTRc12Y=KP-1 则Lyapunov条件(4)能够被上述条件保证,矩阵P和名义系统增益K可以通过上述LMI求出.
首先对条件(58)左乘和右乘对角矩阵 diag{PIII}和它的转置进行合同变换,再根据 Schur补引理,得到下列条件:
Am+BmKTPAm+BmK-P-Qc+KTRcK,
(59)
∀(AmBm)∈ ,根据假设3,有
ΦTPΦ-P-Qc+KTRcK,
(60)
因此,假设4被上述条件保证,定理证明完毕. 证毕.
6 数值仿真
6.1 公式的应用环境
为了凸显所提出方法有效性和优势,在本节中,将本文提出的SMPC策略应用于一个角度定位系统(如图1所示)进行验证. 首先,假设天线和移动物体之间的角位置以及天线的角速度是可测量的. 将上述系统建模为一个受外界扰动的时变系统,其状态空间模型如下所示:
xτ+1=1.10.10ξxτ+1 00 1uτ+1 00 1ωτ,
(61)
其中ξ = 1.2 − 0.1φτ),参数φτ)与天线旋转部件的粘性摩擦系数成正比,并假定在[−1,1]内随时间任意变化. 由于−1 ≤ φτ)≤ 1,根据第2 节中的假设3 和条件(2)–(3),可将Aτ)转化为多胞体模型. 因此,包含时变参数的系统矩阵由下列可以常数矩阵拟合:
A1=1.10.10.1.3,A2=1.10.10.1.1,
(62)
其中给定凸组合系数λ1 = 0.5,λ1 = 1 − λ2; 给定初值x0 = [0.1 0.05]T,优化权重矩阵Qc = diag{0.01,0.01},Rc = diag{1.0,1.0},首先可以通过求解定理4 中LMI 得到满足条件(4)的反馈增益 K 和终端权重矩阵P,求解结果如下:
K=-0.7317-0.0618-0.0558-0.8667, P=0.5609-0.0202-0.02020.4621.
然后,给定随机扰动服从以下正态分布 ωτ1N(0,0.04),ωτ2N(0,0.03),并且假定两扰动之间相互独立. 如图2给出的正态分布曲线.
1角度定位系统
Fig.1Angle positioning system
2随机变量的正态分布曲线
Fig.2Normal distribution curves of the random variable
然后,本文给定违反概率β1 = 0.5,β2 = 0.2; 约束上界h1 = 0.05,h2 = 0.02; 设定预测步长N = 10,使用MATLAB R2022b中的Yalmip工具箱,采用Gurobi8.0求解器计算优化问题2,考虑到扰动的随机性,通过 30次蒙特卡洛模拟实现得到下列仿真结果. 图3–6分别显示了使用所提出的 SMPC和传统 MPC策略 [31] 在30个时间步长围内得到的30组状态轨迹,如下所示.
3系统状态x1轨迹: 使用MPC进行30次蒙特卡罗模拟
Fig.3System state x1 traces: 30 Monte-Carlo simulations using MPC
4系统状态x2轨迹: 使用MPC进行30次蒙特卡罗模拟
Fig.4System state x2 traces: 30 Monte-Carlo simulations using MPC
5系统状态x1轨迹: 使用SMPC进行30次蒙特卡罗模拟
Fig.5System state x1 traces: 30 Monte-Carlo simulations using SMPC
6系统状态x2轨迹: 使用SMPC进行30次蒙特卡罗模拟
Fig.6System state x2 traces: 30 Monte-Carlo simulations using SMPC
表1列出了本文所提出的SMPC和传统MPC策略下系统状态在不同时刻上的约束违反情况. 在本文提出的方法下,总体违反概率为分别为0.433和0.133,均未超过所给定的违反概率0.5和0.2,而MPC策略未发生任何约束违反; 表2比较了SMPC和MPC的成本函数值,结果显示SMPC的成本函数值为0.017 9,显著低于MPC的成本函数值0.649 8. 这表明SMPC在控制效率和性能方面优于MPC,SMPC利用概率约束,允许一定的约束违反情况,从而可以在不确定性下找到更多的可行解也降低了保守性. 表1违反约束的次
1违反约束的次数与概率
Table1The number and probability of constraint violations
2不同控制策略下的代价
Table2Costs under different control strategies
为与本文所提出的SMPC策略进行对比,文章在相同参数下使用MPC策略进行了30次蒙特卡罗模拟. 从图5–6中可以发现,在硬约束下,状态轨迹未出现违反状态约束的情况; 同时,采用MPC策略的闭环状态轨迹为了抵抗干扰而远离平衡点. 结果表明,与传统 MPC方法相比,SMPC策略能够更好地适应随机变化的环境,并在面对随机干扰时保持较高的控制精度,并且具有相对较低的保守性. 总体而言,仿真结果证明了所提出的SMPC算法在处理带有机会约束的时变不确定系统中的有效性和优势.
注 3 在仿真实验中,SMPC在设计时通过满足概率约束来确保可行性,这使得在不确定条件下依然能够找到有效的控制策略. 相比之下,MPC在面对严格的硬约束时,有时可能难以找到可行解.
7 结论
本研究针对一类具有加性扰动的离散时变系统提出了一种新型SMPC算法,并证实了该算法的可行性与闭环稳定性. 本文采用了凸组合技术来表征时变系统的特性,以及运用ICDF将概率约束转化为更易于处理的形式. 最后,在MATLAB/Simulink环境下进行了仿真实验并与MPC策略进行了比较,验证了本文所提出的控制方案的优越性能. 相较于传统MPC策略,SMPC策略能更灵活地应对环境中的随机变化,并在面临随机干扰时保持高水平的控制精度,同时表现出相对较低的保守性.
在以后的工作中,作者将考虑结合数据驱动的方法,构建机理与数据的双驱动模型,以提高模型准确性并进行深入的研究.
1角度定位系统
Fig.1Angle positioning system
2随机变量的正态分布曲线
Fig.2Normal distribution curves of the random variable
3系统状态x1轨迹: 使用MPC进行30次蒙特卡罗模拟
Fig.3System state x1 traces: 30 Monte-Carlo simulations using MPC
4系统状态x2轨迹: 使用MPC进行30次蒙特卡罗模拟
Fig.4System state x2 traces: 30 Monte-Carlo simulations using MPC
5系统状态x1轨迹: 使用SMPC进行30次蒙特卡罗模拟
Fig.5System state x1 traces: 30 Monte-Carlo simulations using SMPC
6系统状态x2轨迹: 使用SMPC进行30次蒙特卡罗模拟
Fig.6System state x2 traces: 30 Monte-Carlo simulations using SMPC
1违反约束的次数与概率
Table1The number and probability of constraint violations
2不同控制策略下的代价
Table2Costs under different control strategies
LIU K Z, YAO Y. Robust Control: Theory and Applications. Singapore: John Wiley and Sons,2016.
ZHENG Xuemei, SHI Xu, CHEN Xin,et al. Research on finite-time full-order sliding mode control of self-synchronous grid-connected inverter. Control Theory & Applications,2023,40(11):1903-1910.(郑雪梅, 时旭, 陈鑫, 等. 自同步型并网逆变器有限时间全阶终端滑模控制研究. 控制理论与应用,2023,40(11):1903-1910.)
ABDOLRASOL M G M, HUSSAIN S M S, USTUN T S,et al. Artificial neural networks based optimization techniques: A review. Electronics,2021,10(21):2689.
PASSINO K M, YURKOVICH S, REINFRANK M. Fuzzy Control. Menlo Park, California: Addison-Wesley,1998.
SCHWENZER M, AY M, BERGS T,et al. Review on model predictive control: An engineering perspective. The International Journal of Advanced Manufacturing Technology,2021,117(5):1327-1349.
HU J, SHAN Y, GUERRERO J M,et al. Model predictive control of microgrids-An overview. Renewable and Sustainable Energy Reviews,2021,136:110422.
LI Xinchen, ZHAO Feiran, MENG Qinghui,et al. Intelligent model predictive control with efficient FPGA implementation. Control Theory & Applications,2023,40(9):1519-1528.(李星辰, 赵斐然, 孟庆辉, 等. 面向FPGA便捷部署的智能模型预测控制. 控制理论与应用,2023,40(9):1519-1528.)
GROS S, ZANON M, QUIRYNEN R,et al. From linear to nonlinear MPC: Bridging the gap via the real-time iteration. International Journal of Control,2020,93(1):62-80.
MARK C, LIU S. Stochastic MPC with distributionally robust chance constraints. IFAC-PapersOnLine,2020,53(2):7136-7141.
NING C, YOU F. Online learning based risk-averse stochastic MPC of constrained linear uncertain systems. Automatica,2021,125:109402.
CAVONE G, BOZZA A, CARLI R,et al. MPC-based process control of deep drawing: An industry 4.0 case study in automotive. IEEE Transactions on Automation Science and Engineering,2022,19(3):1586-1598.
RAMASAMY V, KANNAN R, MURALIDHARAN G,et al. A comprehensive review on advanced process control of cement kiln process with the focus on MPC tuning strategies. Journal of Process Control,2023,121:85-102.
HE Defeng, HUANG Ju, YU Shiming. H∞ robust model predictive control of time-varying nonlinear uncertain systems. Control and Decision,2014,29(12):2265-2270.(何德峰, 黄骅, 余世明. 时变非线性不确定系统鲁棒模型预测控制. 控制与决策,2014,29(12):2265-2270.)
NUBERT J, KOHLER J, BERENZ V,et al. Safe and fast tracking on ¨ a robot manipulator: Robust mpc and neural network control. IEEE Robotics and Automation Letters,2020,5(2):3050-3057.
REGO R C B, COSTA M V S. Offline output feedback robust antiwindup MPC-LPV using relaxed LMI optimization. European Journal of Control,2023,69:100719.
YAN Z, YAN J, CAI S,et al. Robust MPC-based trajectory tracking of autonomous underwater vehicles with model uncertainty. Ocean Engineering,2023,286:115617.
BUJARBARUAH M, ROSOLIA U, STURZ Y R,et al. Robust MPC ¨ for LPV systems via a novel optimization-based constraint tightening. Automatica,2022,143:110459.
FARINA M, GIULIONI L, SCATTOLINI R. Stochastic linear model predictive control with chance constraints-a review. Journal of Process Control,2016,44:53-67.
BUJARBARUAH M, ZHANG X, TANASKOVIC M,et al. Adaptive stochastic MPC under time-varying uncertainty. IEEE Transactions on Automatic Control,2020,66(6):2840-2845.
MCALLISTER R D, RAWLINGS J B. Nonlinear stochastic model predictive control: Existence,measurability,and stochastic asymptotic stability. IEEE Transactions on Automatic Control,2022,68(3):1524-1536.
MCALLISTER R D, RAWLINGS J B. The stochastic robustness of nominal and stochastic model predictive control. IEEE Transactions on Automatic Control,2022,68(10):5810-5822.
SUN Lei, LIN Xinyou, MO Liping. Multi-objective energy management strategy based on stochastic model predictive control for a plug-in hybrid electric vehicle. Control Theory & Applications,2022,39(12):2274-2282.(孙蕾, 林歆悠, 莫李平. 基于随机模型预测控制的插电式混合动力汽车多目标能量管理策略. 控制理论与应用,2022,39(12):2274-2282.)
XiNG Lijuan, YANG Shizhong. Robust model predictive control for time-varying nonlinear uncertain systems. Computer Simulation,2020,37(11):245-249.(邢丽娟, 杨世忠. 时变非线性不确定系统的鲁棒模型预测控制. 计算机仿真,2020,37(11):245-249.)
PAPADIMITRIOU D, ROSOLIA U, BORRELLI F. Control of unknown nonlinear systems with linear time-varying. The 59th IEEE Conference on Decision and Control(CDC). Jeju, South Korea: IEEE,2020:2258-2263.
ENDOU N, MITSUISHI T, SHIDAMA Y. Convex sets and convex combinations. Formalized Mathematics,2003,11(1):53-58.
SEURET A, LIU K, GOUAISBAUT F. Generalized reciprocally convex combination lemmas and its application to time-delay systems. Automatica,2018,95:488-493.
HU J. Dynamic output feedback MPC of polytopic uncertain systems: Efficient LMI conditions. IEEE Transactions on Circuits and Systems II: Express Briefs,2021,68(7):2568-2572.
NGUYEN H D, KIM D, SON Y S,et al. Linear time-varyingmpcbased autonomous emergency steering control for collision avoidance. IEEE Transactions on Vehicular Technology,2023,72(10):12713-12727.
KOURI D P, STAUDIGL M, SUROWIEC T M. A relaxation-based probabilistic approach for PDE-constrained optimization under uncertainty with pointwise state constraints. Computational Optimization and Applications,2023,85(2):441-478.
LI B, TAN Y, WU A G,et al. A distributionally robust optimization based method for stochastic model predictive control. IEEE Transactions on Automatic Control,2022,67(11):5762-5776.
PING Xubin, LIU Siwei, WU Zongyuan,et al. Quasi-min-max optimization of dynamic output feedback robust MPC. Journal of Xidian University,2022,49(6):164-176.(平续斌, 刘思伟, 吴宗原, 等. 准最小最大优化动态输出反馈鲁棒MPC. 西安电子科技大学学报,2022,49(6):164-176.