系统辨识第18讲.docx

资源描述

系统辨识第18讲.docx

《系统辨识第18讲.docx》由会员分享，可在线阅读，更多相关《系统辨识第18讲.docx（13页珍藏版）》请在冰豆网上搜索。

系统辨识第18讲.docx

系统辨识第18讲

《系统辨识》第18讲要点

第12章系统辨识在自适应控制中的应用

12.1自适应控制基本概念

自适应控制系统（AdaptiveControlSystems）是现代控制理论的一个重要分支。

“大百科”：

能在系统和环境的新息不完备的情况下改变自身特性来保持良好工作品质的控制系统，又称适应控制系统。

20世纪50年代初，为设计高性能飞机自动驾驶仪提出了一种自动调整前馈增益的MIT方案，是最初的自适应控制。

一个典型的比较完善的自适应控制系统包含：

辨识——决策——调整三个部分组成。

自适应控制是本质非线性系统，即：

不可能通过线性化把它近似为线性系统。

自适应控制有两类最基本的类型，即“模型参考自适应控制”和“自校正调节器”，以及在这两类基本类型的基础之上，结合人工智能、人工生命等发展出的新型复杂自适应控制。

12.1.1两类重要的自适应控制及其新进展

●模型参考自适应控制（ModelReferenceAdaptiveControl）简称MRAC

这类系统的难点在于系统稳定性分析，用到李雅普诺夫稳定性和波波夫超稳定性理论。

●自校正调节器（Self-tuningRegulator）简称STR

STR是70年代发展起来的一种随机自适应控制，产生背景是：

工业过程控制由于强随机干扰、模型未知、参数时变、大时滞等因素，导致常规的控制方法效果差。

它是参数在线估计与随机最小方差控制的结合，已有广泛的应用成果，其难点在于收敛性。

●多层结构的智能——自适应控制

将人工智能、专家系统与自适应控制相结合，组成具有多层结构的智能——自适应控制系统，下图示出了一个基于控制系统工程设计和调整经验的专家-自适应控制系统的方案框图（马润津曾凡锋：

“智能控制与智能自动化”，486-491，科学出版社1993）

●神经网络自适应控制

将神经网络与自适应控制相结合构成复杂自适应系统，适用与对多变量、非线性的复杂过程的自适应控制。

神经网络的研究已有进30年的历史了。

神经网络具有以下多方面的优点：

（1）良好的非线性映射能力；

（2）并行分布式处理信息；（3）具有良好的鲁棒性和容错性；（4）有归纳和联想记忆功能；（5）具有自学习、自组织、自适应的能力。

将神经网络与两类基本的简单自适应控制结合起来，构成了“神经网络－模型参考自适应控制”（NNMRAC）和“神经网络-自校正调节器”（NNSTR）。

12.2系统辨识在自适应控制中的应用-自校正调节器（Self-TuningRequlator简称STR）

12.2.1最小方差控制器（MinimalVarianceControl简称MVC）

1、考虑CARMA过程：

（1）

其中：

{（k）}为N（0,1）白噪声，滞后量d1。

A（z-1）=1+a1z-1+…+anz-n

B（z-1）=b0+b1z-1+…+bnz-n（b00）

C（z-1）=1+c1z-1+…+cnz-n

设A、B、C均为稳定多项式（过程稳定且逆稳定），有：

（2）

令：

（3）

其中：

F（z-1）为d项的商多项式，F（z-1）=1+f1z-1+…+fd-1z-d+1（d项），G（z-1）为余数多项式，有n项，G（z-1）=g0+g1z-1+…+gn-1z-n+1（n项）。

例：

A=1-1.7z-1+0.7z-2;C=1+1.5z-1+0.9z-2；d=2;n=2。

可以证明以下恒等式成立：

（4）

2、向前d步最优预报y*（k+dk）

根据式

（2），由式（3），我们有：

由式

（1），我们有：

将此式代入上式，我们有：

利用（4）式，我们有：

（5）

其中F（k+d）项由（k+d）、（k+d-1）、..、（k+1），共计d项组成，均为未来的干扰作用项，与前两项统计无关。

用y*（k+dk）表示k时刻向前d步的最优预报（最小方差预报），即：

E[y（k+d）-y*（k+dk）]2E[y（k+d）-y（k+dk）]2

由（5式），有：

则k时刻向前d步的最优预报为：

（6）

3、最小方差控制率（MVC）

令yr为输出设定值，要求k时刻的控制量u（k）使得：

将y*（k+dk）=yr代入式（6）得出MVC为：

（7）

若yr=0，则：

4、MVC框图

5、MVC的调节误差与方差

定义调节误差为y（k+d）=y（k+d）-yr，由（5）式，将MVC控制率式（7）带入，我们有：

y（k+d）=yr+F（k+d）。

则：

y（k+d）=y（k+d）-yr=F（k+d）

调节误差的方差为：

Ey2（k+d）=E[y（k+d）-yr]2=2E[F（k+d）]2

=2（1+f12+f22+…+fd-12）

因为F（z-1）=1+f1z-1+…+fd-1z-d+1（共d项），可见：

d愈大调节误差的方差也愈大。

6、举例

给定：

，其中：

A=1-1.7z-1+0.7z-2;B=1+0.5z-1;C=1+1.5z-1+0.9z-2；d=2;n=2；由长除法得：

F=1+3.2z-1;G=5.64-2.24z-1；

MVC率，当yr=0时：

当yr0时：

7、MVC小结

●MVC是使向前d步控制方差为最小的随机控制，算法简单，容易实现；

●其本质上是向前d步的最优预报，适用于强随机干扰和大滞后的场合；

●只适用于逆稳定（最小相位）过程，由此限制了它的应用范围；

●指标中仅考虑使得Ey2为最小，没有对u的约束，有可能因导致过大的控制动作而不能实现；

●要求过程模型已知，因此它还不是自适应控制。

12.2.2自校正调节器（Self-TuningRegulator）

参数在线辨识与MVC的结合，1973年首次提出，后经不断改进，并获得广泛应用。

1、STR框图

2、向前d步预报方程

可以通过在线估计A、B、C的参数，由（3）式计算得出G和F，再计算出（z-1）和（z-1），构成STR的显式算法，而更为简洁的是下面隐式直接辨识。

在式（5）中，令：

得以下向前d步预报方程：

y（k+d）=（z-1）y（k）+（z-1）u（k）+w（k+d）（8）

其中：

（z-1）=1+2z-1+…+pz-p+1共p项（p=n）

（z-1）=0+1z-1+…+qz-q共q+1项（q=n+d-1）

即：

y（k+d）=1y（k）+…+py（k-p+1）+0u（k）+1u（k-1）+…+qu（k-q）+w（k+d）

其中：

w（k+d）为预报误差

将式（8）预报方程向后位移d步，得出：

y（k）=（z-1）y（k-d）+（z-1）u（k-d）+w（k）（9）

即：

y（k）=1y（k-d）+…+py（k-d-p+1）+0u（k-d）+

+1u（k-d-1）+…+qu（k-d-q）+w（k）

因为q=d+p-1，所以上式还可写为:

y（k）=1y（k-d）+…+py（k-q）+0u（k-d）+1u（k-d-1）+（10）

+…+qu（k-d-q）+w（k）

3、STR的计算步骤

●在线估计

引入向量：

=[1、…、p、1、…、q]T（2n+d-1）1维

（k）=[y（k）,…,y（k-p+1）,u（k-1）,…,u（k-q）]T

预报方程为：

y（k+d）=0u（k）+T（k）+w（k+d）（11）

或

y（k）=0u（k-d）+T（k-d）+w（k）（12）

由上式（12），用RLS法可在线估计出的参数。

为避免闭环不可辨识问题发生，0不参加在线辨识，而是事先确定的。

●确定控制量u（k）

控制的目标是使得y（k+d）的最小方差预报y（k+dk）等于yr,即：

y（k+dk）=0u（k）+kT（k）=yr

则：

u（k）=[yr-kT（k）]0（13）

4、仿真结果

举一简单例子：

y（k）=y（k-1）+u（k-1）+（k）-0.7（k-1）

这里的：

d=1,A=1-z-1,B=1,C=1-0.7z-1。

解出F=1,G=0.3。

对于参数已知情况下的MVC控制率为：

u（k）=-0.3y（k）,最优反馈系数为0.3。

以下两图给出STR的仿真结果：

STR参数在线估计仿真结果

STR与MVC累计损失函数Vk的比较

5、收敛性

问题：

STRMVC?

已证明：

当p和q足够大、而且（z-1）与（z-1）间无公共因子，则STRMVC（当n∞时）。

6、STR评价

●继承了MVC的特点，简单，好实现，业已产品化。

●适用于参数未知、大滞后、强随机干扰和未知时变的场合。

●只能应用于逆稳定（最小相位）的过程；对u（k）未加约束。

●0需要事先选定，但是仿真结果表明，对0并不要求选定的很准确，有较大的选择范围。

7、应用举例

例1．

矿石破碎机的自校正控制（1976）

由于进料矿石块的大小和硬度的不同，造成强干扰，干扰是不可测的，能够测的是破碎机的功率。

控制的目的是在不造成过载停机的条件下，使得破碎功率维持于接近最大允许功率，以提高产量。

控制量u（k）是进料器松进矿石的流量，输出量y（k）是破碎功率。

采用STR是为了使y以较小的波动而接近最大允许功率。

矿石由进料器到破碎机的传输时滞为40~50秒，再循环回路的传输时滞为70~80秒，进料器和破碎机能近似视为一阶环节，它们的时间常数分别为12秒和20秒，因此系统的时滞相对于时间常数而言是相当长的。

采样间隔取10~20秒，实验得出d=3，p=4，q=3。

自校正调节器方程为：

Δu（k）=[1y（k）+2y（k-1）+3y（k-2）+4y（k-3）

-1Δu（k-1）-2Δu（k-2）-3Δu（k-3）]0

其中：

Δu（k）=u（k）-u（k-1）。

选择0=50（实验表明，0在1~100的宽广范围内取值，都能够得到良好结果。

用带遗忘因子的RLS法在线辨识1、2、3、4和1、2、3（见下图），遗忘因子在启动时取0.95，然后增大到0.99。

实践结果表明采用自校正调节器能够使得破碎功率维持在200KW左右，而采用PI调节器时破碎功率为170KW，即自校正调节器较常规的PI调节器能够提高大约10%的产量。

下图示出两次实验的效果。

12.3广义最小方差控制与自校正控制器

1、广义最小方差控制率（GMVC）

仍考虑如下模型：

（14）

yr=0时控制目标为：

（15）

其中：

为抑制{u2（k）}的加权系数。

将式：

代入（15），我们有控制目标：

因为F（k+d）项为未来干扰项，与其他各项统计无关，并且令：

2=E[F（k+d）]2=Const.

由令（J/u（k））=0，导出u*（k）=0，

注：

[]中仅BF/C的首项中含u（k），其系数为b0，则得出广义最小方差控制律为：

若=0，则上式退化为MVC。

2、GMVC的性能

●加权因子抑制{u2（k）}的作用

引入两个品质指标：

随机调节因数：

调节能耗Su：

式中n（k）为无控制下干扰作用的结果。

当=0.01—0.02时，Su下降了48%—60%，而只增加了12%—17%；当>0.03时，将明显变坏。

●GMVC可适用于非最小相位过程，原因是如果B不稳定，（B+A/b0）仍能是稳定的。

3、MVC-PI和GMVC-PI调节器

MVC和GMVC对于给定值为有差调节，为消除稳态误差，可串联一个PI调节器：

MVC-PI传函为：

（16）

GMVC-PI传函为：

（17）

如果=0，串联部分为比例调节器；如果0，为PI调节器；如果=1，串联部分比例量与积分量相等。

性能：

●增加了一个在单位园上的极点，实现稳态无差；

●调节器增加一阶，全部参数能在线辨识；

●

值对品质指标随机调节因数和调节能耗Su的影响，见下图。

可在GMVC和GMVC-PI的基础上实现（隐式或显示）自校正控制器，并已获得诸多工业应用成果。

12.4模型参考自适应参数辨识

见P272

展开阅读全文