最优控制理论考试重点.docx
《最优控制理论考试重点.docx》由会员分享,可在线阅读,更多相关《最优控制理论考试重点.docx(14页珍藏版)》请在冰豆网上搜索。
最优控制理论考试重点
1=to,x(to)=xot=tf,x(tf)^S
1.最优控制问题的性能指标
(1)积分型性能指标(拉格朗日型):
J(u)=(tfL[x(t),u(t),t]dt
」0
反映控制过程偏差在某种意义下的平均或控制过程的快速性,同时能反映燃料或能量的消耗。
(2)末值型性能指标(梅耶型):
J(u)=8[x(tf),tf],接近目标集程度,即末态控制精度的度量。
tf
(3)综合性能指标(鲍尔扎型):
J(u)=8[x(tf),tf]十LL[x(t),u(t),t]dt。
2.最优控制问题的数学模型
给定系统的状态方程:
x(t)=f[x(t),u(t),t];状态方程的边界条件:
给定性能指标:
J(u)=8[x(tf),tf]+「L[x(t),u(t),t]dt;允许控制域u(t):
u(t)^U。
3.最优控制应用的几种类型:
最短时间控制,最小能量控制,线性调节器,最少燃料消耗控制,线性跟踪器。
4.选取性能指标注意:
应能反映对系统的主要技术条件要求,便于对最优控制进行求解,所导出最优控制易于实现。
5.边界条件:
指状态向量在起点或终点的所有容许值的集合。
6.横截条件:
依据性能指标的要求,从容许值的集合中选择哪一点作为始态或终态的问题。
1.泛函:
对于某一类函数y(-)中的每一个函数y(x),变量J都有一个值与之相对应,那么变量府作依赖于函数
y(x)的泛函。
记为:
J=J[y(x)],y(x)称为泛函的宗量。
宗量的变分:
Sy=y(x)-y0(x)。
2.泛函的连续性:
对任意给定的正数总存在另一个正数5,当
y(x)-yo(x)<5,y(x)-yo(x)<5,...,y(k)(x)-y0k)(x)曷,...时,J[y(x)]-J[y。
(x)]|<尊,则称泛函J[y(x)]在点yo(x)处是连续的,而此时y(x)与yo(x)具有k阶接近度。
J[y(x)]满足:
(1)J[yi(x)+y2(x)]=J[yi(x)]+J[y2(x)],
(2)J[ay(x)]=aJ[y(x)]则称其为线性泛函。
3.泛函的变分(计算题)
设泛函J[y(x)]为连续泛函,则泛函增量的线性主部称为泛函的变分,记为:
Jo泛函的变分是唯一的。
泛函J[y(x)]的求解:
6J[y(x)]=£j[y(x)+^y(x)]从。
■,
。
.fL[t,x(t),x(t)].
x(t)
-'方(t)
例=确定点A01)至给定直线y/(r)=2-r的最短的曲线方程。
解:
由氏至w的M长*=』(时+陵渲=J1+戈财
性能指标为y、
/[/(*)]=|A'l+
0
由欧拉方程二』孑
-)=0
煮^s/1+X
积分得,
根据始端Sr件:
根摒终端横截条件'
[Li<^-x)£5.I-Jl+x2+(-1
得最优敦或方程,
沿最优轨线函数H相对最优控制u*(t)取绝对极小值,这是极小值原理的一个重要结论。
H[x*(t)"(t),u*(t),t]=m)irjH[x*(t),(t),u(t),t]
设系统的状态方程为x'(t)=f[x(t),u(t),t],控制u(t)是有第一类间断点的分段连续函数,属于p维空间中的有界闭集Q,满足不等式约束:
G[x(t),u(t),t]芝0,在终端时刻tf未知的情况下,为使状态自初态x(t0)=x0,
tf一、一一
转移到7两足边界条件M[x(tf),tf]=0的终态,并使性能指标J=8[x(tf),tf]+[F[x(t),u(t),t]dt达极小值。
设哈密而顿函数为H=F(x,u,t)+7:
f(x,u,t)则最优控制u*(t),最优轨线x*(t)和最优伴随向量入*(t)必须满足下列条件:
(1)沿最优轨线满足正则方程:
x=—,九=一也一(坦)T「,式中「是与时间t无关的拉格朗日乘子向
xjx
量,其维数与G相同,若G中不包含x,贝U:
九=—^―o
;:
x
(2)横截条件及边界条件:
—_'MTMT
A(tf)=[十()v]t±,[H(x,u,Z,t)+十()v]t土=0,x(to)=xo,M[x(tf),tf]=0。
;x;x:
t:
t
・.,*K**・、八
⑶在最优轨线x*(t)上与最优控制u*(t)相对应的H函数取绝对极小值,即H(x,九,u,t)玄H(x,%,u,t),
并且沿最优轨线,下式成立—=4-^)^°
;:
u;:
u
上述条件与不等式约束下的最优控制的必要条件相比较,横截条件及端点边界条件没有改变,仅“H=0这
:
u
一条件不成立,而代之以与最优控制相对应的函数为绝对极小,其次是正则方程略有改变,仅当G中不包含x
时,方程才不改变。
1.砰-砰控制原理:
若线性定常系统x(t)=Ax+Bu属于平凡情况,则其最短时间控制为u*(t)=-Msgn[BT7「(t)],u*(t)的各个分量都是时间的分段恒值函数,并均取边界值,称此为Bang-Bang原理。
n
即u*j(t)=-sgn[qj(t)]=-sgn{\bij(t)」t)},(j=1,2,...,m)i4
或u*j(t)=—sgn[Q(t)]=-sgn{BT[x*(t),t]L*(t)}。
2.平凡最短时间控制系统:
q:
只是在各个孤立的瞬刻才取零值,u*是有第一类间断点的分段恒值函数。
.........-..*^
3.奇异(非平凡)最短时间控制系统:
qj在一段区间取零值。
..…一・・,,*T
并不意味着在该区间内最优控制不存在,仅表明,从必要条件不能推出确切美系式。
如果九(t)bj在某一时
....*,一・...、・...........
间区间内保持为零,则uj(t)为不确定值,这种情况称为奇异问题或非平凡问题,相应的时间区段称为奇异区段。
当整个时间区间内不出现奇异区段时,则称为非奇异问题或平凡问题,对于平凡问题,有以下几个定义及定理。
砰--砰控制原理也称为继电器型控制或开关控制,其主要特点是控制向量的分量都取控制域的边界,而且不断的从一个边界值切换到另一个边界值,从而构成一种最强的控制作用。
砰-砰控制实质是平凡时间最优问题,其最
优解也就是控制器的输出是一个类似于继电器动作的开关式动作。
最短时间控制存在定理:
若线性定常系统x(t)=Ax+Bu完全能控,矩阵A的特征值均具有非正实部,控制变量满足不等式约束|u(t)|vM,则最短时间控制存在。
最短时间控制的唯一性定理:
若线性定常系统x(t)=Ax+Bu属于平凡情况,若时间最优控制存在,则必定是唯一的。
开关次数定理:
若线性定常系统x(t)=Ax+Bu控制变量满足不等式约束|u(t)|若最短时间控制存在。
则必为Bang-Bang控制,并且每个控制分量在两个边界值之间的切换次数最多不超过n-1
次。
切换点为q.(t)=bj禹=0。
系统平凡的充要条件:
当且仅当m个矩阵Gj=[bj,Abj,A2bj,…,A^bj]中全部为非奇异矩阵时,系统是平凡
的。
(至少有一个为奇异矩阵时,系统是奇异的。
)
双积分模型的物理意义:
惯性负载在无阻力环境中运动。
双积分模型J
'(t)=X2(t)的最短时间控制问题,求解过程为:
、X2(t)=u(t)
*_.•、_
1)应用最小值原理得出最优控制表达式u=-sgn[7・2(t)];2)解协态方程,结合开关次数定理,列出最优控制的
候选函数序列(4种);3)在状态平面上分析状态转移轨线,寻找开关曲线,总结控制规律;
4)计算状态转移的最短时间。
解题步骤:
1)
列写H函数:
H=L+Vf;3)伴随方程:
控制肯定是燃料最优控制。
6)以此为依据来选择最优控制序列(最优轨线)
双积分模型的最少燃料控制问题,求解过程为:
1)应用最小值原理得出最优控制表达式;2)解协态方程,列出最优控制的候选函数序列(9个);
3)燃料消耗量的下限为;4)在状态平面上分析状态转移轨线,寻找开关曲线,总结控制规律;
5)计算状态转移的所需时间、消耗燃料。
结论:
(1)(X10,X20)€7+
平凡情况:
只有{+1}序列可驱使系统状态到达原点,故为问题的解。
非干凡情况:
因为u(t)=-sgnQ20),v(t),v(t)<1,则系统状态不可能到达原点。
*一.一…--,、f*f*tf
1)u=1为最优解;2)消耗燃料P(*0,x20)=「u(t)dt=Lu(t)dt=X20=—X20
^0'00
(2)(X10,x20)=R4
且燃料消耗为X20
八一一一*,、,、,.、..
非平凡情况:
u(t)=-sgn0、20).v(t),V(t)
因而都是最优控制。
平凡情况:
只有序列{0,+1}和(-1,0,+1}可驱使系统状态到达原点。
其中:
(0,+1}控制下,燃料消耗为x20,
{-1,0,+1},燃料消耗大于X20。
结论:
(0,+1}为最优控制序列,且在各种情况下其响应时间最短。
(3)(X10,X20)匚R1
平凡情况:
只有序列(-1,0,+1}可驱使系统状态到达原点。
结论:
燃料控制问题无解(8-燃料最优控制)。
双积分装置最少燃料问题的控制规律如下:
=+1)一尸+
tt:
=O(X]》U氏耳
根据什么原则选取状态转移颗迹?
最小能量控制问题指在控制过程中,控制系统的能量消耗为最小,与最小燃料消耗问题类似,也只有在有限时间内有意义。
最少燃料控制为三位式控制,存在(+1,0,-1)三种控制状态,与最短时间控制相比,多1个u=0的控制
状态,这意味着:
在状态转移的某些阶段,可借助系统中积存的能量来维持运动,根本不需要消耗能量。
双积分装置最少燃料系统的最优解取决于初态的位置。
即可无解,也可唯一解或多个解。
这意味着,同一个
问题,在某些初值下是平凡的,在另一些初值下是非平凡的。
单考虑燃料最少,相应可能太慢,应与时间综合考
tf
虑。
如:
米用时间燃料综合最优的指标函数,J[u(t)]=[[K+|u(t)]dt。
□最短时间控制与最少燃料控制的相互关系
统性二次型问8!
的提法:
祯)=.4(小(/)+3(顷(/)(6-1:
设线性时变系统的状态方程为
yv)一VV7'V7
假设控制向星响)不受约束,用】,Q)表示期望轴出,则误差向量为
e(t)=!
>(/)一}«)(6-2)
求最优控制『(/),使下列二次型性能指标最小.
./(〃)=-eT(tf)Fe(tJ.)4-[er。
)0。
心)+〃。
/&(,)〃(,)]出(6-3
■—1
F一半正定对定常效加权矩阵
W)—半王定对称时交加权矩阵
R(ty正定对称时变加权矩阵
In及人固定
正定二次型••…寸*黄0••…./出*)0••…半正定二次型…Vx^O••…,/Av>0;
实对称阵A为正定(半正定)的充要条件是全部特征值>0<>0).
加权矩阵总可化为对称形式。
OOO
(ii)=^eT(〃)Fe(fj)+;[:
"+u(t)TR(t)u(t)](1t(6—3)。
。
~~oo
性能指标的物理含义:
4=^e(t)TO(t)e(t)>0—状态转移过程中衡量川)大小的代价函数
Lu=:
〃(。
以(/)〃(/)>0—状态转移过程中衡量〃⑺大小的代价函数
0(O)=X(〃)'R(o)zo一终端代价函数(衡量终点误差)
线性二次型问题的本质:
用不大的控制,来保持辕小的误差.以达到能量和误差螺含最优的目的
统性二次型问题的三种重要情形:
t(/)=(6—D
y(i)=C(t)x(f)
照)=乂(。
一即)(6-2)
|1)d=OE)=Hf)=-e0状^^
B)i顷)=。
即)=用)输出调节器
|3)=0e(f)=»U)-v(f)跟踪问题
矩阵F,Q(t),R(t)的每一元素,都是对应二次项的系数。
意义:
是借以权衡各个误差分量和控制分量重要程度的
加权矩阵。
对于重要的误差分量或控制分量,其系数取较大值;对于次要的误差分量或控制分量,系数取较小值;
而对于互不相关的误差分量或控制分量,系数取零值。
状态调节器:
用不大的控制能量,使状态保持在零值附近,因而称之为状态调节器问题。
输出调节器:
用不大的能量控制,使输出状态保持在零值附近,因而称之为输出调节器问题。
跟踪问题:
用不大的控制能量,使y(t)跟踪yr(t)的变化,因而称之为跟踪问题。
3.状态调节皆的设计步骤
<1>根据系统要求和工程实际经验,选取加权矩阵F.Q.R
(2)求醒黎卡提徽分方程.求懈矩阵P僧)
PBR~}BTP-O(6-21)
gAF
(3)求反馈增益矩阵K(t)及最优控制u*(V
=二-A_iy(6-18)
<4>求解最优SU#/。
佣)计算性能指标最优值
*•1r,7
J[.Y(/折]=7.v(f)rP(t)x(r}T〔6-23)
r越小,p(t)越平稳,x(t)衰减越快,u(t)幅值越大。
无限时间状态调节器问题:
“(f)"--Kx(t)=-R~]BrPx(t)
P为正定常数矩阵,满足下列黎卡提矩阵代数方程。
PA+AtP-PBR-"P+Q=。
最优轨线满足下列线性定常齐次方程:
x(t)^[Ax-BR~}BTP]x(t)=[A-BK]x(f)
性能指标最优值
尸[的)]=[点)「*("
线性定常最优调节器组成的闭环反馈控制系统,是渐近稳定的。
有限时间输出调节器问题:
物理意义:
以较小的控制能量为代价,使输出保持在零值附近。
根据系统能观条件,输出调节器问题可转化为状态调节器问题。
u(f)-
P=-PA-AtP一PBR~xBtP-CtQC
(1)仍然是状态反馈,而不是输出反馈,说明构成最优控制系统需要全部信息。
(2)从工程上讲,x(t)是通过y(t)观测出来的,所以控制的先决条件是,受控系统应是可观测的。
无限时间输出调节器问题:
=-Kx(f)=Px(t)
PA-AtP-PBRWP+CtQC=0
线性时变系统的跟踪问题:
物理意义:
以较小的控制能量为代价,使误差保持在零值附近。