(4)
"(W))=-^-J0(f)+Q&⑴)|*0
da
这是因为当变分存在时,增量
AJ=J(x(r)+q&)-J(x(r))=厶(x(r),a&)+r(x(r),a&)根据厶和厂的性质有
L(x(r),cr<5r)=cd\x(t).Sx)
lim心心%)&=0a®aqtoadi
所以
=血厶("沃)+心,曲)=驻,&)=刃⑴a->oa
1.1.4极值与变分
利用变分的表达式(4)可以得到泛函极值与变分的关系:
若J(x(r))在观(0达到极值(极大或极小),则
(5)
刃(“)⑴)=0
这是因为对任意给定的J{x.+a8x)是变量a的函数,该函数在a=0处达到极值。
根据函数极值的必要条件知
J(x0+cz^r)|a=()—0ccx
于是由(4)式直接得到(5)式。
1丄5.变分法的基本引理
引理^(x)eC[xpx2],V?
/(x)eC1[x1,x2],77(兀J=“(兀2)=0,有
J'0(x)〃(x)dx三0,
则0(兀)三0,xe[xnx2]o
1.2无约束条件的泛函极值求泛函
J=\F(t,x(t),x(t))dt(6)
山0
的极值,一般是用泛函极值的必要条件去寻找一条曲线兀(/),使给定的二阶连续可微函数F沿该曲线的积分达到极值。
常称这条曲线为极值曲线(或轨线),记为x\t)o
1.2.1端点固定的情况
(7)
设容许曲线x(f)满足边界条件
X(/0)=兀0,f^=xf
且二次可微。
首先计算(6)式的变分:
=-F(M)+Q&(r),x(f)+曲⑴)|a=Qdt
对上式右端第二项做分布积分,并利用&仇)=&匕)=0,有
因为&的任意性,及&(/。
)=&(少)=0,所以由基本引理得到著名的欧拉方程
它是这类最简泛函取极值的必要条件。
(9)式乂可记作
通常这是x(f)的二阶微分方程,其通解的两个任意常数由(7)式中的两个端点条件确定。
1.2.2最简泛函的儿种特殊情形
(1)F不依赖于x,即F=F(t,x)
这时4三0,欧拉方程为代亿兀)=0,这个方程以隐函数形式给出x(f),但它一般不满足边界条件,因此,变分问题无解。
(ii)F不依赖x,即F=F(t.x)
欧拉方程为
将上式积分一次,便得首次积分Fi(t,x)=clf由此可求出x=0(f,cj,积分后得到可能的极值曲线族
(hi)F只依赖于i,即F=F(x)这时F、=0,Flx=0,Fx.=0,欧拉方程为
由此可设丘=0或尸沃=0,如果x=0,则得到含有两个参数的直线族x=clt+c2O另外若尸云=°有一个或儿个实根时,则除了上面的直线族外,乂得到含有一个参数c的直线族x=kt+c,它包含于上面含有两个参数的直线族x=clt+c2中,于是,在F=F(x)情况下,极值曲线必然是直线族。
(iv)F只依赖于x和Q即F=F(x,x)这时有比上=0,故欧拉方程为
此方程具有首次积分为
F-xFr
事实上,注意到F不依赖于/,于是有
《(F-迅.)=Fxx+F,x-xF{-x^-F,=x(Fv-轨)=0。
atatat
例1(最速降线问题)最速降线问题是历史上变分法开始发展的第一个问题。
它是约翰•贝努里(J.Bernoulli)于1696年提出的。
问题的提法是这样的:
设A和B是铅直平面上不在同一铅直线上的两点,在所有连结A和B的平面曲线中,求一曲线,当质点仅受重力作用,且初速为零,沿此曲线从A滑行至B时,使所需时间最短。
解将A点取为坐标原点,x轴水平向右,y轴垂直向下,B点为B(x2,y2)。
根据能量守恒定律,质点在曲线y(x)上任一点处的速度牛满足(s为弧长)
2
=mgy
at
1(ds}—m\——
2\dt)
将ds=Jl+〉2(x)dx代入上式得
dt=I匕二dx
2gy
于是质点滑行时间应表为y(x)的泛函
端点条件为
y(0)=0,y(x2)=y2
最速降线满足欧拉方程,因为
等价于
-~(F-y,Fv.)=Oax
作一次积分得
y(l+yJ)=q
令y'=ctgy,则方程化为
静7曲卜訣―品)
积分之,得
由边界条件y(0)=0,可知c2=0,故得
这是摆线(圆滚线)的参数方程,其中常数C】可利用另一边界条件y(x2)=y2來确定。
例2最小旋转面问题
Jl+严
F-ylFy・=yyjl+y12-y'y/'、=q
化简得y=c^l+y'2
令y'=sht,代入上式,y=c{yj\+sh2t=c{cht由于d*卑二皿=訥积分之,得x=clt+c2消去f,就得到y=c[ch^^这是悬链线方程。
1.2.3最简泛函的推广
最简泛函取极值的必要条件可以推广到其它情况。
(i)含多个函数的泛函
使泛函
y(“)=)十y(x2)=y2,z(x1)=ZpZ(x2)=z2.的极值曲线y=y(x)忆=z(x)必满足欧拉方程组
(ii)含高阶导数的泛函
使泛函丿GG))=[:
F(x,y』,y”)dx
取极值且满足固定边界条件y(“)=yi,y也心血)'(“)=儿,)'(兀2)=)‘2的极值曲线),=y(x)必满足微分方程
(ill)含多元函数的泛函设z(x,y)ec2,(x,y)e£>,使泛函J(z(x,刃)=jjF(x,)',JJ,Zy)dxdy
D
取极值且在区域D的边界线/上取己知值的极值函数z=z(x,y)必满足方程
F.-—F.-—F.=0
4dxZxdyJ
上式称为奥式方程。
1.2.4端点变动的情况(横截条件)设容许曲线x(f)在固定,在另一端点t=tf时不固定,是沿着给定的曲线x="(/)上变动。
于是端点条件表示为
2Wo)=心/(0=0(f)
这里f是变动的,不妨用参数形式表示为t=tf+adtf
(11)
寻找端点变动情况的必要条件,可仿照前面端点固定情况进行推导,即有0=&/=[(F(t,x+aSx,x+a&)d^a=()=[(&_非阳f+FS仁+F
再对(11)式做如下分析:
(1)对每一个固定的x(f)都满足欧拉方程,即(11)式右端的第一项积分为
零;
(11)为考察(11)式的第二、第三项,建立与&之间的关系,因为
Jt=tf
x(tf+adtf)+a&x匕+adtf)=+adtf)
对a求导并令a=0得
x(tf)dtf+6x\i=if
即
&匚(12)
把(12)代入(11)并利用的任意性,得
[F+(^-x)Fj|/=//=0(13)
(13)式就是确定欧拉方程通解中另一常数的定解条件,称为横截条件。
横截条件有两种常见的特殊情况:
G)当x=屮⑴是垂直横轴的直线时,卩固定,自由,并称为自由
端点。
此时(11)式中dtf=0及的任意性,便得自由端点的横截条件
(11)当x=i//⑴是平行横轴的直线时,0自由,兀(少.)固定,并称为平动端点。
此时鸭=0,(13)式的横截条件变为
F-xF花=0(15)
注意,横截条件与欧拉方程联立才能构成泛函极值的必要条件。
1.3有约束条件的泛函极值
在最优控制系统中,常常要涉及到有约束条件泛函的极值问题,其典型形式是对动态系统
=⑴)(16)寻求最优性能指标(目标函数)
丿(%(/))=0匕"4))+『F(r,x⑴上⑴)力(17)
其中u(f)是控制策略,X(f)是轨线,G固定,匚及x(//)自由,eRn,W(r)eRm(不受限,充满F”空间),gF连续可微。
下面推导取得目标函数极值的最优控制策略/(f)和最优轨线x\t)的必要条件。
釆用拉格朗日乘子法,化条件极值为无条件极值,即考虑
人(iM)=0(f/,x(y))+『[F(/,x,u)+力(t)(f(t,x,u)-x)]dt(18)
的无条件极值,首先定义(16)式和(17)式的哈密顿(Hamilton)函数为
H亿x,w,A)=F(r,x,w)+才(/)f(r,x.u)(19)
将其代入(18)式,得到泛函
丿i(x,u,2)=©(/f,兀(/广))+J[//(/,x,w,2)-x]dt(20)
下面先对其求变分°
刃严右{0码+如»兀匕)+Q次(ff))
+J[H(t,x+u+adi.A+aSX)-(2+a3A)T(x+a5:
)](Jt}\a=Q
=[&E)F%)+(眄)他+(力/)丁观"-(叫)丁(才
+『[(&)丁Hx+Hlt+(<5Z)r比-(<5Z)rx—力3x]clt
=y[(ptf+F(r,X,U,r)|r]+)F%)
+『[qow+(血)w,+®)w—(皿)丁刃力一处s&l+『(&r加ffH&S,8xt=tf=6x(tf)-x(tf)dtf,因而
必利用边界条件
(用于确定X*)
(用于确定才)
山0
注意到&
SJ,=(dtf)T[(Ptf+H(t,x,u,2)|/=//]+[3x(tf)]r((px-2)|/=//+『[(&r(Hx+刃+(对(77)+(诃Hu]dt
Jto
再令刃1=0,由瓯说的任意性,便得
(1)必满足正则方程:
1状态方程X=Ha=
2协态方程A=—Ho
人
(ii)哈密顿函数作为"的函数,也必满足
比=0
并由此方程求得/。
(iii)求x*,A*,w*时,
1g)=%,
2如/■)=0“),
3
(确定少、)
(ptf=-H(t,x,u,A)
1.4最大(小)值原理如果受控系统
x=f(t,x,u)fx(t0)=XQ
其控制策略u(f)的全体构成有界集",求u(t)eU,使性能指标
J(«(0)=叫,M/))+『F(/,X,u)dt
达到最大(小)值。
最大(小)值原理:
如果0匕,兀匕))和尸匕兀川)都是连续可微的,那么最优控制策略u(t)和相应的最优轨线x\t)由下列的必要条件决定:
(1)最优轨线x\t)f协态向量才(/)由下列的必要条件决定:
dx
—=/(r,^w),w(r)eU,dt
d几dHdtdx
(ii)哈密顿函数
//(r,A/,w,Z)=F(r,A*,w)+XT(r)/(r,x\u)作为U(O的函数,最优策略u(t)必须使
拿拿*拿*
H(t.x,u,2)=maxH(f,x
i(dJ
或使
H(t,x\u,X)=minH(t,x,u,X)(ft小值原理)
ueU
(ill)满足相应的边界条件
1若两端点固定,则正则方程的边界条件为
x(0)—Xq,x(/f)=x(°
2若始端固定,终端°也固定,而x(//J自由,则正则方程的边界条件为
x(0)=x0,几匕)=久a/)("(f/))。
3若始端固定,终端都自由,则正则方程的边界条件为x(0)=心‘阿)=%)(tf,x(tf))‘
呵旳f),2(rf))+%(»x(//))=0。
§2生产设备的最大经济效益
某工厂购买了一台新设备投入到生产中。
一方面该设备随着运行时间的推移其磨损程度愈来愈大,因此其转卖价将随着使用设备的时间增加而减小;另一方面生产设备总是要进行日常保养,花费一定的保养费,保养可以减缓设备的磨损程度,提高设备的转卖价。
那么,怎样确定最优保养费和设备转卖时间,才能使这台设备的经济效益最大。
2.1问题分析与假设
(1)设备的转卖价是时间『的函数,记为x(r)ox(r)的大小与设备的磨损程度和保养费的多少密切相关。
记初始转卖价双0)=旺。
(ii)设备随其运行时间的推移,磨损程度越來越大。
/时刻设备的磨损程度可以用/时刻转卖价的损失值来刻画,常称其为磨损函数或废弃函数,记为m(t)O
(ill)保养设备可以减缓设备的磨损速度,提高转卖价。
如果"(/)是单位时间的保养费,g(/)是f时刻的保养效益系数(每用一元保养费所增加的转卖价),那么单位时间的保养效益为。
另外,保养费不能过大(如单位时间保养费超过单位时间产值时,保养失去了意义),只能在有界函数集中选取,记有界函数集为W,则u(f)wW。
Gv)设单位时间的产值与转卖价的比值记为”,则px(t)表示在f时刻单位时间的产值,即r时刻的生产率。
(V)转卖价x(/)及单位时间的保养费u(f)都是时间/的连续可微函数。
为了统一标准,釆用它们的贴现值。
对于贴现值的计算,例如转卖价x(f)的贴现值计算,如果它的贴现因子为5(经过单位时间的单位费用贴现),那么由
=
M)=1
解得
令“=0,便得/时刻单位费用的贴现(称贴现系数)为厂&,所以设备在f时刻转卖价x(f)的贴现为x(t)e~Sto仿此计算,“(/)的贴现为u{t)e~5t,单位时间产值的贴现为px(t)e~Sto
(VI)欲确定的转卖时间tf和转卖价x(tf)都是自由的。
2.2模型构造
根据以上的分析与假设可知:
考察的对象是设备在生产中的磨损一保养系统;转卖价体现了磨损和保养的综合指标,可以选作系统的状态变量;在生产中设备磨损的不可控性强,其微弱的可控性也是通过保养体现,加之保养本身具有较强的可控性,所以选单位时间的保养费"(/)作为控制策略。
这样,生产设备的最大经济效益模型可以构成为在设备磨损一保养系统的(转卖价)状态方程
[竽一砍)+g(5(t)(21)
k(0)=Xo
之下,在满足的函数集W中寻求最优控制策略/(/),使系统的经济效益这一性能指标
(22)
(23)
J(“⑴)=)严+J;[px(t)-u(t)]e~Stdt为最大,其中都是自由的。
2.3模型求解
首先写出问题的哈密顿函数
H=[px(t)一”⑴]不为++g(/)加⑴]
再由协态方程及边界条件求出A(r),即由
^-=-Hx=-pe-Sl
\Z(tf)=(px{tf)=e~Stf
解得
久⑴=(1-£)严+£广"
OO
下面利用最大值原理求w*(r)o先将(23)式改变为
H=px(t)e^一加?
(f)+[々(『)一]w(r)
显然,H是对u的线性函数,因此得到
U
、
(25)
0,[(1-壬)严+宦F]g(/)-产<0
在上式中,还需解决两个问题:
一是u\t)=U与/(f)=0的转换点匚在什么位置,即匚等于多少?
二是u\t)是由〃到0,还是由0到“。
转换点匚应满足
[(1-£)严+”伽)-宀0
OO
(26)
[£—(£—1)严"]g(f)—1=0oo
从而可解出匚。
因为g(f)是时间/的减函数,所以(26)式的左端也是时间f的减函数,也就是说u\t)随时间应由U到0o于是最优控制策略的具体表达式为
*血00,ts至于5,x(//)的求法,请见下面的例子。
例3在生产设备的最大经济效益的问题中,设<0)=100,U=l,m(t)=2,
一2”p=0.1f8=0.05,g(t)=,试求—,x(//)和u(Z)o
(1+沪
(26)式可得求。
的公式
(27)
(1+土=4—2严…
当时,
u\t)=U=\,状态方程为
dx2
一=_2+T
dt(1+沪
当t>ts时,
/(『)=0,状态方程为
红一2
dt
于是t>ts时,有
-2+—]df+f(―2)力
(1+沪
解得
x(r)=4(1+jf+96-2/(28)
由自由边界条件H\t=tf=-(pJ(及=»勺,得
-px(ff)€*+2小叫=_&x(tf)于是
2
x(t.)==40
fp-8
当t=tf时,由(28)式有
_i
40=4(1+心尸+96-2—.
即
£tf=2(1+匚),+28(29)
将(27)和(29)联立求解,编写如下Matlab程序
[xzy]=solve(1(1+ts)A(1/2)=4-2*exp(0・05犬(ts-tf))','tf=2*(1+ts)A(1/2)4-28*)
求得ts=10.6,tf=34.8于是,最优控制策略(保养费)为
*fl,020,10.6习题十八
1.求自原点(0,0)到直线x+y-l=0的最速降线。
2.求概率密度函数0(x),使得信息量
J=-(p(x)ln[i/0(x)]dx
J—00
取最大值,且满足等周条件
(p(x)dx=1,I20(x)dx=cr(常数)。
J—00J—00
3.在生产设备或科学仪器中长期运行的零部件,如滚珠、轴承、电器元件等会突然发生故障或损坏,即使是及时更换也已经造成了一定的经济损失。
如果在零部件运行一定时期后,就对尚属正常的零件做预防性更换,以避免一旦发生故障带来的损失,从经济上看是否更为合算?
如果合算,做这种预防性更换的时间如何确定呢?