动态优化模型.docx

资源描述

动态优化模型.docx

《动态优化模型.docx》由会员分享，可在线阅读，更多相关《动态优化模型.docx（18页珍藏版）》请在冰豆网上搜索。

动态优化模型.docx

动态优化模型

第十八章动态优化模型

动态过程的另一类问题是所谓的动态优化问题,这类问题一般要归结为求最优控制函数使某个泛函达到极值。

当控制函数可以事先确定为某种特殊的函数形式时，问题乂简化为求普通函数的极值。

求解泛函极值问题的方法主要有变分法和最优控制理论方法。

§1变分法简介

变分法是研究泛函极值问题的一种经典数学方法，有着广泛的应用。

下面先介绍变分法的基本概念和基本结果，然后介绍动态系统最优控制问题求解的必要条件和最大值原理。

1.1变分法的基本概念

1.1.1泛函

设S为一函数集合，若对于每一个函数x（t）e5有一个实数丿与之对应，则称丿是对应在S上的泛函，记作J（x（O）oS称为丿的容许函数集。

通俗地说，泛函就是“函数的函数”。

丿（）'W）=2列（Qjl+严（x）dx

（1）

（2）

（3）

例如对于卩平面上过定点Agj）和直（兀2』2）的每一条光滑曲线y（x），绕x轴旋转得一旋转体，旋转体的侧面积是曲线y（x）的泛函丿（y（Q）。

由微积分知识不难写出

容许函数集可表示为

s={yW|y（x）eCl[x^x2ly（“）=比，y（x2）=y2}最简单的一类泛函表为

被积函数F包含自变量/,未知函玄兀及导数X。

（1）式是最简泛函。

1.1.2泛函的极值

泛函J（x（r））在々（OwS取得极小值是指，对于任意一个与心⑴接近的x（t）eS,都有J（x（r））>/（x0（r））o所谓接近，可以用距离d（x（r）,x0（r））

J（x（r）,x0（r））=max{|x（O-xo（O|,|x（t）~

泛函的极大值可以类似地定义。

兀o（f）称为泛函的极值函数或极值曲线。

1.1.3泛函的变分

如同函数的微分是增量的线性主部一样，泛函的变分是泛函增量的线性主部。

作为泛函的自变量，函数x（r）在儿⑴的增量记为

6x（t）=x（t）-xQ（t）

也称函数的变分。

由它引起的泛函的增量记作

Z=J（兀。

⑴+&（。

）-J（比（0）

如果△/可以表为

△丿=L（xo（O,&⑴）+心o（0,&（0）

其中厶为&的线性项，而厂是&的高阶项，则厶称为泛函在心（0的变分，记作

刃Oo⑴）。

用变动的x（f）代替xo（O,就有

（4）

"（W））=-^-J0（f）+Q&⑴）|*0

这是因为当变分存在时，增量

AJ=J（x（r）+q&）-J（x（r））=厶（x（r）,a&）+r（x（r）,a&）根据厶和厂的性质有

L（x（r）,cr<5r）=cd\x（t）.Sx）

lim心心％）&=0a®aqtoadi

所以

=血厶（"沃）+心，曲）=驻,&）=刃⑴a->oa

1.1.4极值与变分

利用变分的表达式（4）可以得到泛函极值与变分的关系:

若J（x（r））在观（0达到极值（极大或极小），则

（5）

刃（“）⑴）=0

这是因为对任意给定的J{x.+a8x）是变量a的函数，该函数在a=0处达到极值。

根据函数极值的必要条件知

J（x0+cz^r）|a=（）—0ccx

于是由（4）式直接得到（5）式。

1丄5.变分法的基本引理

引理^（x）eC[xpx2],V?

/（x）eC1[x1,x2],77（兀J=“（兀2）=0,有

J'0（x）〃（x）dx三0,

则0（兀）三0,xe[xnx2]o

1.2无约束条件的泛函极值求泛函

J=\F（t,x（t）,x（t））dt（6）

山0

的极值，一般是用泛函极值的必要条件去寻找一条曲线兀（/）,使给定的二阶连续可微函数F沿该曲线的积分达到极值。

常称这条曲线为极值曲线（或轨线），记为x\t）o

1.2.1端点固定的情况

（7）

设容许曲线x（f）满足边界条件

X（/0）=兀0，f^=xf

且二次可微。

首先计算（6）式的变分:

=-F（M）+Q&（r）,x（f）+曲⑴）|a=Qdt

对上式右端第二项做分布积分，并利用&仇）=&匕）=0,有

因为&的任意性，及&（/。

）=&（少）=0,所以由基本引理得到著名的欧拉方程

它是这类最简泛函取极值的必要条件。

（9）式乂可记作

通常这是x（f）的二阶微分方程，其通解的两个任意常数由（7）式中的两个端点条件确定。

1.2.2最简泛函的儿种特殊情形

（1）F不依赖于x,即F=F（t,x）

这时4三0,欧拉方程为代亿兀）=0,这个方程以隐函数形式给出x（f）,但它一般不满足边界条件，因此，变分问题无解。

（ii）F不依赖x,即F=F（t.x）

欧拉方程为

将上式积分一次，便得首次积分Fi（t,x）=clf由此可求出x=0（f,cj,积分后得到可能的极值曲线族

（hi）F只依赖于i,即F=F（x）这时F、=0,Flx=0,Fx.=0,欧拉方程为

由此可设丘=0或尸沃=0,如果x=0,则得到含有两个参数的直线族x=clt+c2O另外若尸云=°有一个或儿个实根时，则除了上面的直线族外，乂得到含有一个参数c的直线族x=kt+c,它包含于上面含有两个参数的直线族x=clt+c2中，于是，在F=F（x）情况下，极值曲线必然是直线族。

（iv）F只依赖于x和Q即F=F（x,x）这时有比上=0,故欧拉方程为

此方程具有首次积分为

F-xFr

事实上，注意到F不依赖于/,于是有

《（F-迅.）=Fxx+F,x-xF{-x^-F,=x（Fv-轨）=0。

atatat

例1（最速降线问题）最速降线问题是历史上变分法开始发展的第一个问题。

它是约翰•贝努里（J.Bernoulli）于1696年提出的。

问题的提法是这样的：

设A和B是铅直平面上不在同一铅直线上的两点，在所有连结A和B的平面曲线中，求一曲线，当质点仅受重力作用，且初速为零，沿此曲线从A滑行至B时，使所需时间最短。

解将A点取为坐标原点，x轴水平向右，y轴垂直向下，B点为B（x2,y2）。

根据能量守恒定律，质点在曲线y（x）上任一点处的速度牛满足（s为弧长）

=mgy

1（ds}—m\——

2\dt）

将ds=Jl+〉2（x）dx代入上式得

dt=I匕二dx

2gy

于是质点滑行时间应表为y（x）的泛函

端点条件为

y（0）=0,y（x2）=y2

最速降线满足欧拉方程，因为

等价于

-~（F-y,Fv.）=Oax

作一次积分得

y（l+yJ）=q

令y'=ctgy,则方程化为

静7曲卜訣―品）

积分之，得

由边界条件y（0）=0,可知c2=0,故得

这是摆线（圆滚线）的参数方程，其中常数C】可利用另一边界条件y（x2）=y2來确定。

例2最小旋转面问题

Jl+严

F-ylFy・=yyjl+y12-y'y/'、=q

化简得y=c^l+y'2

令y'=sht,代入上式，y=c{yj\+sh2t=c{cht由于d*卑二皿=訥积分之，得x=clt+c2消去f,就得到y=c[ch^^这是悬链线方程。

1.2.3最简泛函的推广

最简泛函取极值的必要条件可以推广到其它情况。

（i）含多个函数的泛函

使泛函

y（“）=）十y（x2）=y2,z（x1）=ZpZ（x2）=z2.的极值曲线y=y（x）忆=z（x）必满足欧拉方程组

（ii）含高阶导数的泛函

使泛函丿GG））=[：

F（x,y』,y”）dx

取极值且满足固定边界条件y（“）=yi，y也心血）'（“）=儿,）'（兀2）=）‘2的极值曲线），=y（x）必满足微分方程

（ill）含多元函数的泛函设z（x,y）ec2,（x,y）e£>,使泛函J（z（x,刃）=jjF（x,）',JJ,Zy）dxdy

取极值且在区域D的边界线/上取己知值的极值函数z=z（x,y）必满足方程

F.-—F.-—F.=0

4dxZxdyJ

上式称为奥式方程。

1.2.4端点变动的情况（横截条件）设容许曲线x（f）在固定，在另一端点t=tf时不固定，是沿着给定的曲线x="（/）上变动。

于是端点条件表示为

2Wo）=心/（0=0（f）

这里f是变动的，不妨用参数形式表示为t=tf+adtf

（11）

寻找端点变动情况的必要条件，可仿照前面端点固定情况进行推导，即有0=&/=[（F（t,x+aSx,x+a&）d^a=（）=[（&_非阳f+FS仁+F

再对（11）式做如下分析：

（1）对每一个固定的x（f）都满足欧拉方程，即（11）式右端的第一项积分为

零;

（11）为考察（11）式的第二、第三项，建立与&之间的关系，因为

Jt=tf

x（tf+adtf）+a&x匕+adtf）=+adtf）

对a求导并令a=0得

x（tf）dtf+6x\i=if

即

&匚（12）

把（12）代入（11）并利用的任意性，得

[F+（^-x）Fj|/=//=0（13）

（13）式就是确定欧拉方程通解中另一常数的定解条件，称为横截条件。

横截条件有两种常见的特殊情况：

G）当x=屮⑴是垂直横轴的直线时，卩固定，自由，并称为自由

端点。

此时（11）式中dtf=0及的任意性，便得自由端点的横截条件

（11）当x=i//⑴是平行横轴的直线时，0自由，兀（少.）固定，并称为平动端点。

此时鸭=0,（13）式的横截条件变为

F-xF花=0（15）

注意，横截条件与欧拉方程联立才能构成泛函极值的必要条件。

1.3有约束条件的泛函极值

在最优控制系统中，常常要涉及到有约束条件泛函的极值问题，其典型形式是对动态系统

=⑴）（16）寻求最优性能指标（目标函数）

丿（%（/））=0匕"4））+『F（r,x⑴上⑴）力（17）

其中u（f）是控制策略，X（f）是轨线，G固定，匚及x（//）自由，eRn,W（r）eRm（不受限，充满F”空间），gF连续可微。

下面推导取得目标函数极值的最优控制策略/（f）和最优轨线x\t）的必要条件。

釆用拉格朗日乘子法，化条件极值为无条件极值，即考虑

人（iM）=0（f/,x（y））+『[F（/,x,u）+力（t）（f（t,x,u）-x）]dt（18）

的无条件极值，首先定义（16）式和（17）式的哈密顿（Hamilton）函数为

H亿x,w,A）=F（r,x,w）+才（/）f（r,x.u）（19）

将其代入（18）式，得到泛函

丿i（x,u,2）=©（/f,兀（/广））+J[//（/,x,w,2）-x]dt（20）

下面先对其求变分°

刃严右{0码+如»兀匕）+Q次（ff））

+J[H（t,x+u+adi.A+aSX）-（2+a3A）T（x+a5:

）]（Jt}\a=Q

=[&E）F%）+（眄）他+（力/）丁观"-（叫）丁（才

+『[（&）丁Hx+Hlt+（<5Z）r比-（<5Z）rx—力3x]clt

=y[（ptf+F（r,X,U,r）|r]+）F%）

+『[qow+（血）w,+®）w—（皿）丁刃力一处s&l+『（&r加ffH&S，8xt=tf=6x（tf）-x（tf）dtf,因而

必利用边界条件

（用于确定X*）

（用于确定才）

山0

注意到&

SJ,=（dtf）T[（Ptf+H（t,x,u,2）|/=//]+[3x（tf）]r（（px-2）|/=//+『[（&r（Hx+刃+（对（77）+（诃Hu]dt

Jto

再令刃1=0,由瓯说的任意性，便得

（1）必满足正则方程：

1状态方程X=Ha=

2协态方程A=—Ho

人

（ii）哈密顿函数作为"的函数，也必满足

比=0

并由此方程求得/。

（iii）求x*,A*,w*时，

1g）=%，

2如/■）=0“），

（确定少、）

（ptf=-H（t,x,u,A）

1.4最大（小）值原理如果受控系统

x=f（t,x,u）fx（t0）=XQ

其控制策略u（f）的全体构成有界集"，求u（t）eU,使性能指标

J（«（0）=叫,M/））+『F（/,X,u）dt

达到最大（小）值。

最大（小）值原理：

如果0匕,兀匕））和尸匕兀川）都是连续可微的,那么最优控制策略u（t）和相应的最优轨线x\t）由下列的必要条件决定：

（1）最优轨线x\t）f协态向量才（/）由下列的必要条件决定：

—=/（r,^w）,w（r）eU,dt

d几dHdtdx

（ii）哈密顿函数

//（r,A/,w,Z）=F（r,A*,w）+XT（r）/（r,x\u）作为U（O的函数，最优策略u（t）必须使

拿拿*拿*

H（t.x,u,2）=maxH（f,x

i（dJ

或使

H（t,x\u,X）=minH（t,x,u,X）（ft小值原理）

ueU

（ill）满足相应的边界条件

1若两端点固定，则正则方程的边界条件为

x（0）—Xq,x（/f）=x（°

2若始端固定，终端°也固定，而x（//J自由，则正则方程的边界条件为

x（0）=x0，几匕）=久a/）（"（f/））。

3若始端固定，终端都自由，则正则方程的边界条件为x（0）=心‘阿）=%）（tf,x（tf））‘

呵旳f）,2（rf））+%（»x（//））=0。

§2生产设备的最大经济效益

某工厂购买了一台新设备投入到生产中。

一方面该设备随着运行时间的推移其磨损程度愈来愈大，因此其转卖价将随着使用设备的时间增加而减小；另一方面生产设备总是要进行日常保养，花费一定的保养费，保养可以减缓设备的磨损程度，提高设备的转卖价。

那么，怎样确定最优保养费和设备转卖时间，才能使这台设备的经济效益最大。

2.1问题分析与假设

（1）设备的转卖价是时间『的函数，记为x（r）ox（r）的大小与设备的磨损程度和保养费的多少密切相关。

记初始转卖价双0）=旺。

（ii）设备随其运行时间的推移，磨损程度越來越大。

/时刻设备的磨损程度可以用/时刻转卖价的损失值来刻画，常称其为磨损函数或废弃函数，记为m（t）O

（ill）保养设备可以减缓设备的磨损速度，提高转卖价。

如果"（/）是单位时间的保养费，g（/）是f时刻的保养效益系数（每用一元保养费所增加的转卖价），那么单位时间的保养效益为。

另外，保养费不能过大（如单位时间保养费超过单位时间产值时，保养失去了意义），只能在有界函数集中选取，记有界函数集为W,则u（f）wW。

Gv）设单位时间的产值与转卖价的比值记为”，则px（t）表示在f时刻单位时间的产值，即r时刻的生产率。

（V）转卖价x（/）及单位时间的保养费u（f）都是时间/的连续可微函数。

为了统一标准，釆用它们的贴现值。

对于贴现值的计算，例如转卖价x（f）的贴现值计算，如果它的贴现因子为5（经过单位时间的单位费用贴现），那么由

M）=1

解得

令“=0,便得/时刻单位费用的贴现（称贴现系数）为厂&,所以设备在f时刻转卖价x（f）的贴现为x（t）e~Sto仿此计算，“（/）的贴现为u{t）e~5t,单位时间产值的贴现为px（t）e~Sto

（VI）欲确定的转卖时间tf和转卖价x（tf）都是自由的。

2.2模型构造

根据以上的分析与假设可知：

考察的对象是设备在生产中的磨损一保养系统；转卖价体现了磨损和保养的综合指标，可以选作系统的状态变量；在生产中设备磨损的不可控性强，其微弱的可控性也是通过保养体现，加之保养本身具有较强的可控性，所以选单位时间的保养费"（/）作为控制策略。

这样，生产设备的最大经济效益模型可以构成为在设备磨损一保养系统的（转卖价）状态方程

[竽一砍）+g（5（t）（21）

k（0）=Xo

之下，在满足的函数集W中寻求最优控制策略/（/）,使系统的经济效益这一性能指标

（22）

（23）

J（“⑴）=）严+J；[px（t）-u（t）]e~Stdt为最大，其中都是自由的。

2.3模型求解

首先写出问题的哈密顿函数

H=[px（t）一”⑴]不为++g（/）加⑴]

再由协态方程及边界条件求出A（r）,即由

^-=-Hx=-pe-Sl

\Z（tf）=（px{tf）=e~Stf

解得

久⑴=（1-£）严+£广"

下面利用最大值原理求w*（r）o先将（23）式改变为

H=px（t）e^一加?

（f）+[々（『）一]w（r）

显然，H是对u的线性函数，因此得到

、

（25）

0,[（1-壬）严+宦F]g（/）-产<0

在上式中，还需解决两个问题:

一是u\t）=U与/（f）=0的转换点匚在什么位置,即匚等于多少？

二是u\t）是由〃到0,还是由0到“。

转换点匚应满足

[（1-£）严+”伽）-宀0

（26）

[£—（£—1）严"]g（f）—1=0oo

从而可解出匚。

因为g（f）是时间/的减函数，所以（26）式的左端也是时间f的减函数，也就是说u\t）随时间应由U到0o于是最优控制策略的具体表达式为

*血0

0,ts

至于5，x（//）的求法，请见下面的例子。

例3在生产设备的最大经济效益的问题中，设<0）=100,U=l,m（t）=2,

一2”p=0.1f8=0.05,g（t）=，试求—，x（//）和u（Z）o

（1+沪

（26）式可得求。

的公式

（27）

（1+土=4—2严…

当时,

u\t）=U=\,状态方程为

dx2

一=_2+T

dt（1+沪

当t>ts时,

/（『）=0,状态方程为

红一2

于是t>ts时，有

-2+—]df+f（―2）力

（1+沪

解得

x（r）=4（1+jf+96-2/（28）

由自由边界条件H\t=tf=-（pJ（及=»勺，得

-px（ff）€*+2小叫=_&x（tf）于是

x（t.）==40

fp-8

当t=tf时，由（28）式有

40=4（1+心尸+96-2—.

即

£tf=2（1+匚），+28（29）

将（27）和（29）联立求解，编写如下Matlab程序

[xzy]=solve（1（1+ts）A（1/2）=4-2*exp（0・05犬（ts-tf））','tf=2*（1+ts）A（1/2）4-28*）

求得ts=10.6,tf=34.8于是，最优控制策略（保养费）为

*fl,0

20,10.6

习题十八

1.求自原点（0,0）到直线x+y-l=0的最速降线。

2.求概率密度函数0（x）,使得信息量

J=-（p（x）ln[i/0（x）]dx

J—00

取最大值，且满足等周条件

（p（x）dx=1,I20（x）dx=cr（常数）。

J—00J—00

3.在生产设备或科学仪器中长期运行的零部件，如滚珠、轴承、电器元件等会突然发生故障或损坏，即使是及时更换也已经造成了一定的经济损失。

如果在零部件运行一定时期后，就对尚属正常的零件做预防性更换，以避免一旦发生故障带来的损失，从经济上看是否更为合算？

如果合算，做这种预防性更换的时间如何确定呢？

展开阅读全文