试求出最优策略的一般关系式。
显然,这时状态转移方程为
k段的指标函数为
令表示由状态出发,从第k年至第n年末时所生产的产品的总产量最大值。
可写出逆推关系式为:
我们知道,在低负荷下生产的时间愈长,机器完好率愈高,但生产产量少。
而在高负荷下生产产量会增加,但机器损坏大。
这样,即使每台产量高,总起来看产量也不高。
从前面的数字计算可以看出,前几年一般是全部用于低负荷生产,后几年则全部用于高负荷生产,这样才产量最高。
如果总共为n年,从低负荷转为高负荷生产的是第t年,1≤t≤n。
即是说,从1至t−1年在低负荷下生产,t至n年在高负荷下生产。
现在要分析t与系数a、b、c、d是什么关系。
从回收率看,(b−a)值愈大,表示在高负荷下生产时,机车损坏情况比在低负荷时严重得多,因此t值应选大些。
从产量看,(c−d)值愈大,表示在高负荷下生产较有利,故t应选小些。
下面我们从(9-2)式这一基本方程出发来求出t与(b−a)、(c−d)的关系。
令。
则在低负荷生产时有,高负荷生产时有。
对第n段,有
由于c>d,所以应选1才能使最大。
也就是说,最后一年应全部投入高负荷生产。
故
对n-1段,根据(9-2)式有
因此,欲要满足上式极值关系的条件是当
时,应取,即n−1年仍应全部在高负荷下生产。
否则,当(9-4)式不满足时,应取,即n−1年应全部投入低负荷生产。
由前面知道,只要在第k年投入低负荷生产,那么递推计算结果必然是从第1年到第k年均为低负荷生产,即有。
可见,算出后,前几年就没有必要再计算了。
故只需研究哪一年由低负荷转入高负荷生产,即从那一年开始变为1就行。
根据这点,现只分析满足(9-4)式的情况。
由于,故(9-3)式变为
又由于,将它代入上式得
对n-2段,由(9-2)式有
由此可知,只要满足极值条件式
就应选,否则为0,即应继续在高负荷下生产。
依次类推,如果转入高负荷下生产的是第t年,则由
可以推出,应满足极值关系的条件必然是:
相应的有最优策略
它就是例2在始端固定终端自由情况下最优策略的一般结果。
从这个例子看到,应用动态规划,可以在不求出数值解的情况下,确定最优策略的结构。
可见,只要知道了a,b,c,d四个值,就总可找到一个t值,满足(9-5)式,且
例如题中给定的,代入(9-5)式,应有
可见,所以t=3,即从第三年开始将全部机器投入高负荷生产,五年内总产量最高。
上面的讨论表明:
当x在[0,]上离散地变化时,利用递推关系式逐步计算或表格法而求出数值解。
当x在[0,]上连续地变化时,若和是线性函数或凸函数时,根据递推关系式运用解析法不难求出和最优解;若和不是线性函数或凸函数时,一般来说,解析法不能奏效,那只好利用递推关系式(9-1)求其数值解。
首先要把问题离散化,即把区间[0,]进行分割,令x=0,Δ,2Δ,…,mΔ=。
其Δ的大小,应根据计算精度和计算机容量等来确定。
然后规定所有的和决策变量只在这些分割点上取值。
这样,递推关系式(9-1)便可写为
对依次计算,可逐步求出及相应的最优决策,最后求得就是所求的最大总收入。
这种离散化算法可以编成程序在计算机中计算。
1。
2二维资源分配问题
设有两