数学建模教材4第四章动态规划.docx
《数学建模教材4第四章动态规划.docx》由会员分享,可在线阅读,更多相关《数学建模教材4第四章动态规划.docx(11页珍藏版)》请在冰豆网上搜索。
数学建模教材4第四章动态规划
例2生产计划问题
工厂生产某种产品,每单位(千件)的成本为1(千元),每次开工的固定成本为3
(千元),工厂每季度的最大生产能力为6(千件)。
经调查,市场对该产品的需求量第一、二、三、四季度分别为2,3,2,4(千件)。
如果工厂在第一、二季度将全年的需求都生产出来,自然可以降低成本(少付固定成本费),但是对于第三、四季度才能上市的产品需付存储费,每季每千件的存储费为0.5(千元)。
还规定年初和年末这种产品均无库存。
试制定一个生产计划,即安排每个季度的产量,使一年的总费用(生产成本和存储费)最少。
1.2决策过程的分类根据过程的时间变量是离散的还是连续的,分为离散时间决策过程(discrete-time
-56-
decisionprocess)和连续时间决策过程(continuous-timedecisionprocess);根据过程的
演变是确定的还是随机的,分为确定性决策过程(deterministicdecisionprocess)和随机性决策过程(stochasticdecisionprocess),其中应用最广的是确定性多阶段决策过程。
§2基本概念、基本方程和计算方法
2.1动态规划的基本概念和基本方程一个多阶段决策过程最优化问题的动态规划模型通常包含以下要素。
2.1.1阶段阶段(step)是对整个过程的自然划分。
通常根据时间顺序或空间顺序特征来划分阶
段,以便按阶段的次序解优化问题。
阶段变量一般用k=1,2,L,n表示。
在例1中由A
出发为k=1,由Bi(i=1,2)出发为k=2,依此下去从Fi(i=1,2)出发为k=6,共
n=6个阶段。
在例2中按照第一、二、三、四季度分为k=1,2,3,4,共四个阶段。
2.1.2状态状态(state)表示每个阶段开始时过程所处的自然状况。
它应能描述过程的特征并
且无后效性,即当某阶段的状态变量给定时,这个阶段以后过程的演变与该阶段以前各阶段的状态无关。
通常还要求状态是直接或间接可以观测的。
描述状态的变量称状态变量(statevariable)。
变量允许取值的范围称允许状态集合
(setofadmissiblestates)。
用xk表示第k阶段的状态变量,它可以是一个数或一个向量。
用Xk表示第k阶段的允许状态集合。
在例1中x2可取B1,B2,或将Bi定义为i(i=1,2),则x2=1或2,而X2={1,2}。
n个阶段的决策过程有n+1个状态变量,xn+1表示xn演变的结果。
在例1中x7取
G,或定义为1,即x7=1。
根据过程演变的具体情况,状态变量可以是离散的或连续的。
为了计算的方便有时
将连续变量离散化;为了分析的方便有时又将离散变量视为连续的。
状态变量简称为状态。
2.1.3决策当一个阶段的状态确定后,可以作出各种选择从而演变到下一阶段的某个状态,这
种选择手段称为决策(decision),在最优控制问题中也称为控制(control)。
描述决策的变量称决策变量(decisionvariable),变量允许取值的范围称允许决策
集合(setofadmissibledecisions)。
用uk(xk)表示第k阶段处于状态xk时的决策变量,它是xk的函数,用Uk(xk)表示xk的允许决策集合。
在例1中u2(B1)可取C1,C2或C3,可记作u2
(1)=1,2,3,而U2
(1)={1,2,3}。
决策变量简称决策。
2.1.4策略
决策组成的序列称为策略(policy)。
由初始状态x1开始的全过程的策略记作
p1n(x1),即
p1n(x1)={u1(x1),u2(x2),L,un(xn)}.
由第k阶段的状态xk开始到终止状态的后部子过程的策略记作pkn(xk),即
pkn(xk)={uk(xk),L,un(xn)},k=1,2,L,n-1.
类似地,由第k到第j阶段的子过程的策略记作
-57-
§3逆序解法的计算框图
-59-
-60-
§6具体的应用实例
例6设某工厂有1000台机器,生产两种产品A、B,若投入x台机器生产A产
-63-
问指派哪个人去完成哪项工作,可使总的消耗时间为最小?
试对此问题用动态规划
方法求解。
3.为保证某一设备的正常运转,需备有三种不同的零件E1,E2,E3。
若增加备用零件的数量,可提高设备正常运转的可靠性,但增加了费用,而投资额仅为8000元。
已
知备用零件数与它的可靠性和费用的关系如表2所示。
现要求在既不超出投资额的限制,又能尽量提高设备运转的可靠性的条件下,问
各种零件的备件数量应是多少为好?
4.某工厂购进100台机器,准备生产I、II两种产品,若生产产品I,每台机器每年可收入45万元,损坏率为65%;若生产产品II,每台机器每年收入为35万元,损坏率为35%,估计三年后将有新型机器出现,旧的机器将全部淘汰。
试问每年应如何
-66-
-67-