ImageVerifierCode 换一换
格式:DOCX , 页数:11 ,大小:90.50KB ,
资源ID:6460041      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/6460041.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(动态规划84067.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

动态规划84067.docx

1、动态规划84067第七章 动态规划 常见疑问解答1、动态规划是怎样产生的?1951年,R . Bellman 等人,根据某类多阶段序贯决策问题的特点,提出了著名的“最优性原理”。在这个原理的指导下,他将此类多阶段决策问题转变为一系列的互相联系的单阶段决策问题,然后,逐个阶段予以解决,最后再形成总体解决。从而创建了求解优化问题的新方法动态规划。1957年,他的名著动态规划出版。2、动态规划的基本概念有哪些?阶段、(阶段)状态、状态变量si、状态集Si、决策、决策变量ui(si)、决策集Di(si)、状态转移方程、决策的指标函数、策略的指标函数、最优值函数等。3、什么是阶段? 动态规划的阶段指的是

2、决策发生的时间或空间区隔。4、如何划分动态规划问题的阶段? 动态规划问题的阶段划分一般可依据决策发生的次数和每次决策发生并作用的时间段或空间段来定。5、 什么是(阶段)状态? 状态既可以指一个阶段上作决策时所依据的自然状况和客观条件,又可以指一个阶段上所作决策后的结局状况,故一个阶段的状态常有首、末状态之分,以区别阶段上决策的出发点和结局状况。但,一般地,人们往往仅选择各阶段的首、末状态之一,作为各阶段的状态,所以,当谈到各阶段的状态时,要么都指的是各阶段的首状态,要么都指的是各阶段的末状态。6、什么是(阶段)状态变量? 状态变量是对一个阶段上状态(多种)取值情形的描述。人们常用符号sk 表示

3、第k个阶段上的状态变量,k= 1, 2, , n.7、什么是动态规划问题的维数?动态规划问题的维数即指的是各阶段上状态变量的维数。8、各阶段上状态变量的维数是如何确定的?动态规划问题各阶段上的状态常常可能需要用几个属性才能描述清楚。如各个阶段上都要依据资源状态作出生产数量决策时,若生产资源有3种类型,则资源状态就必须用三种类型的资源,即三个属性来共同描述。相应地,资源状态变量就必须用三维向量表示各类资源的取值情形。因此,各阶段上状态变量的维数是由各阶段上状态的属性数确定的。9、什么是动态规划问题的维数灾难? 动态规划问题的维数即指的是各阶段上状态变量的维数。当状态变量的维数增加时,动态规划问题

4、的计算量会呈指数倍增长,限制了人们用动态规划研究问题和解决问题的能力。故,人们把这种情形称为“维数灾难”。10、 * 化解动态规划问题的维数灾难,可以利用的思想是什么? 人们一般采取了降维的办法,即通过一些特殊技巧或算法把一个高维的动态规划问题逐步分解为一些低维的动态规划问题,以此来减轻维数灾难。11、什么是状态集? 一个阶段上状态可有多种取值情形,各种取值情形的集合被称为该阶段上的状态集。人们常用符号Sk 表示第k个阶段上的状态集,k= 1, 2, , n.12、什么是(阶段)决策? 决策是指依据某个阶段的某种状态,从各种可能的方案中作出选择。13、什么是(阶段)决策变量? 决策变量描述了一

5、个阶段上依据某种状态,可能发生的多种决策行为。人们常用符号uk (sk) 表示第k个阶段上基于状态sk 作出的决策行为,k= 1, 2, , n.14、什么是(允许)决策集? 一个阶段上依据某种状态,可能发生的多种决策行为的集合被称为(允许)决策集。人们常用符号Dk (sk) 表示第k个阶段上基于状态sk 可能作出的所有决策行为的集合,k= 1, 2, , n.15、什么是状态转移律? 当从一个阶段的某个状态出发,在该阶段上作出决策后,其决策后果就直接决定了相邻的下一个阶段上的状态取值,这种状态决定规律,被称为状态转移律。状态转移律可通过状态转移方程予以描述。16、如果以每个阶段的首状态作为每

6、个阶段的状态,那么其状态转移方程是怎样的?其各阶段的状态转移方程为.17、如果以每个阶段的末状态作为每个阶段的状态,那么其状态转移方程是怎样的?其各阶段的状态转移方程为.18、动态规划问题具有什么特征?动态规划问题具有如下四个特征。a. 是各阶段前后关联且呈链状结构的多阶段决策序列;b. 具有无后效性(马尔可夫性),即某个阶段上的状态,只受该阶段相邻的前一个阶段状态的影响,而与以前各阶段状态无关。这个特征决定了动态规划问题的状态转移规律。c. 策略的指标函数具有可分离性,即策略的指标函数一般是各阶段指标函数的和或积的形式。d. 具有边界条件。19、分析一个动态规划问题时,人们常画出其链状结构的

7、多阶段决策示意图,反映阶段划分、状态变量、决策变量以及考察途径,那么这种图形形式是怎样的?a. 若阶段状态为各阶段的首状态,则图形常可如下画出。b. 若阶段状态为各阶段的末状态,则图形常可如下画出。20、什么是决策的指标函数?决策的指标函数是一个阶段上所作决策产生的效益或成本费用等决策效果的一种测度。一个阶段上决策的指标函数常用符号,或 表示。21、什么是策略?所谓策略指的是在动态规划问题中,从开始阶段的某个状态出发,连贯地在各阶段上作决策所形成的决策序列。一个n阶段动态规划问题的策略,a. 若阶段状态为各阶段的首状态,则策略常可表示为,p1n(s1)=s1, u1(s1), s2, u2(s

8、2), , sn, un(sn), sn+1或p1n(s1)= u1(s1), u2(s2), , un(sn) .b. 若阶段状态为各阶段的末状态,则策略常可表示为,p n 1 (sn+1)= sn+1, un(sn+1), sn, un1(sn), , s2, u1(s2), s1或p n 1 (sn+1)= un(sn+1), un1(sn), , u1(s2) .22、什么是策略集?在动态规划问题中,从开始阶段的某个状态出发的所有策略的集合被称为关于这个初始状态的策略集。一个n阶段动态规划问题的策略集,常可表示为,p1n(s1)P1n(s1)或pn1 (sn+1)P n 1 (sn+1

9、).23、什么是子策略?所谓子策略指的是在动态规划问题中,从某个阶段的某个状态出发,连贯地在其后各阶段上作决策所形成的决策序列。一个n阶段动态规划问题,a. 若阶段状态为各阶段的首状态,则后部k子策略(从第k个阶段的sk状态出发到第n个阶段为止的序贯决策序列)常可表示为,pkn(sk)=sk, uk (sk), sk+1, u k+1 (s k+1), , sn, un(sn), sn+1或pkn(sk)= uk (sk), u k+1 (s k+1), , un(sn) .b. 若阶段状态为各阶段的末状态,则前部k子策略(从第k个阶段的sk1状态出发到第1个阶段为止的序贯决策序列)常可表示为

10、,pk1(sk1)=sk1, uk (sk1), sk, uk1 (sk), , s2, u1(s2), s1或pk1(sk1)= uk (sk1), uk1 (sk), , u1(s2) .24、什么是子策略集?在动态规划问题中,从某个阶段的某个状态出发的所有子策略的集合被称为关于这个状态的子策略集。一个n阶段动态规划问题的子策略集,常可表示为,pkn(sk)Pkn(sk)或pk1 (sk+1)P k 1 (sk+1).25、什么是(子)策略的指标函数?子策略的指标函数是对一个子策略所产生的效益或成本费用等策略效果的一种测度。a. 若阶段状态为各阶段的首状态,一个n阶段动态规划问题的后部k子

11、策略(从第k个阶段的sk状态出发到第n个阶段为止的序贯决策序列)的指标函数,常可表示为,. 当k=1时,即为策略的指标函数。b. 若阶段状态为各阶段的末状态,一个n阶段动态规划问题的前部k子策略(从第k个阶段的sk1状态出发到第1个阶段为止的序贯决策序列)的指标函数,常可表示为,当k=n时,即为策略的指标函数。26、最优(子)策略指标函数的表达式是怎样的?a. 若阶段状态为各阶段的首状态,则最优后部k子策略指标函数的表达式一般写为如下形式,当k=1, 即为最优策略指标函数的表达式。b. 若阶段状态为各阶段的末状态,则最优前部k子策略指标函数的表达式一般写为如下形式,当k=n, 即为最优策略指标

12、函数的表达式。27、最优性原理是如何表述的?作为整个决策过程的最优策略具有这样的性质:即无论前面的状态和决策如何,对前面的决策所形成的某个阶段的状态而言,余下的诸决策必须构成最优子策略。简言之,最优策略的子策略总是最优的。28、如何理解最优性原理?不妨设一个n阶段的动态规划问题的最优策略为p1n*(s1*)=s1*, u1*(s1*), s2, u2*(s2*), , sn*, un*(sn*), sn+1*, 则从最优策略上的任一个阶段状态sk*出发,所截取出的后部k子策略pkn*(sk*)=sk*, uk*(sk*), sk+1*, u k+1*(s k+1*), , sn*, un*(s

13、n*), sn+1* ,必是从sk*出发的所有后部k子策略中最优的。或者,当一个n阶段的动态规划问题的最优策略为p n 1* (sn+1*)= sn+1*, un* (sn+1*), sn*, un1* (sn*), , s2*, u1* (s2*), s1*.则从最优策略上的任一个阶段状态sk+1*出发,所截取出的前部k子策略pk1*(sk1*)=sk1*, uk*(sk1*), sk*, uk1*(sk*), , s2*, u1*(s2*), s1*,必是从sk+1*出发的所有前部k子策略中最优的。 简言之,最优策略的子策略总是最优的。由此,可以看到,最优性原理是对策略为最优策略时的性质总

14、结。故,最优性原理不过是最优策略的必要条件而已。29、动态规划有哪两类主要方法?一个是逆推法,一个是顺推法。30、动态规划逆推法的数学模型是如何表述的?一般应首先进行阶段的划分和各阶段状态变量、决策变量的认定,以及状态转移方程和状态集、决策集的分析、指标函数的设计,然后用数学的语言写出模型。逆推法下的模型如下,31、动态规划顺推法的数学模型是如何表述的?一般应首先进行阶段的划分和各阶段状态变量、决策变量的认定,以及状态转移方程和状态集、决策集的分析、指标函数的设计,然后用数学的语言写出模型。顺推法下的模型如下,32、离散动态规划与连续动态规划有何区别?离散动态规划与连续动态规划的区别主要表现在

15、决策和状态变量是离散还是连续取值。33、静态规划用动态规划法求解的前提条件是什么?静态规划用动态规划法求解的前提条件是能够进行空间的分离。34、逆推法和顺推法解决问题的对象有何不同?选择逆推法还是顺推法有时会带来求解过程的复杂性不同。为使求解过程尽可能的简化,可依据一个简单规则做出判断,如果越后的阶段指标函数越复杂,则选用顺推法;反之,则选用逆推法。如下面的例子中,根据不同特点,分别选择了不同方法。(顺推法) (逆推法) 35、逆推法求解动态规划问题的一般步骤是怎样的?逆推法求解动态规划问题的一般步骤如下,a. 写出逆推法下的数学模型。b. 按照逆推法递推公式,从后往前逐步推导出从第k个阶段的

16、sk状态出发到第n个阶段为止的最优后部k子策略,pkn* (sk)=sk, uk*(sk), sk+1*, u k+1*(sk+1*), , sn*, un* (sn*), sn+1*, k= n, n1, ,. 2, 1c. 利用初始边界条件,从前往后逐步顺定出最优策略中各阶段的状态和决策变量值。36、顺推法求解动态规划问题的一般步骤是怎样的?顺推法求解动态规划问题的一般步骤如下,a. 写出顺推法下的数学模型。b. 按照顺推法递推公式,从前往后逐步推导出从第k个阶段的sk1状态出发到第1个阶段为止的最优前部k子策略,pk1*(sk1)=sk1, uk*(sk1), sk*, uk1*(sk*

17、), , s2*, u1*(s2*), s1*, k=1, 2, , n.c. 利用终端边界条件,从后往前逐步逆定出最优策略中各阶段的状态和决策变量值。37、如何用动态规划方法求解如下的连续静态规划问题?答:此非线性规划问题可按维数进行空间分离,故可用动态规划方法求解。a. 动态规划数学模型(a) 状态转移方程和决策集 s410, s3=s43x3 D3=x3 0 x3 s4/3 s2=s34x2 D2=x2 0 x2 s3/4 s1=s22x1 D1=x1 0 x1s2/2 (b) 递推公式:b. 顺推过程c. 逆定38、* 如何用动态规划方法求解如下的离散静态规划问题?max 150x1+75x2+80x3+85x470x1+75x2+80x3+85x4220x1, x2, x3, x40, 整数答:逆推法求解过程如下,a. 逆推(a) a b c (b) a b (c) b. 顺定综上(a), (b), (c), x1=3, x2= x3=x4=0, 为最优解。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1