1、动态规划动态规划动态规划动态规划(Dynamic Programming)R.Bellman50年代执教于普林斯顿和斯坦福大学,年代执教于普林斯顿和斯坦福大学,后进入兰德(后进入兰德(Rand)研究所。研究所。1957年发表年发表“Dynamic Programming”一书,标识动态规划的正式诞生。一书,标识动态规划的正式诞生。动态规划是解决复杂系统优化问题的一种方法。动态规划是解决复杂系统优化问题的一种方法。是解决是解决动态系统多阶段动态系统多阶段决策过程的基本方法之一决策过程的基本方法之一。教学大纲教学大纲:理解理解动态规划基本概念、最优化原理动态规划基本概念、最优化原理和基本方程和基本
2、方程,通过资源分配和生产与存储通过资源分配和生产与存储等问题等问题,学习应用动态规划解决多阶段决学习应用动态规划解决多阶段决策问题。策问题。重点重点:掌握动态规划掌握动态规划模型结构模型结构、逆序逆序法法算法原理算法原理、资源分配、设备更新、生产资源分配、设备更新、生产于存贮于存贮等问题等问题。难点难点为动态规划中为动态规划中状态变状态变量量等的确定。等的确定。123451.多阶段的决策问题多阶段的决策问题引例引例1 最短路问题最短路问题A12345678E75632515142534463333例例2:生产与投入问题:生产与投入问题例例3:将一个单数:将一个单数C(C 0)分成分成 n 个部
3、分个部分C1,C2 ,Cn之和,且之和,且Ci 0(i=1,n),问如何分割使其乘),问如何分割使其乘积为最大积为最大 包含包含随时间变化随时间变化的因素和变量的系统。的因素和变量的系统。系统在某个时刻的状态,往往要依某系统在某个时刻的状态,往往要依某种形式受过去某些决策的影响;种形式受过去某些决策的影响;将时间作为决策变量之一的决策问将时间作为决策变量之一的决策问题称为动态决策问题。题称为动态决策问题。如如经济系统经济系统,生产系统等生产系统等。动态系统动态系统:线性系统、非线性系统。线性系统、非线性系统。动态系统动态系统的特点:的特点:动态决策动态决策 问题:问题:而系统的当前状态和决策又
4、会影响而系统的当前状态和决策又会影响系统今后的发展。系统今后的发展。动态规划的研究对象即在系统发展的不同时刻(或阶段)根据系统即在系统发展的不同时刻(或阶段)根据系统所处的状态,不断地做出决策;所处的状态,不断地做出决策;每个阶段都要进行每个阶段都要进行决策决策,目的是使整个过程的决策目的是使整个过程的决策 达到最优效果。达到最优效果。动态决策问题的特点:动态决策问题的特点:系统所处的状态和时刻是进行决策的重要因素;系统所处的状态和时刻是进行决策的重要因素;找到不同时刻的最优决策以及整个过程的最优策略。找到不同时刻的最优决策以及整个过程的最优策略。多阶段决策问题:多阶段决策问题:是动态决策问题
5、的一种特殊形式;是动态决策问题的一种特殊形式;在多阶段决策过程中在多阶段决策过程中,系统的动态过程可以按照时间系统的动态过程可以按照时间进程分为进程分为状态状态相互相互联系联系而又相互而又相互区别区别的各个的各个阶段阶段;多阶段决策问题的典型例子:多阶段决策问题的典型例子:1.生产决策问题生产决策问题:企业在生产过程中,由于需:企业在生产过程中,由于需求是随时间变化的,因此企业为了获得全年的最佳求是随时间变化的,因此企业为了获得全年的最佳生产效益,就要在整个生产过程中逐月或逐季度地生产效益,就要在整个生产过程中逐月或逐季度地根据库存和需求决定生产计划。根据库存和需求决定生产计划。2.机机器器负
6、负荷荷分分配配问问题题:某某种种机机器器可可以以在在高高低低两两种种不不同同的的负负荷荷下下进进行行生生产产。在在高高负负荷荷下下进进行行生生产产时时,产品的年产量产品的年产量g和投入生产的机器数量和投入生产的机器数量u1的关系为的关系为g=g(u1)12n状态状态决策决策状态状态决策决策状态状态状态状态决策决策 这时,机器的年完好率为这时,机器的年完好率为a,即如果年初完好机即如果年初完好机器的数量为器的数量为u,到年终完好的机器就为到年终完好的机器就为au,0a1。在低负荷下生产时,产品的年产量在低负荷下生产时,产品的年产量h和投入生和投入生产的机器数量产的机器数量u2的关系为的关系为 h
7、=h(u2)假定开始生产时完好的机器数量为假定开始生产时完好的机器数量为s1。要求制要求制定一个五年计划,在定一个五年计划,在每年开始时,决定如何重新每年开始时,决定如何重新分配分配完好的完好的机器在两种不同的负荷下生产的数量机器在两种不同的负荷下生产的数量,使在五年内产品的总产量达到最高。使在五年内产品的总产量达到最高。相应的机器年完好率相应的机器年完好率b,0 b9/2当当当当时时时时矛盾,舍去矛盾,舍去。(最优决策)(最优决策)S20一般动态规划应用动态规划的优缺点动态规划的优缺点优点优点:.最优解是全局最优解。最优解是全局最优解。.能得到一系列(包括子过程)的最优解。能得到一系列(包括子过程)的最优解。.不需要对系统状态转移方程、阶段效应函数不需要对系统状态转移方程、阶段效应函数等的解析性质作任何假设。等的解析性质作任何假设。缺点:缺点:.没有统一的标准模型和标准的算法可供使用。没有统一的标准模型和标准的算法可供使用。.应用的局限性,要求满足应用的局限性,要求满足“无后效性无后效性”。.“维数灾难维数灾难”问题。问题。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1