ImageVerifierCode 换一换
格式:DOCX , 页数:34 ,大小:49.71KB ,
资源ID:4684228      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/4684228.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(动态规划基础.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

动态规划基础.docx

1、动态规划基础动态规划(一)、动态规划的基本思想:动态规划算法通常用于求解具有某种最优性质的问题。在这类问题中,可能会有许多可行解。每一个解都对应于一个值,我们希望找到具有最优值的解。动态规划算法与分治法类似,其基本思想也是将待求解问题分解成若干个子问题,先求解子问题,然后从这些子问题的解得到原问题的解。与分治法不同的是,适合于用动态规划求解的问题,经分解得到子问题往往不是互相独立的。若用分治法来解这类问题,则分解得到的子问题数目太多,有些子问题被重复计算了很多次。如果我们能够保存已解决的子问题的答案,而在需要时再找出已求得的答案,这样就可以避免大量的重复计算,节省时间。我们可以用一个表来记录所

2、有已解的子问题的答案。不管该子问题以后是否被用到,只要它被计算过,就将其结果填入表中。这就是动态规划法的基本思路。具体的动态规划算法多种多样,但它们具有相同的填表格式。二、设计动态规划法的步骤:1、找出最优解的性质,并刻画其结构特征;2、递归地定义最优值(写出动态规划方程);3、以自底向上的方式计算出最优值;4、根据计算最优值时得到的信息,构造一个最优解。步骤1-3是动态规划算法的基本步骤。在只需要求出最优值的情形,步骤4可以省略,步骤3中记录的信息也较少;若需要求出问题的一个最优解,则必须执行步骤4,步骤3中记录的信息必须足够多以便构造最优解。三、动态规划问题的特征:动态规划算法的有效性依赖

3、于问题本身所具有的两个重要性质:最优子结构性质和子问题重叠性质。1、最优子结构:当问题的最优解包含了其子问题的最优解时,称该问题具有最优子结构性质。2、重叠子问题:在用递归算法自顶向下解问题时,每次产生的子问题并不总是新问题,有些子问题被反复计算多次。动态规划算法正是利用了这种子问题的重叠性质,对每一个子问题只解一次,而后将其解保存在一个表格中,在以后尽可能多地利用这些子问题的解。(二)、动态规划算法的基本步骤设计一个标准的动态规划算法,通常可按以下几个步骤进行: 1. 划分阶段:按照问题的时间或空间特征,把问题分为若干个阶段。注意这若干个阶段一定要是有序的或者是可排序的(即无后向性),否则问

4、题就无法用动态规划求解。 2. 选择状态:将问题发展到各个阶段时所处于的各种客观情况用不同的状态表示出来。当然,状态的选择要满足无后效性。 3. 确定决策并写出状态转移方程:之所以把这两步放在一起,是因为决策和状态转移有着天然的联系,状态转移就是根据上一阶段的状态和决策来导出本阶段的状态。所以,如果我们确定了决策,状态转移方程也就写出来了。但事实上,我们常常是反过来做,根据相邻两段的各状态之间的关系来确定决策。 4. 写出规划方程(包括边界条件):动态规划的基本方程是规划方程的通用形式化表达式。一般说来,只要阶段、状态、决策和状态转移确定了,这一步还是比较简单的。 动态规划的主要难点在于理论上

5、的设计,一旦设计完成,实现部分就会非常简单。根据动态规划的基本方程可以直接递归计算最优值,但是一般将其改为递推计算,实现的大体上的框架如下: 标准动态规划的基本框架frame1. 对fn+1(xn+1)初始化; 边界条件2. for k:=n downto 1 do 3. for 每一个xkXk do4. for 每一个ukUk(xk) do begin5. fk(xk):=一个极值; 或6. xk+1:=Tk(xk,uk); 状态转移方程7. t:=(fk+1(xk+1),vk(xk,uk); 基本方程(9)式8. if t比fk(xk)更优 then fk(xk):=t; 计算fk(xk)

6、的最优值 end; 9. t:=一个极值; 或10. for 每一个x1X1 do11. if f1(x1)比t更优 then t:=f1(x1); 按照10式求出最优指标12. 输出t;但是,实际应用当中经常不显式地按照上面步骤设计动态规划,而是按以下几个步骤进行: 1. 分析最优解的性质,并刻划其结构特征。 2. 递归地定义最优值。 3. 以自底向上的方式或自顶向下的记忆化方法(备忘录法)计算出最优值。 4. 根据计算最优值时得到的信息,构造一个最优解。 步骤(1)-(3)是动态规划算法的基本步骤。在只需要求出最优值的情形,步骤(4)可以省略,若需要求出问题的一个最优解,则必须执行步骤(4

7、)。此时,在步骤(3)中计算最优值时,通常需记录更多的信息,以便在步骤(4)中,根据所记录的信息,快速地构造出一个最优解。 (三)、动态规划概述1.基本思想:将问题分解为若干小问题,解子问题,然后从子问题得到原问题的解。 2.特点:将问题分解为子问题,这些子问题往往不相互独立。(如果可以用分治法求解,分解的子问题太多,因此,用分治法时间代价太高,消耗指数时间)3.且某些子问题可能被重复多次计算,因此将计算过的子问题的结果保存。一般,放入表中。4.应用:往往求解具有某种最优性质的问题,此类问题往往具有多个解,我们要找到具有最优值的那个解。5.步骤:找出最优解的性质,刻画其特征;递归地定义最优值;

8、以自底向上的方式计算出最优值;根据计算最优值时得到的信息,构造一个最优解。(四)、动态规划问题中的术语阶段:把所给求解问题的过程恰当地分成若干个相互联系的阶段,以便于求解,过程不同,阶段数就可能不同描述阶段的变量称为阶段变量。在多数情况下,阶段变量是离散的,用k表示。此外,也有阶段变量是连续的情形。如果过程可以在任何时刻作出决策,且在任意两个不同的时刻之间允许有无穷多个决策时,阶段变量就是连续的。在前面的例子中,第一个阶段就是点A,而第二个阶段就是点A到点B,第三个阶段是点B到点C,而第四个阶段是点C到点D。 状态:状态表示每个阶段开始面临的自然状况或客观条件,它不以人们的主观意志为转移,也称

9、为不可控因素。在上面的例子中状态就是某阶段的出发位置,它既是该阶段某路的起点,同时又是前一阶段某支路的终点。在前面的例子中,第一个阶段有一个状态即A,而第二个阶段有两个状态B1和B2,第三个阶段是三个状态C1,C2和C3,而第四个阶段又是一个状态D。过程的状态通常可以用一个或一组数来描述,称为状态变量。一般,状态是离散的,但有时为了方便也将状态取成连续的。当然,在现实生活中,由于变量形式的限制,所有的状态都是离散的,但从分析的观点,有时将状态作为连续的处理将会有很大的好处。此外,状态可以有多个分量(多维情形),因而用向量来代表;而且在每个阶段的状态维数可以不同。当过程按所有可能不同的方式发展时

10、,过程各段的状态变量将在某一确定的范围内取值。状态变量取值的集合称为状态集合。无后效性:我们要求状态具有下面的性质:如果给定某一阶段的状态,则在这一阶段以后过程的发展不受这阶段以前各段状态的影响,所有各阶段都确定时,整个过程也就确定了。换句话说,过程的每一次实现可以用一个状态序列表示,在前面的例子中每阶段的状态是该线路的始点,确定了这些点的序列,整个线路也就完全确定。从某一阶段以后的线路开始,当这段的始点给定时,不受以前线路(所通过的点)的影响。状态的这个性质意味着过程的历史只能通过当前的状态去影响它的未来的发展,这个性质称为无后效性。决策:一个阶段的状态给定以后,从该状态演变到下一阶段某个状

11、态的一种选择(行动)称为决策。在最优控制中,也称为控制。在许多间题中,决策可以自然而然地表示为一个数或一组数。不同的决策对应着不同的数值。描述决策的变量称决策变量,因状态满足无后效性,故在每个阶段选择决策时只需考虑当前的状态而无须考虑过程的历史。决策变量的范围称为允许决策集合。策略:由每个阶段的决策组成的序列称为策略。对于每一个实际的多阶段决策过程,可供选取的策略有一定的范围限制,这个范围称为允许策略集合。允许策略集合中达到最优效果的策略称为最优策略。给定k阶段状态变量x(k)的值后,如果这一阶段的决策变量一经确定,第k+1阶段的状态变量x(k+1)也就完全确定,即x(k+1)的值随x(k)和

12、第k阶段的决策u(k)的值变化而变化,那么可以把这一关系看成(x(k),u(k)与x(k+1)确定的对应关系,用x(k+1)=Tk(x(k),u(k)表示。这是从k阶段到k+1阶段的状态转移规律,称为状态转移方程。最优性原理:作为整个过程的最优策略,它满足:相对前面决策所形成的状态而言,余下的子策略必然构成“最优子策略”。最优性原理:实际上是要求问题的最优策略的子策略也是最优。让我们通过对前面的例子再分析来具体说明这一点:从A到D,我们知道,最短路径是AB1C2D,这些点的选择构成了这个例子的最优策略,根据最优性原理,这个策略的每个子策略应是最优:AB1C2是A到C2的最短路径,B1C2D也是

13、B1到D的最短路径事实正是如此,因此我们认为这个例子满足最优性原理的要求。(五)、标号法标号法是一种最佳算法,多用于求图的最短路问题。一、标号法的概念:所谓标号,是指与图的每一个顶点相对应的一个数字。标号法可以说是动态规划,它采用顺推的方法,对图的每一边检测一次,没有重复的回溯搜索,因此标号法是一种最佳算法。 二、标号法的算法流程:现有一图G,求从起点Vs到终点Ve的最短距离。设:Sum(j)顶点Vj的标号,代表的是Vs到Vj的最短距离。Vj已标味着Vs到Vj的最短路以及这条路径的长度已求出。M(i,j)Vi到Vj的非负长度。H(j)顶点Vj的前趋结点。标号法的算法流程如下:sum(s)0Vs

14、进入队列L-移出队列L的队首Vk-|Vk是不是Ve-|-计算结束打印路径|NY|由Vk扩展出结点Vj|(Vk与Vj之间相连)|SjSum(k)+M(k,j)|Sj小于Sum(j)|Y|N|-|Sum(j)Sj|H(j)Vk|Vj加入队列L并对队列L按Sum值由小到大排序|-注意:1.只有两个顶点间的距离为非负时,才可用标号法。2.只有队列的首结点是目标结点时,才可停止计算。否则得出的不一定是最优解。三、例题解析:1.相邻项序列(GDOI97第四题)问题描述:对于一个N*N(=100)的正整数矩阵M,存在从MA1,B1开始到MA2,B2结束的相邻项序列.两个项MI,J和MK,L相邻的件是指满足如

15、下情况之一:(1)I=K+-1和J=L(2)I=K和J=L+-1。任务:从文件中输入矩阵M,再读入K(K=4)组MA1,B1和MA2,B2的值。对于每一组MA1,B1和MA2,B2,求一相邻项序列,使得相邻项之差的绝对值之和为最小。输入格式:4N19612每行N个数据,共N行873559111173262K4114表示A1,B1和A2,B2的值,共K行2234输出格式:117第一组数据相邻项之差的绝对值之和的最小值是1775879612第一组数据的相邻项序列24791111解析:本题若将相邻的两个数看作是两个顶点,两个数之差的绝对值作为权,则问题转化成求两个顶点的最短路问题。设:SumI,J为

16、从起点Vs到结点MI,J的最短距离。HI,J记录结点MI,J的前趋结点。L为记录待扩展的结点的队列。鉴于数组进行排序时速度较慢,所以用链表作为记录结点的队列的类型,适于排序。参考程序:Programgdoi974;constfang:array1.4,1.2ofinteger=(-1,0),(0,-1),(1,0),(0,1);上下左右四个方向type定义POINT类型,其中X,Y为结点在矩阵中的坐标,NEXT为队列中的后继结点point=note;note=recordx,y:byte;next:point;end;varsum:Array1.100,1.100ofinteger;m:Arr

17、ay1.100,1.100ofinteger;h:Array1.100,1.100,1.2ofbyte;f1,f2:text;a,b,x1,y1,x2,y2,n,k,zz:integer;procedureprint;vara,b,x,y,x3,y3:integer;c:array1.100ofinteger;flag:boolean;beginflag:=true;a:=1;ca:=mx2,y2;x:=x2;y:=y2;whileflagdobegina:=a+1;x3:=x;y3:=y;x:=hx3,y3,1;y:=hx3,y3,2;ca:=mx,y;if(x=x1)and(y=y1)th

18、enflag:=false;end;求出整条路径,放入数组C中writeln(f2,zz,sumx2,y2);forb:=adownto1dowrite(f2,cb,);打印结果writeln(f2);end;procedureadd(x,y,i:integer;varl:point);vare,f,g:point;a,b,c:integer;flag:boolean;beginnew(e);e.x:=x;e.y:=y;ifi=0thenl.next:=e加入队列elsebeginf:=l;g:=f.next;flag:=true;fora:=1toidobeginifsumg.x,g.ysu

19、mx,ythenbegine.next:=g;f.next:=e;flag:=false;a:=i;加入队列end;f:=f.next;g:=f.next;end;ifflagthenf.next:=e;加入队列end;end;proceduretry(xz,yz:byte);vara,b,c,sj,x,y,x1,y1:integer;e,l,v:point;flag:boolean;beginfillchar(sum,sizeof(sum),255);置Sum值为-1sumxz,yz:=0;置起点Sum值为0flag:=true;new(e);e.x:=xz;e.y:=yz;new(l);l

20、.next:=e;起点进入队列c:=1;现在队列结点个数whileflagdobeginv:=l.next;dispose(l);取出首结点Vl:=v;c:=c-1;指针下移一位,结点个数减一x:=v.x;y:=v.y;if(x=x2)and(y=y2)thenflag:=false;若为目标结点,则结束计算ifflagthenbeginfora:=1to4do向四个方向扩展beginx1:=x+fanga,1;y1:=y+fanga,2;if(x10)and(x10)and(y1=n)thenbeginsj:=sumx,y+abs(mx,y-mx1,y1);if(sjsumx1,y1)or(

21、sumx1,y1=-1)thenbeginsumx1,y1:=sj;hx1,y1,1:=x;hx1,y1,2:=y;记录路径add(x1,y1,c,l);将新扩展出来的结点进入队列c:=c+1;结点个数加一end;end;end;end;end;print;打印结果end;Beginassign(f1,gdoi974.dat);assign(f2,gdoi974.out);reset(f1);rewrite(f2);readln(f1,n);fora:=1tondobeginforb:=1tondoread(f1,ma,b);readln(f1);end;读入数组readln(f1,k);fo

22、ra:=1tokdobeginzz:=a;readln(F1,x1,y1,x2,y2);读入任务try(x1,y1);end;close(f1);close(f2);End.四、小结综上所述,标号法是动态规划的一种,它采用顺推的方法,对图的每一边检测一次,没有重复的回溯搜索,要比一般的搜索优秀得多。它是一种最佳算法。(六)、动态规划教程一.动态规划含义:在现实生活中,有一类活动的过程,由于它的特殊性,可将过程分成若干个互相联系的阶段,在它的每一阶段都要做出决策,从而使整个过程达到最好的活动效果.因此,各个阶段决策确定后,组成一个决策序列,因而也就确定了整个过程的一条活动路线.这种把一个问题看作

23、是一个前后关联具有链状结构的多阶段过程,就称为多阶段决策过程,这种问题称为多阶段决策问题.在多阶段决策问题中,各个阶段采取的决策,一般来说是和时间有关的,决策依赖于当前状态,又随即引起状态的转移,一个决策序列就是在变化的状态中产生出来的,故有动态的含义,我们称这种解决多阶段决策最优化的过程为动态规划.二.动态规划特征动态规划的显著特征是:无后效性,有边界条件,且一般划分为很明显的阶段.动态规划一般还存在一条或多条状态转移方程. 三.例题1.Catcher防卫导弹(GDOI98)题目讲得很麻烦,归根结底就是求一整串数中的最长不上升序列这道题目一开始我使用回溯算法,大概可以拿到1/3的分吧,后来发现这其实是动态规划算法中最基础的题目,用一个二维数组C1.Max,1.2来建立动态规划状态转移方程(注:C1.Max,1表示当前状态最多可击落的导弹数,C1.Max,2表示当前状态的前继标志):Ci=MaxCj+1,(j=i+1.n),然后程序也就不难实现了.示范程序:programcatcher_hh;varf:text;i,j,k,max,n,num:integer;a:array1.4000ofinteger;导弹高度数组c:array

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1