1、数学模型电子教案重庆邮电大学计算机科学与技术学院沈世云第八章第八章 对策与决策模型对策与决策模型第八章第八章 对策与决策模型对策与决策模型 对策与决策是人们生活和工作中经常会遇到的择优活动。对策与决策是人们生活和工作中经常会遇到的择优活动。人们在处理一个问题时,往往会面临几种情况,同时又存在人们在处理一个问题时,往往会面临几种情况,同时又存在几种可行方案可供选择,要求根据自己的行动目的选定一种几种可行方案可供选择,要求根据自己的行动目的选定一种方案,以期获得最佳的结果。方案,以期获得最佳的结果。有时,人们面临的问题具有竞争性质,如商业上的竞争、有时,人们面临的问题具有竞争性质,如商业上的竞争、
2、体育中的比赛和军事行动、政治派别的斗争等等。这时竞争体育中的比赛和军事行动、政治派别的斗争等等。这时竞争双方或各方都要发挥自己的优势,使己方获得最好结果。因双方或各方都要发挥自己的优势,使己方获得最好结果。因而双方或各方都要根据不同情况、不同对手做出自己的决择,而双方或各方都要根据不同情况、不同对手做出自己的决择,此时的决策称为对策。在有些情况下,如果我们把可能出现此时的决策称为对策。在有些情况下,如果我们把可能出现的若干种情况也看作是竞争对手可采取的几种策略,那么也的若干种情况也看作是竞争对手可采取的几种策略,那么也可以把决策问题当作对策问题来求解。可以把决策问题当作对策问题来求解。8.1
3、8.1 对策问题对策问题 对策问题的特征是参与者为利益相互冲突的各方,其结局对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合不取决于其中任意一方的努力而是各方所采取的策略的综合结果。结果。先考察几个实际例子。先考察几个实际例子。例例8.1 (田忌赛马)(田忌赛马)田忌赛马是大多数人都熟知的故事,传说战国时期齐王欲与田忌赛马是大多数人都熟知的故事,传说战国时期齐王欲与大将田忌赛马,双方约定每人挑选上、中、下三个等级的马大将田忌赛马,双方约定每人挑选上、中、下三个等级的马各一匹进行比赛,每局赌金为一千金。齐王同等级的马均比各一匹进行比赛,每局赌
4、金为一千金。齐王同等级的马均比田忌的马略胜一筹,似乎必胜无疑。田忌的朋友孙膑给他出田忌的马略胜一筹,似乎必胜无疑。田忌的朋友孙膑给他出了一个主意,让他用下等马比齐王的上等马,上等马对齐王了一个主意,让他用下等马比齐王的上等马,上等马对齐王的中等马,中等马对齐王的下等马,结果田忌二胜一败,反的中等马,中等马对齐王的下等马,结果田忌二胜一败,反而赢了一千金。而赢了一千金。例例8.2 (石头(石头剪子剪子布)布)这是一个大多数人小是一个大多数人小时候都玩候都玩过的游的游戏。游。游戏双方只能双方只能选石石头、剪子、布中的一种,石、剪子、布中的一种,石头赢剪子,剪子剪子,剪子赢布,而布又布,而布又赢石石
5、头,赢者得一分,者得一分,输者失一分,双方相同者失一分,双方相同时不得分,不得分,见下下表。表。表表8.18.1石石头剪子剪子布布石石头011剪子剪子101布布110一、对策的基本要素一、对策的基本要素(1 1)局中人局中人。参加决策的各方被称为决策问题的局中人,一。参加决策的各方被称为决策问题的局中人,一个决策总是可以包含两名局中人(如棋类比赛、人与大自然个决策总是可以包含两名局中人(如棋类比赛、人与大自然作斗争等),也可以包含多于两名局中人(如大多数商业中作斗争等),也可以包含多于两名局中人(如大多数商业中的竞争、政治派别间的斗争)。局中人必须要拥用可供其选的竞争、政治派别间的斗争)。局中
6、人必须要拥用可供其选择并影响最终结局的策略,在例择并影响最终结局的策略,在例8.8.2 2中,局中人是中,局中人是田忌田忌、齐王齐王从这些简单实例中可以看出从这些简单实例中可以看出对策现象中包含的几个基本要素对策现象中包含的几个基本要素(2 2)策略集合策略集合。局中人能采取的可行方案称为策略,每一。局中人能采取的可行方案称为策略,每一局中人可采取的全部策略称为此局中人的策略集合。对策问局中人可采取的全部策略称为此局中人的策略集合。对策问题中,对应于每一局中人存在着一个策略集合,而每一策略题中,对应于每一局中人存在着一个策略集合,而每一策略集合中至少要有两个策略,否则该局中人可从此对策问题中集
7、合中至少要有两个策略,否则该局中人可从此对策问题中删去,因为对他来讲,不存在选择策略的余地。应当注意的删去,因为对他来讲,不存在选择策略的余地。应当注意的是,所谓策略是指在整个竞争过程中对付他方的完整方法,是,所谓策略是指在整个竞争过程中对付他方的完整方法,并非指竞争过程中某步所采取的具体局部办法。例如下棋中并非指竞争过程中某步所采取的具体局部办法。例如下棋中的某步只能看和一个完整策略的组成部分,而不能看成一个的某步只能看和一个完整策略的组成部分,而不能看成一个完整的策略。当然,有时可将它看成一个多阶段对策中的子完整的策略。当然,有时可将它看成一个多阶段对策中的子对策。策略集合可以是有限集也可
8、以是无限集。策略集为有对策。策略集合可以是有限集也可以是无限集。策略集为有限集时称为有限对策,否则称为无限对策。限集时称为有限对策,否则称为无限对策。记局中人记局中人i i的策略集合为的策略集合为SiSi。当对策问题各方都从各自的策略当对策问题各方都从各自的策略集合中选定了一个策略后,各方采取的策略全体可用一矢量集合中选定了一个策略后,各方采取的策略全体可用一矢量S S表示,称之为一个纯局势(简称局势)。表示,称之为一个纯局势(简称局势)。例如例如,若一,若一对策中包含策中包含A、B两名局中人,其策略集合分两名局中人,其策略集合分别为SA=1,m,SB=1,n。若。若A选择策略策略 i而而B选
9、策策略略 j,则(i,j)就构成此就构成此对策的一个策的一个纯局局势。显然,然,SA与与SB一共可构成一共可构成mn个个纯局局势,它,它们构成表构成表8.3。对策策问题的全体的全体纯局局势构成的集合构成的集合S称称为此此对策策问题的局的局势集合。集合。(m,n)(m,j)(m,2)(m,1)m(i,n)(i,j)(i,2)(i,1)i(2,n)(2,j)(2,2)(2,1)2(1,n)(1,j)(1,2)(1,1)1A的的策策略略nJ21B的策略的策略(3 3)赢得函数(或称支付函数)。得函数(或称支付函数)。对策的策的结果用矢量表示,果用矢量表示,称之称之为赢得函数。得函数。赢得函数得函数F
10、 F为定定义在局在局势集合集合S S上的矢上的矢值函函数,数,对于于S S中的每一中的每一纯局局势S S,F F(S S)指出了每一局中人在此指出了每一局中人在此对策策结果下果下应赢得(或支付)的得(或支付)的值。综上所述,一个上所述,一个对策模型策模型由局中人、策略集合和由局中人、策略集合和赢得函数三部分得函数三部分组成。成。记局中人集合局中人集合为I I=1,=1,k k,对每一每一i iI I,有一策略集合有一策略集合S Si i,当,当I I中每一中每一局中人局中人i i选定策略后得一个局定策略后得一个局势s s;将;将s s代入代入赢得函数得函数F F,即得即得一矢量一矢量F F(s
11、 s)=()=(F F1 1(s s),),F Fk k(s s),其中其中F Fi i(s s)为在局在局势s s下局中人下局中人i i的的赢得(或支付)。得(或支付)。本节讨论只有两名局中人的对策问题,即两人对策,其结果可本节讨论只有两名局中人的对策问题,即两人对策,其结果可以推广到一般的对策模型中去。对于只有两名局中人的对策问以推广到一般的对策模型中去。对于只有两名局中人的对策问题,其局势集合和赢得函数均可用表格表示。例如,表题,其局势集合和赢得函数均可用表格表示。例如,表8.28.2就给就给出了例出了例8.8.2 2的局势集合和赢得函数。的局势集合和赢得函数。二、零和对策二、零和对策存
12、在一存在一类特殊的特殊的对策策问题。在。在这类对策中,当策中,当纯局局势确定后,确定后,A A之所得恰之所得恰为B B之所失,或者之所失,或者A A之所失恰之所失恰为B B之所得,即双方所得之所得,即双方所得之和之和总为零。在零和零。在零和对策中,因策中,因F F1 1(s s)=)=F F2 2(s s),只需指出其中只需指出其中一人的一人的赢得得值即可,故即可,故赢得函数可用得函数可用赢得矩得矩阵表示。例如若表示。例如若A A有有m m种策略,种策略,B B有有n n种策略,种策略,赢得矩得矩阵 表示若表示若A A选取策略选取策略i i而而B B选取策略选取策略j j,则,则A A之所得为
13、之所得为a aijij(当(当a aijij00时为支付)。时为支付)。在有些两人在有些两人对策的策的赢得表中,得表中,A A之所得并非明之所得并非明显为B B之所失,但之所失,但双方双方赢得数之和得数之和为一常数。例如在表一常数。例如在表8.48.4中,无中,无论A A、B B怎怎样选取策略,双方取策略,双方赢得得总和均和均为1010,此,此时,若将各人,若将各人赢得数减去两得数减去两人的平均人的平均赢得数,即可将得数,即可将赢得表化得表化为零和零和赢得表。表得表。表8.48.4中的中的对策在策在转化化为零和零和对策后,具有策后,具有赢得矩得矩阵表表8.48.4局中人局中人B123局中人局中
14、人A1(8,2)(1,9)(7,3)2(4,6)(9,1)(3,7)3(2,8)(6,4)(8,2)4(6,4)(4,6)(6,4)给定一个两人对策只需给出局中人给定一个两人对策只需给出局中人A A、B B的策略集合的策略集合S SA A、S SB B及表示双方赢得值的赢得矩阵及表示双方赢得值的赢得矩阵R R。综上所述,当遇到零和对综上所述,当遇到零和对策或可转化为零和对策的问题时,策或可转化为零和对策的问题时,R R可用通常意义下的矩阵可用通常意义下的矩阵表示,否则表示,否则R R的元素为一两维矢量。的元素为一两维矢量。故两人对策故两人对策G G又可称为矩阵对策并可简记成又可称为矩阵对策并可
15、简记成G G=S SA A,S SB B,R R 例例8.3 给定给定G=SA,SB,R,其中其中SA=1,2,3,SB=1,2,3,4 从从R R中可以看出,若中可以看出,若A A希望获得最大赢利希望获得最大赢利3030,需采取策略,需采取策略 1 1,但此时若,但此时若B B采取采取策略策略 4 4,A A非但得不到非但得不到3030,反而会失去,反而会失去2222。为了稳妥,双方都应考虑到对方。为了稳妥,双方都应考虑到对方有使自己损失最大的动机,在最坏的可能中争取最好的结果。局中人有使自己损失最大的动机,在最坏的可能中争取最好的结果。局中人A A采取采取策略策略 1 1、2 2、3 3时
16、,最坏的赢得结果分别为时,最坏的赢得结果分别为min 12,6,30,22 =22min 14,2,18,10=2min 6,0,10,16=10其中最好的可能为其中最好的可能为max max 22,2,22,2,10=210=2。如果如果A A采取策略采取策略 2 2,无论,无论B B采采取什么策略,取什么策略,A A的赢得均不会少于的赢得均不会少于2.2.B B采取各方案的最大损失为采取各方案的最大损失为max 12,14,max 12,14,6=146=14,max max 6,2,0=26,2,0=2,max max 30,18,30,18,10=3010=30和和max max 22,10,16=1622,10,16=16。当。当B B采取策略采取策略 2 2时,其损失时,其损失不会超过不会超过2 2。注意到在赢得矩阵中,。注意到在赢得矩阵中,2 2既是所在行中的最小元素又是所在列既是所在行中的最小元素又是所在列中的最大元素。此时,只要对方不改变策略,任一局中人都不可能通过变中的最大元素。此时,只要对方不改变策略,任一局中人都不可能通过变换策略来增大赢得或减小损失,称这样的局
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1