1、2博弈论概述第2章博弈论概述2.1博弈论的概念2.2博弈讨论的前提2.3博弈研究的价值2.4博弈的要素2.5博弈的类型2.1博弈论的概念W:丰富多彩;弈:下棋、打牌等对抗性 游戏。博弈:丰富多彩的对抗性游戏博弈相关利益各方在竞争的情况 下,通过行动、策略等的实施最终达 到某种收益的过程。博弈论(Game Theory)研究相关利益各方参与的情况下,如何决 策以最大化自身收益,并最终达到一种均 衡状态的理论。2.2博弈讨论的前提理性经济人假设相关利益假设各参与者的策略具有相互依存性 信息是不完全,不对称的理性(rational)理性包括三项内容:(D存在一组可供选择的备选或替代方案;(2)每一种
2、方案均对应着某种特定的预期净收 益或满足程度或目标实现程度;(3)人们总是选择那个能够带来最大预期净收 益的方案。(西蒙,1964)相关利益人受到一项决策影响的群体或个人23博弈研究的价值可用资源有限,相关利益方利益的冲突是一种必 狀.八、,在解决利益冲突过程中,人们是理性的,即以利 已为目的,不以损人为目的。理性并最大化自己 的收益,是社会资源配置的一种有效方式,但并 不总是如此,收益具有相互依存性;信息完全、信息对称只是一种理想状态;博弈模型是社会各种各样博弈过程的简化模型, 一个博弈模型能反映一类博弈问题的实质。2.4博弈的要素参与者(player) J丿1参与者:博弈中的决策主体,又称
3、局中人。 目的是通过合理选择自己的行动,以最大 化自己的收益(或效用)。女口,囚徒困境中的囚徒甲、乙;情侣博弈中的男孩、女孩等。自然:不以博弈各方的意志为转移的外生 事件,用概率分布来描述自然的选择机理。女口:对于两个竞争对手来说,市场需求的大小完全信息:每一个参与者对自己及其他参 与者的行动及各参与者选择行动组织产生 的收益等知识有完全的了解。完美信息:处于某个决策结的参与者在选 择行动前,能够获取从初始结到这个决策 结的路径上崩肴参与者行动的信息。信息对称:在竞争中,参与者A知道参与 者B掌握的信息,B也知道A掌握的信息。(3)行动(action)行动:参与者可选的行动方案。如:囚徒困境中
4、的囚徒可以“坦白”,也 可以“抵赖”。行动的相互依存(interdependence)性:每 个参与者的行动选择都受到其他参与者的 影响。(4)策略(strategy)策略:参与者应对其他参与者的行动作出反应的 规则。与博弈的先后有关。纯策略:指参与者在博弈中可以选择采用的行动 方案,是参与人在给定信息结构的情况下的行动 规则,它规定参与人在什么时候的什么情况下采 誠秆么行动。因帘一个樂略是参与人的一个呻目 机行动方案”。女口: “人不犯我,我不犯人; 人若犯我,我必犯人”混合策略:参与者的混合策略是他的纯策略空间 丄的一种概率分布,袅示参与人实徐进行决策时 根据这种概率分布在纯策略中随机选择
5、加以实施。(5)收益(payoffs)收益:一个特定的策略组合下各参与者得 到的确定的效用或期望效用。指博弈结果 的输赢、得失、盈万等。一个参与者的收益不仅取决于自己的行动, 而且取决于其他参与者的行动。(6)均衡(equilibrium)均衡:任一参与者单方面改变行动都不能 获得更多收益的行动组合及收益组合。如:囚徒困境中的(坦白,坦白)2.5博弈的类型合作与非合作博弈根据博弈参与各方能否达成一个具有约束 力的协议,博弈分为合作博弈和非合作博 弈。合作博弈着眼于团体理性,注意效率、公 平和公正。非合作博弈关注于个人理性、个人最优决 策。静态博弈与动态博弈根据参与者行动的先后顺序,博弈可以分
6、为静态博弈和动态博弈。静态博弈:博弈中,参与者同时选择行动 或者虽非同时行动但后行者并不知道前行 者采取了什么行动动态博弈:参与者的行动有先后顺序,后 行者能旬多观察到先行者所选择的行动。完全信息与不完全信息博弈根据参与者对博弈的环境(包括自然、其他 参与者的特征、偏好和策略)是否有全面而 准确的知识(信息),博弈可分为完全信息 博弈和不完全信息博弈。完全信息博弈:每个参与者对其他参与者 的特征、策略及收益函数有全面而准确的 知识。不完全信息博弈:参与者对博弈的环境没 有完备的信息。重复博弈与一次博弈博弈次数为一的称为一次博弈;否则称为 重复博弈。有限重复博弈与无限重复博弈如果博弈的重复次数是有限的,称为有限 重复博弈;如果重复博弈没有固定的终点, 则称为无限重复博弈。四种博弈类型根据参与者信息的完备程度、博弈的动态 和静态,博弈可分为:完全信息静态博弈一纳什均衡完全信息动态博弈一子博弈完美纳什均衡 不完全信息静态博弈一贝叶斯纳什均衡 不完全信息动态博弈一完美贝叶斯均衡
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1