囚徒困境实验报告文档格式.docx
《囚徒困境实验报告文档格式.docx》由会员分享,可在线阅读,更多相关《囚徒困境实验报告文档格式.docx(9页珍藏版)》请在冰豆网上搜索。
一、实验目的
根据囚徒困境经典悖论,通过实验来探寻单词与多次重复结果,分析结论。
然后通过研究“囚徒困境”,了解囚徒困境产生的原因,想出走出囚徒困境的方法,并且理解和利用囚徒困境解决生活中与经济中的实际问题。
二、实验原理
囚徒困境是博弈论的非零和博弈中具代表性的例子。
经典的囚徒困境如下:
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:
甲沉默
甲背叛
乙沉默
二人同服刑1年
乙服刑10年,甲即时获释
乙背叛
甲服刑10年,乙即时获释
二人同服刑8年
三、实验说明
通过角色扮演的方式再现经典的囚徒困境。
实验者两人一组,扮演囚徒。
在相同的情境下看不同的实验者如何选择策略来完成实验。
实验并没有考虑其他客观因素,是在完全假设的没有任何干扰囚徒做出选择的因素的情境下进行的。
实验规则:
实验参与人被随机地分配到有两个人组成的不同小组中。
如果小组中的两个成员都选择坦白,那他们将会分别获得6年的刑期;
如果小组中的两个成员都选择否认,那他们将会分别获得3年的刑期;
如果小组中有一个成员选择坦白、另一个选择否认,那么选择坦白的成员获得1年的刑期,选择否认的成员获得10年的刑期。
这个问题可以总结为:
你坦白
你拒绝
他坦白
各判6年
你10年他1年
他拒绝
你1年他10年
各判3年
四、实验准备
实验小组一共五人,通过抽签的方式分出两人,一人为囚徒一,一人为囚徒二。
实验分为两种,一个是单次,一个为多次。
另外三人分别记录单次实验与多次试验的结果,分析数据。
五、实验步骤
1、在单次实验的情况下,囚徒一与囚徒二分别只有一次机会选择拒绝或坦白。
2、在多次重复实验的情况下,分为三轮,囚徒一与囚徒二分别有十次机会来选择坦白或拒绝。
3、收集实验数据,画出折线图,并分析实验结果。
具体来说,实验分为两个阶段。
第一阶段,囚徒一和囚徒二要熟悉实验程序的实验过程和收益情况,并选择坦白或否认。
程序界面如下图所示。
第二阶段,囚徒一和囚徒二可以看到自己的选择和对方的选择,并且知道自己在本轮次获得的刑期。
程序界面如下图所示
六、实验结果分析
1、单次实验
单次实验的结果理论上有四种,即
囚徒一与囚徒二都拒绝,各判三年;
囚徒一与囚徒二都坦白,各判六年;
囚徒一坦白,判一年,囚徒二拒绝,判十年;
囚徒一拒绝,判十年,囚徒二坦白,判一年。
然而,实验的结果是,囚徒一与囚徒二均选择坦白,双方各判六年。
因为二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择坦白。
坦白是两种策略之中的支配性策略。
因此,
双方坦白是这场博弈中唯一可能达到的纳什均衡。
2、多次实验
对于多次实验发生的结果。
我们一共进行了三轮实验,每轮实验均进行十次,从而来总结最后的结果,根据每轮结果的折线图和三轮总结果的折线图来看,每轮得到的实验结果均与均衡结果有偏差,但是三轮总结果的折线图却偏向于均衡结果,即两人均坦白,各判6年。
结果是纳什均衡逐渐趋于帕累托最优。
实验表格如下图所示:
总轮数
轮数
身份
选择
对手身份
对手选择
刑数
对手刑数
一
1
囚徒一
否认
囚徒二
坦白
10
2
3
4
6
5
7
8
9
二
三
第一轮实验结果折线图如下所示
第二轮试验结果折线图如下所示:
第三轮实验结果如下图所示:
三轮实验结果汇总折线图:
七、实验结论
1、单次实验结论
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。
以全体利益而言,如果囚徒一和囚徒二都拒绝,两人都只会被判刑3年,总体利益更高,结果也比两人都坦白,判6年的情况较佳。
但二人均为理性的个人,为实现个人利益的最大化,均衡状况会是两个囚徒都选择坦白,结果二人判决均比合作为高,总体利益较合作为低。
这证明了:
在非零和博弈中,帕累托最优和纳什均衡是相冲突的。
2、多次实验结论
实验被反复地进行。
因而每个囚徒都有机会去“惩罚”另一个囚徒前一回合的不合作行为。
这时,合作可能会作为均衡的结果出现。
坦白的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。
作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
八、实际事例
上述实验结果可能过于抽象,但现实中,无类似囚徒困境的例子还是很多的。
不论是社会科学中的经济学、政治学和社会学,以及自然科学的动物行动学、进化生物学等学科,都有问题可以用囚徒困境来分析。
这种博弈方法的重要性可见一斑。
下面我就为大家举些囚徒困境的例子:
1、经济例子
中国电信与中国联通,两边都希望赚取市场利润,但是如何在话费价格定位上有着不同的选择,如果我的价格低对方价格高的话我就会占有市场,但是缺点是我会减少利润,但是如果我的价格高对方的价格低的话,我就会失去市场,在双方没有达成cartel的情况下会出现“囚徒困境”模式,就是双方都以低价位来抢占市场但是双方的利润都没有最大化。
2、政治实例
50年后军事解密,朝鲜战争的起因,因为中国和美国都有考虑,我国是怕韩国如果统一朝鲜后美军会侵略中国,而美军是怕如果朝鲜统一韩国后,中国军队会侵略日本,在占领日本后威胁美国本土。
所以双方都是以出兵和不出兵考虑,如果出兵,会有经济损失,如果不出兵会威胁自己的领土,所以双方在“囚徒困境”模式下都选择了出兵,最后两败俱伤。
3、军事例子
台湾要买美国的F16,中国希望欧洲对华军售,两个地区的政府都在为武器画着大价钱从而损失了国家的经济发展力,这也是囚徒困境的模式,都会担心如果一旦开战会对自己不利,如果我没有先进武器,你有先进武器,那么开战的话我就会吃亏。
如果我有先进武器你没有的话,我就会得利。
所以我一定要有先进武器。
殊不知如果两岸达成和平条约,双方都不购买先进武器,把资金都放在经济发展人民收入上,那才是真的双赢。
4、环法自行车赛
每年都举办的环法自由车赛中有以下情况:
选手们在到终点前的路程常以大队伍(英文:
Peloton)方式前进,他们采取这策略是为了令自己不至于太落后,又出力适中。
而最前方的选手在迎风时是最费力的,所以选择在前方是最差的策略。
通常会发生这样的情况,大家起先都不愿意向前(共同背叛),这使得全体速度很慢,而后通常会有二或多位选手骑到前面,然后一段时间内互相交换最前方位置,以分担风的阻力(共同合作),使得全体的速度有所提升,而这时如果前方的其中一人试图一直保持前方位置(背叛),其他选手以及大队伍就会赶上(共同背叛)。
而通常的情况是,在最前面次数最多的选手(合作)通常会到最后被落后的选手赶上(背叛),因为后面的选手骑在前面选手的冲流之中,比较不费力。
5、广告竞争
两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。
但若二者同时期发出质量类似的广告,收入增加很少但成本增加。
但若不提高广告质量,生意又会被对方夺走。
此二公司可以有二选择:
互相达成协议,减少广告的开支。
(合作)
增加广告开支,设法提升广告的质量,压倒对方。
(背叛)
若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。
在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。
囚徒困境在生活中是普遍存在的,因此,我们需要在理解与互相信任的基础上达到最优合作,实现双方利益的共赢。
(专业素材和资料部分来自网络,供参考。
可复制、编制,期待您的好评与关注)