冲突策略和赛局.docx
《冲突策略和赛局.docx》由会员分享,可在线阅读,更多相关《冲突策略和赛局.docx(8页珍藏版)》请在冰豆网上搜索。
![冲突策略和赛局.docx](https://file1.bdocx.com/fileroot1/2022-12/12/40173a38-f50e-4096-8305-12bb06943deb/40173a38-f50e-4096-8305-12bb06943deb1.gif)
冲突策略和赛局
第1章衝突、策略和賽局
什麼是賽局理論?
賽局論與衝突以及策略有何關係?
策略與衝突發生在人類生活的諸多方面,其中包括賽局。
衝突有贏家和輸家,而賽局亦然,這本教科書介紹一種源自賽局數學研究的策略思考模式。
本章的第一部分回答兩問題:
1.什麼是賽局理論,以及賽局論與策略有何關係?
為了回答這些問題,我們將以例子開始。
首先我們介紹的例子就是人們提到與策略就會想到的--戰爭.
西班牙叛軍
以下的故事來自柯林.馬嘉露改取材自羅馬共和國歷史的小說.
在西元前75年,西班牙叛變羅馬.這些西班牙叛軍的領導者曾是羅馬的軍事將領.人們大多認為西班牙叛軍領導者—(塞多留)OumtusSertorius的叛變,意在以西班牙作為使他成為羅馬帝國主人的基地。
羅馬派出兩支軍隊,鎮壓叛軍.一支軍隊為受人尊敬的羅馬貴族庇護(MetullusPius)所領導;另一則以龐培(Pompey)為首。
其中龐培雖然年輕,欠缺實戰經驗,但是卻非常有富有,願意負責自己軍隊的所有開銷.因而,庇護(Pius)必須聽令於龐培。
庇護為此非常不悅,非僅因為龐培比他年輕,龐培的出身也比他卑賤.
龐培的軍隊自羅馬派出並負責突破駐守在西班牙新迦太基(NewCarthage)要塞部隊的圍攻,但不能前進到羅拉(Lauro)之西,否則會遭到塞多留軍的包圍。
因此,塞多留與龐培兩軍將僵持在東西班牙.而統治西西班牙的庇護(Pius)則留在西西班牙.這樣的佈署正符合塞多留的期待,因為塞多留不樂見到羅馬兩軍的會合.因此,塞多留派出他的第二號領導者—赫多魯(Hirtuleius)駐守位在庇護軍隊東邊的拉米尼(Laminium),以防止庇護西進與龐培會合。
庇護有兩個策略可選擇(如下圖淡灰色箭頭所示).他能攻擊赫多魯,取下拉米尼.若此舉成功,將開啟進攻東西班牙之門,並奪取其中反叛軍的一支。
更甚者,可以前進到羅拉並與龐培會合擊退塞多留,但此策略成功機會不大,因為在特殊地形與守軍的戰鬥,對攻擊者是非常不利的,可能會被赫多魯擊退。
庇護的另一策略,則是軍隊先開到加德斯(Gades)再搭船到新迦太基,以增強龐培的軍隊圍攻叛軍的火力.對庇護而言,這是比較好的結果,因為這不僅可以會合羅馬的部隊以擊退叛軍,還可以向暴發戶龐培宣示:
欠缺有經驗的羅馬貴族,單憑妄自尊大的龐培,是無法成事的。
叛軍將領赫多魯是一個思考細膩的將領,他現在的難題是:
應選何策略,以包圍或擊敗庇護軍。
赫多魯可以直接派兵前往新迦太基,並與原先駐在那裡的部隊會合,與庇護一戰.他擊退Pius的機會不小.但是如果庇護認為赫多魯將前進新迦太基時,他將轉向北,輕取拉米尼,並直搗西班牙東北部.如此一來,赫多魯的任務將失敗。
赫多魯的另一可能選擇是留在拉米尼,直到庇護離開他的駐守地,然後在貝特河口(RiverBaetis)攔截庇護軍,但如此一來,赫多魯軍隊可能因舟車勞頓,無法與庇護軍一拼,成功機率不大.但採這個策略,不會失去拉米尼。
兩個陣營的指揮官,必須做出決策—什麼策略才是最好的反應?
我們可將相關決策描繪成樹狀圖(圖1.2)。
首先,赫多魯先決定是前進新迦太基,或是留在拉米尼以待攔截庇護軍.圖的最左邊是赫多魯的決策點,然後庇護的決策取決於赫多魯的決策為何.兩軍的報酬為何?
我們先看赫多魯採下方策略(即留在拉米尼以待攔截庇護)的情形,若庇護經嘉德斯前進新迦太基,赫多魯攔截庇護成功的機率最多是50%,無法攔阻成功,赫多魯算是失敗。
若庇護取得拉米尼,算庇護成功.但是當庇護前進拉米尼,與赫多魯一博,庇護的勝算較小.因此當赫多魯留在拉米尼時,庇護最好前進新迦太基.
如果赫多魯採上方的策略(即前進新迦太基),若庇護增兵至新迦太基,雖然可向龐培宣示他的重要,但是他不能百分之百確定他會會贏;但若前進拉米尼,庇護將輕取拉米尼.因此,當赫多魯進軍新迦太基時,庇護應前進拉米尼.最後,權衡得失,赫多魯應留在拉米尼,以待攔阻庇護.
結果如何?
不幸地,赫多魯的最好反應並不夠好.實際上,庇護軍移動比赫多魯的預期快速.因此,庇護以逸代勞,擊潰赫多魯叛軍,成功前進嘉德斯港,搭船至新迦太基,增援龐培軍.後來庇護回到羅馬,被奉為英雄.而龐培沉潛多年後,成為羅馬第一人.這是後話,與本書無關.
方才當我們利用樹狀圖分析與庇護與赫多魯的策略,已用到賽局理論的觀念了。
賽局論的濫觴
在20世紀的早期,數學家開始研究一些簡單的賽局,然後是比較複雜的賽局,如,西洋棋。
這些研究即是賽局理論的開始。
偉大的數學家馮紐曼(JohnvonNeumann)將這些研究擴展到一些賽局像撲克牌。
關於撲克的研究,引入比較複雜賽局的研究。
撲克賽局中,
你可能不知道你的對手是否”虛張聲勢”.但是賽局論發展的第一個分水嶺則是來自馮紐曼與數理經濟學家摩根斯坦(OskarMorgenstern)在1940年代合寫的經典之作—賽局理論與經濟行為”TheTheoryandEconomicBehavior.這本書主要觀念之一是:
一般人不認為是賽局的人類互動,如經濟的競爭與軍事衝突,皆可將其視為賽局加以分析。
在今日,賽局論學者已視人類各類的策略選擇為某賽局的策略。
就科學觀點,各類的策略問題皆可想成是賽局,這樣的觀點引導了二十世紀下半賽局論的重大突破。
如前所言,賽局論研究策略的理性選擇,其理性的假設與新古典經濟學共通。
摩根斯坦是一位經濟學者,而馮紐曼也是對新古典經濟學相當熟捻與認同,因此,說他們的想法來自新古典經濟學應不為過。
新古典經濟學的主要假設是:
人們做經濟決策時是絕對理性的,亦即每一個人就所面對的環境,極大化他的報酬:
這些報酬可能是利潤,所得或是主觀的利益。
做這樣的假設,可達到兩個目的:
第一,它縮小各種可能性.畢竟,理性的行為總是比非理性行為來得容易預測。
其次,它也提供了評估經濟系統效率評量的判準。
若是有一個經濟體制當減少某些人的報酬的同時,卻無法產生較多的效益(亦即成本大於效益),則這個體制是有問題的。
例如,空氣與水的污染或是過度魚獵,以及研究資源太少都是不效率的例子。
賽局理論分析的關鍵步驟是:
發現那一種策略才是他人已選策略下的最適反應。
以新古典經濟的觀念,我們定義某人的最適反應就是給定其他賽局參與者已選或預期將選的策略下,哪一種策略能極大化這個賽局參與者(player)的最大報酬.這是在賽局論中關於理性共通的觀念,我們將在以下章節使用這個觀念。
但是,最適反應並非是賽局論唯一定義理性的觀念;再者,賽局論也不總是假設人們是理性的,在以下的若干章節,我們也會探討關於理性的其他可能性。
賽局論、新古典經濟學與數學
在新古典經濟學,理性個人在決策時所面對特定的體制包括:
財產權、貨幣與高度競爭的市場。
這些體制因素都是個人極大化報酬時所必須考慮的。
新古典經濟學假設財產權、貨幣經濟以及完全競爭市場,用意在於使經濟個體決策時無須考慮與其他個體的互動,而只需考慮市場條件。
但是這些假設可能導致兩個問題。
首先,它限制了理論可能解釋的範圍。
例如,若市場並非完全競爭(但也不是獨占),或是產權無法清楚界定,新古典經濟理論就不太適用了。
此外,若是決策與貨幣無關時,新古典經濟學也是會有問題的.但是賽局論可以克服這些問題。
因為賽局論針對人們直接互動,而非透過市場時,提供一套理論,分析經濟與策略行為.
再就新古典經濟學理論,理性就是極大化某人的報酬,我們可以將之想成是去解一個數學問題。
但是,在賽局論,情形是較為複雜的,因為個人的最後報酬並不只取決於此人的策略與相關的市場條件,還取決於其他人的策略。
哪些與賽局有關?
西班牙叛軍的故事,為一般人經常概念中的衝突與策略,提供一個易於說明的例子。
赫多魯先決策,他必須猜測庇護針對他的決策會做何反應。
每一個人都想比別人更精明,這就是所謂的策略。
有一些賽局非常像庇護與赫多魯的衝突。
其中一個非常簡單的賽局就是拈遊戲(Nim).拈遊戲的版本非常多。
我們僅就其中最簡單的玩法,做一分析。
有三個銅板放在兩列,剩餘的兩個放在二列。
兩個玩家依序出招,美一次一個玩家最少要拿走一個銅板,拿走最後銅板的就是贏家。
因次,玩家的目標就是讓對手選擇後只留下一個銅板。
針對這個遊戲,以下是我們想問的問題:
什麼是玩家最佳的出招順序?
有沒有最佳的策略?
先出招一定贏嗎?
或是後出招的一定贏?
以上是當有人提出要與你玩NimNim這種賽局時,你必須回答的問題。
假如現在玩NimNim賽局的Ama與P,A先出招,我們再一次使用樹狀圖描述兩個人的策略如圖1.4所示。
A先就左邊圓圈決定決策,每個玩家出招前圓圈內的銅板數就是當他出招前所剩的銅板數。
因此,當A出招前,他所面對的銅板數就是了。
因此,先出招的A有三種選擇:
1.從上列的銅板中取走1個銅板
2.從下列的銅板中取走1個銅板
3.取走下列所有的銅板
1.4圖中的箭頭表示出招的方向。
例如,A如果選第一個選擇,在某二行的某一個圓圈顯示B出招前剩下某二列的兩個銅板。
在這種行贏下,B有兩種選擇:
取走第二列一個或全部銅板。
若是B取走一個,還剩一個留給A,若B取走全部則A再下一次出招便無銅板可選,而B即是贏家(見圖1.4的第三行的最上面兩個圓圈)。
以相似的邏輯,我們也可以檢視與推演當A再第一次出招時做出第二或抵三種選擇時的情形。
例如,若是A做出第三種選擇(取走第二列的所有銅板),則留下一個銅板給B,B即是贏家。
再來看最有趣的情形:
即A選第二種策略(A自第二列取走一枚銅板),則留下兩列各一枚銅板,然後B僅能選一列取一枚銅板,不論B取走那一列的銅板,A都是贏家。
現在,我們大概知道答案為何了。
在這個Nim賽局,存在一個對A最好的策略:
那就是”先取走第二列的一枚銅板,然後接在B之後取走,B決策後所留下的一枚。
就B而言,他的最佳策略是:
若A決策後,只留下一列有銅板,則全部取走,否則,取走任何一枚銅板,最後我們可以說:
「若A選對策略,他絕對是贏家。
」
囚犯困境(P16)
先前介紹的馮紐曼是在普林斯頓高等研究院,而摩根斯坦則是在普林斯頓大學。
由於他們兩人的做,普林斯頓大學很快傳出對賽局論的好奇,然後普林斯頓大學數學系系主任—塔克(AlbertTucker)訪問史丹福大學,想要讓一群心理學家對賽局理論有些了解,他舉出「囚犯困境」的例子,而此一例子卻是在20世紀賽局論發展中最具影響的。
美麗境界(P17)讀者或許已經在想他課堂上聽過這個例子。
囚犯困境與我們前面所提的例子有一些不同。
塔克先說了以下簡單的故事:
有兩個竊賊—Bon與Al,因犯案被逮到,隨後被分開審訊,每個竊賊需決定認罪或不認罪,若兩人皆不認罪,兩人將因被判攜帶武器,服刑一年。
若兩人皆認罪,兩人將被判10年,但是,若只有一人認罪,那個與警方合作的竊賊將被釋放,而未認罪者,則會被判服刑20年。
在此賽局中的策略:
認罪或不認罪。
我們可以利用賽局論中標準的報酬表分析兩人的策略抉擇(列表如1.1)
表1.1說明如下:
每個囚犯需自兩個策略中則一。
也就是B需自兩列的選項擇一,A自兩行中選項則一。
方格中的兩個數字表示,當兩個囚犯選後的結果,(P18)左邊的數字是B的負報酬,右邊的數字是A的負報酬。
例如:
若兩人皆認罪,則各自服刑10年。
若只有A認罪,則A被釋放,而B被關20年。
接著,我們要問:
如何分析這個賽局?
哪一個策略是兩人皆想的極小化被關年數下的理性選擇?
A可能推理如下:
B只有兩種情形發生,認罪或不認罪,假如Bob認罪,我不認罪,則我會被關20年,若我認罪,則被關10年,若Bob不認罪,而我也不認罪,我會被關一年,但我認罪,則被釋放,因此,不管Bob有無認罪,我最好都認罪。
然而,B的推理也應與A相同。
結果兩囚犯都會認罪,而最後被判10年,但是若兩人不像先前推論地理性,則兩囚犯會被關一年。
以上結果值得一書。
自利與像似理性的行動可能導至兩人變得比他們預期的更壞的結果。
(P20)在現代的世界中而有諸多的互動非常像上述囚犯困境的故事。
例如,武器競賽、道路的壅塞、過度捕魚而造成魚群枯竭,以及地下水資源的過度使用等…。
這些互動雖各有不同,但都是屬於個人理性導致個人遭受較差結果的互動。
然而,我必須承認,囚犯困境是非常簡化與抽象的故事。
這個故事也有諸多的批評性的評論。
這些議題成為文獻研究的主題。
囚犯困境是兩人賽局,但其結果也適用於超過兩人的多人互動賽局。
前面我們假設兩人囚犯是不能溝通,若兩人能溝通且可能相互約定遵守聯合行動的協定,結果則會有所不同。
以上兩囚犯是互動一次。
若可重複互動,結果也會有所不同。
個別囚犯可能會有不同的推理,理性的答案可能非僅於此。
常態形式與擴展形式的賽局(P20)
前面所舉的兩個例子—Nim與囚犯困境,有一些相似性與不同處,不同的是分析囚犯困境的是數字表格而分析Nim是用樹狀圖。
而這兩種不同呈現賽局的方式的區別將在本書往後的說明中非常重要。
若一個賽局以樹狀圖形式表現,賽局的擴展表示法突顯每個玩家家。
若一賽局被展示如囚犯困境賽局,則被稱為「常態式」表示法,在一「常態式」表示法,賽局被表成一個表格。
表格的外圍是兩個玩家的策略,表格內的數字則是對應不同策略組合下的報酬。
(P21)相對擴展式表示法「常態式」表示法,常態表示法是比較不那麼直覺。
但是常態式表示法卻非常重要,而我們下幾個章節的論述將以「常態式表示法」為主。
現在,讓我們將這些方法應用在一些有名的例子上。
在電影中納許提出的難題
在電影美麗境界中,納許Bloude難題,提出解答與直覺,而獲得諾貝爾經濟學獎,Bloude說明如下:
●有兩位或是多位lusty男生
●同時也有多位…這些男生有興趣搭訕的小女生,女生至少比男生多一位
●只有一位女生是金髮美女,其餘是深色髮女生,每位男性都比較喜愛金髮美女,最後深色髮女性不能與任一位女性成對
(P22)在電影中納許發現如果男生都追求金髮女性,則沒有一位男性會成功,然後沒有一對會成伴。
納許提出這個問題答案如下:
每個男性部要去追求金髮女性,而去追求深色髮女性,則每個男生都會找到女伴。
以下我們簡化以上例子,而視之當兩人賽局以常態是分析,如圖表1.2。
假如只有兩位男生John與Reinhard(註:
納許與ReinhardSelten以及JohnHar…在1994年共得諾貝爾經濟學獎)假設追求到金髮美女對男生的價值是追求到深色髮女生的兩倍,若Reinhard追求深色髮女生,John的最適反應就是追求金髮女性,此時他得到2的報酬。
結果如何?
最適的策略組合又是如何?
當男生們假設好看的金髮美女太搶手不敢追求,使得金髮美女最後沒有伴是的結果?
這樣的結果是納許方法下的結果?
以上的問題我們在下一章回答。
科學的隱喻(P23)
現在,回到原來的問題。
什麼是賽局?
自從馮紐曼德作品(早先以提出的賽局理論與經濟行為),對廣泛存在的雙人或多人的人類互動中,針對並分析策略的方法。
如他們所說的,…賽局論是一種跨學科的方法論,這個方法論係將人與人間的互動式為賽局。
根據互動的規則與相同的報酬,研究分析人們策略的理性選擇。
賽局論所涵蓋的學科包括數學、經濟學和其他的社會科學與行為科學。
以下是賽局論經常被討論的議題:
★當決策的結果取決於其他人的策略,以及當決策時的
資訊是不完整時,何謂理性的策略。
(P24)★若有兩賽局是存在共利可能,合作去實現共利是理性行
為?
或是採侵略作為以追求個人最大獲利才是理性選擇?
★如果上述問題的答案是”視情況而定”,則進一步要問:
在何種情況下,侵略是理性?
又在何種情況下,合作是理性行為?
★上述的答案是否會因人們的互動式採取持續長期或只有一次…而有所不同?
★是否人類合作的道德速球會在自私個人的理性下自動
實現?
★人們的互動結果會比較傾向合作或理性?
(P25)商業的例子
到目前為止,我們舉了四個例子,包括戰爭、團體間遊戲(Nim)、犯罪行為的隱瞞(囚犯困境)和有關個人關係(金髮美女追求難題)。
次外,有諸多的商業例子可以適用賽局分析,結束本章之前,我們舉一個應用在商業的例子。
底下我們運用賽局常態表示法分析,下述與囚犯困境類似的賽局。
在1964年以前,菸草的電視廣告是正常的,但是到了1964年通過SurgeonGenels’報告後,四大菸草商、American與聯邦政府協商,協商的結果是自1971年後,四大菸草商誓約不會播放菸草的電視廣告,這樣的協商結果,我們是否可以利用賽局論可以合理解釋?
以下是模擬四大菸草商互動的兩人廣告賽局,有兩大菸草商Fumco和Tabacs。
每家廠商的策略是選擇是登廣告或是不登廣告。
(P26)假設兩家皆不刊登廣告,兩家平分市場而獲得較高的平分利潤(因沒有廣告成本),若兩家皆登廣告,則因有廣告成本,而各自獲得較低的利潤(4.4)。
若只有一家登廣告,則登廣告的廠商獲得較大的市場份額以及較高的利潤,方格內的數字是各種策略組合下的報酬。
不難發現,這個散局非常像囚犯困境賽局,每家廠商都會推理如下:
如果我們的對手不刊登廣告,我最好登廣告,而獲得10而非8;若我的對手登廣告,我們也應該登廣告以獲得4而非2,最後兩家廠商都會登廣告而皆獲得4。
這個結果與囚犯困境類似。
即僅自利理性的行為導致兩家廠商獲得他們都不喜歡的結果。
的確,就像將囚犯在不同審訊間,兩家公司彼此信任,協調出共利的策略是有些困難的。
但是,若是存在第三者,如,聯邦政府居中協調,則雙方應樂於限制彼此的廣告支出,則共利是可以達到的。
(P27)本章大綱
在本章我們探討”什麼是賽局論?
”它與衝突以及策略有有何關係,我們發現賽局論是一清晰跨學科而奠基於科學邏輯研究人類行為的方法。
它的方法就是將衝突與策略的選擇,如戰爭,欺瞞與經濟競爭,視之某種賽局。
我們也介紹了兩種賽局的表示法:
★在「常態式」表示法中,玩家的可行策略分裂於行與列。
★在「擴展表示法」中,樹狀圖的每個分枝點表示玩家的策略選
擇點。
然後,我們說賽局中的理性是指玩家採取最適反應策略,正如「新」中理性行為的觀念,賽局中的理性是指玩家極大化某些東西。
如利潤程文贏家獲是否類的主觀利益,或是極小化一些受罰,如被判徒刑年數。
而所謂的最適反應是指給其他家選定或預期將選的策略下,選擇極大化報酬的策略。
這些都是研究賽局最開始必須具備的觀念。
在下一章我們將探討這些觀念間的關係,尤其是上述兩個賽局表示法間的關係。
作業與討論問題:
1.1西班牙反抗軍:
在西班牙反抗軍的故事中,作者McCalloush寫到:
”Hirtuleius唯一可以做的是前盡到最容易的駐軍要塞….然後在Pius越過Baetis河之前,阻絕了他的軍隊”作者McCalloush這樣的說法是否正確?
請討論之。
1.2Nim遊戲:
請考慮一個有三列銅板得Nim遊戲,其中第一列有一個銅板,第二列有兩個銅板,第三列可能有一個、兩個或三個銅板。
請問:
(A)第三列有幾個銅板有何差別?
?
(B)在各種情形中誰贏?
1.3MdtchipPennies:
MdtchipPennies是幼稚園的遊戲,而兩個玩家分別叫做”雙數”與”奇數”,每個玩家拿出一個銅板,並選銅板的正或反面朝上,若是,兩個玩家的銅板皆是正面或皆是反面,叫”雙數”的玩家拿走兩個銅板;若是出現一正一反朝上,叫”奇數”的玩家取走兩個銅板,請畫出報酬表,並以常態式的描述上述賽局。
1.4快樂時光(HappyHours):
Tim的GimMill與Tom的Turcky酒館,兩家酒館正爭取固定的顧客,每一家考慮在快樂時光時段是否提供零食?
如果哪兩家不供應零食,每家的利潤是30,若兩家皆供應零食,每家的零食是20(零食花費的成本),若只有一家供應零食,供應零食的酒館利潤是50,而不供應的酒館所得利潤為20。
請利用本章所介紹的觀念討論上述例子。
兩個酒館的競爭是怎樣的賽局?
他們的策略為何?
請用常態式表示法描述此一賽局。
第2章
賽局的擴展事表示法和常態事表示法
在上一章,我們舉了兩類非常不同的例子。
其中,Hirtuleius與Pius的戰爭以及Nim的遊戲係以擴展式表示法描述—也就是以樹狀圖表現,而囚犯困境以及廣告競爭的賽局則以常態式描述—也就是表格式表示,這些賽局是有些差異,而其表示法是樹狀或表格,則依照表示之便利而有所不同。
賽局論發展的初期,賽局以常態式描述是比較共用的方法,但是最近以擴展式描述賽局也扮演關鍵角色,根據發展的先後,本書下幾張將主要介紹賽局的常態式表示法,而後再利用幾個章節分析賽局的擴展式表示法。
賽局的常態式表示法
賽局的表示法有兩種--擴展式與常態式,雖然,有時以某一表示是較另一表示法方便簡單,但,這並非絕對。
任何賽局都可以運用任一表示法表示。
這是馮紐曼非常關鍵的發現,雖然這樣,但這中間是有些要注意的。
底下我們舉一商業的例子加以說明。