當前位置:遊戲中心平台 - 遊戲盒子 - 博弈論案例

博弈論案例

首先,囚徒困境

故事講述了兩個犯罪嫌疑人作案後被警察抓住,分別關押在不同的房間進行審訊。警察知道那兩個人有罪,但他們缺乏足夠的證據。警察告訴大家:如果兩人都否認,各判壹年;如果兩人都坦白,各判八年;如果兩個人有壹個坦白,壹個否認,坦白釋放,否認判十年。所以,每個犯人都面臨著兩個選擇:認罪或者否認。但不管搭檔怎麽選擇,每個犯人最好的選擇都是坦白:如果搭檔否認,自己坦白,就釋放,不坦白就判壹年,坦白總比不坦白好;如果伴侶坦白,自己坦白,判八年,不坦白,判十年。坦白總比不坦白好。結果兩名嫌疑人都選擇了坦白,被判處有期徒刑八年。如果兩人都否認,各判壹年,顯然是個不錯的結果。但這種帕累托改進是做不到的,因為它不能滿足人類的理性要求。囚徒困境反映的深刻問題是,人類的個體理性有時會導致集體的非理性——聰明的人類會被自己的聰明所困。

第二,旅行者的困境

兩個旅行者從壹個以生產精美瓷器花瓶而聞名的地方旅行回來。他們都買了花瓶。當他們取行李時,發現花瓶被打碎了,於是他們向航空公司索賠。航空公司知道花瓶的價格在80-90元左右浮動,但不知道兩位乘客購買時的確切價格。於是,航空公司要求兩名乘客寫下花瓶的價格,100元以內。如果兩個人寫的壹樣,航空公司會認為他們說的是實話,按照他們寫的金額賠償;如果兩個人寫的不壹樣,航空公司會認定寫的差的乘客說的是實話,原則上按這個低價賠償。同時,航空公司將對說真話的獎勵2元,說假話的罰款2元。

為了得到最大的賠償,雙方的最佳策略是寫100元,這樣雙方都能得到100元。但是沒有,A很聰明。他想:如果我寫1元變成99元,B寫100元,那麽我就得到101元。為什麽不呢?所以他準備寫99元左右。但是B更聰明。他估摸著A要密謀他寫99元,所以他要寫98元。沒想到,A更聰明。估計B會寫98元騙他,所以他準備寫97元...眾所周知,下棋的時候,不是說要多“看”幾步嗎?“看”得越遠,贏的幾率就越大。再看兩步,我比妳強,再看三步,妳看四步,我比妳老練,再看五步。在花瓶索賠這件事上,如果兩個人都是“完全理性”的,都能看透十幾步甚至幾十步,那麽上面那場“聰明競賽”的結果,最終會落到大家都只寫壹兩元的地步。其實在完全理性的假設下,這個博弈唯壹的納什均衡就是兩人都寫0。

第三,競爭也是劫持。

費城西區有兩家對立的商店——紐約廉價商店和美國廉價商店。他們緊挨著彼此。這兩家店的老板是死敵。他們壹直在進行無休止的價格戰。即使是鷹眼貝蒂·瑞普女士也找不到任何缺陷。不信妳問她。而且這種床單的價格低得離譜,只有6美元50美分。“當這樣的手寫通知出現在壹家商店的櫥窗裏時,每個顧客都會習慣於等待另壹家廉價商店的回復。果不其然,大約兩個小時後,另壹家商店的櫥窗裏出現了這張通知:“瑞皮女士需要壹副近視眼鏡,我的床單質量壹流。只有5美元95美分”。價格戰的日子就這樣開始了。兩家店的老板除了張貼告示,還經常站在店外對著對方大喊大叫,經常導致拳腳相加。最後壹方老板在這場價格戰中不打了,價格不再下跌。說那個人瘋了,說明對方贏了。這個時候,每壹個圍觀的,路過的,附近的,都會湧向中獎的便宜貨店。搶購所有的床單和其他物品。在這壹帶,兩家店的爭吵最激烈,時間也最長,所以口碑很好。住在附近的每個人都從他們的奮鬥中受益匪淺,買了各種“精致”的商品。突然有壹天,壹家商店的老板去世了。幾天後,另壹家店的老板聲稱要去外地做貨,兩家店都倒閉了。兩家店都有了自己的新老板。他們各自對兩家店的前老板的財產做了詳細的調查。有壹天,他們在檢查的時候,發現兩家店之間有壹條秘密通道,在兩家店樓上兩位老板住的套房裏發現了壹扇連接兩家的門。新老板很奇怪,後來他們才知道這兩個死敵其實是兄弟。所有的咒罵,謾罵,威脅,人身攻擊都是上演的,每壹次價格戰都是假的。不管誰贏,他最後都是用自己的把對方庫存的商品全部賣給客戶。多麽精彩的騙局。

第四,酒吧遊戲問題(bar problem)

酒吧博弈的問題是由美國人W.B. Arthur在1994期《美國經濟評論》上發表的壹篇題為《歸納論證與有限理性》的問題中提出的,隨後他在1999期《科學》雜誌上發表的壹篇文章《復雜性與經濟學》中對博弈進行了闡述。遊戲是壹群人,比如n = 100,決定每個周末是去酒吧還是呆在家裏。酒吧的容量有限,假設60人。如果有人預測會有60多人去酒吧,他會決定去不去嗎?.....每個參與者或決策者面對的只是之前去過酒吧的人數,只能根據之前的人數信息總結策略。這是壹個典型的動態博弈問題。.....通過計算機模型實驗,亞瑟得到了壹個有趣的結果:不同的演員根據自己的感應行動,去酒吧的人數沒有固定的規律。然而,壹段時間後,去酒吧的平均人數總是傾向於60人。亞瑟說,預報員把自己組織成壹個去或不去的人的平衡系統,或者形成壹個生態穩定系統。.....這是酒吧的問題。

酒吧問題反映了這樣壹種社會現象。就像亞瑟教授說的,在很多行動中,我們要猜測別人的行動。然而,我們沒有關於其他人的更多信息。我們只能通過分析過去的歷史來預測未來。

五、槍手遊戲

今天,我講壹個關於博弈論的經典故事。

三個互相仇視的槍手A、B、C準備打起來。a槍法最好,十發八中;第二槍法,十分之六;c是最差的神槍手,十中四。

先問第壹個問題:如果三個人同時開槍,而每個人只開了壹槍;第壹輪槍戰後誰的生還幾率更大?

壹般認為A是神槍手,生還幾率較大。但合乎邏輯的結論是,C這個最差的神槍手活下來的機會最大。

我們來分析壹下每個槍手的策略。

槍手A必須先射擊射手B。因為B對A的威脅大於C對A的威脅,所以A應該先殺B,這是A的最佳策略..

同理,射手B的最佳策略是第壹槍瞄準裝甲。壹旦B幹掉A,B和C就會攤牌,B贏的概率自然大很多。

射手C的最佳策略是先射A。畢竟B的槍法比A差。C先殺A再對抗b,C的生存概率還是比較高的。

我們來計算壹下上述情況下三個槍手的生存概率:

答:24% (40% X 60% = 24%)

B: 20% (100%-80% = 20%)。

C: 100%(沒人拍C)

通過概率分析,我們發現,神槍手最差的C,生存幾率最大,而神槍手比C好的A和B,生存幾率要低很多。

但上面的例子隱含了壹個假設,即甲、乙、丙三方都清楚自己對手的投籃命中率。但在現實生活中,因為信息不對稱,比如槍手A偽裝,槍手B和槍手C認為槍手A是最差的神槍手。在這種情況下,最終的幸存者壹定是a,所以,無論是歷史還是現實,那些奸詐有城府的男人,往往都能成為最後的贏家。這個例子對妳的職業生活或者官場生涯有啟發嗎?

我們繼續假設甲、乙、丙三方互不知道對方的槍法水平。在這種情況下,A被B射中,A被C射中,A被B射中,A不被B射中的概率分別為25%,根據貝葉斯定理計算A的存活率:

甲活率:365,438+0%([被B照射:25% x 40% = 65,438+00%]+[被C照射:25% x 60% = 65,438+05%]+[被B-C照射:25% X 40% X 60% = 6%]。

乙的活率:23%([甲出手:25% X 20% = 5%]+[丙出手:25% X 60% = 15%]+[甲出手:25%X20%X60% = 3%])。

C的存活率:17%([被A射中:25% X 20% = 5%]+[被B射中:25% X 40% = 10%]+[被A和B射中:25% X 20% X 40% = 2%])。

在槍手不知道對方命中率信息的情況下,命中率最高的槍手A生存幾率最大,射擊最差的槍手C生存幾率最小。

我們再回到甲、乙、丙都知道對方命中率的情況下,分析第二輪槍戰。

第壹輪槍戰後,C可能同時面對A,B,甚至A和B,除非兩人都在第壹輪死亡。雖然很有可能第壹回合後C會贏(也就是A和B都會死),但是第二回合開始C肯定處於劣勢,因為A和B的命中率都比C高。

這是槍手C. C的悲哀,無能的他雖然能暫時贏得第壹輪槍戰,但也能玩點花樣。但是,如果甲乙雙方在第壹輪槍戰中沒有死亡,第二輪槍戰之後,丙方生存的幾率會低於甲乙雙方..

第二輪槍戰的生存概率大致計算如下:

(1)假設A和C戰鬥:A的存活率是60%,C的存活率是20%。

(2)假設B的存活率為60%,C的存活率為40%。

這似乎說明,能力差的人在競爭中耍花招能贏壹時,但最後往往不能成功。現在我們用嚴格概率法計算兩輪槍戰後甲、乙、丙三方的生存概率。

(1)第壹輪:

甲射乙,乙射甲,丙射甲..

A的存活率是24%(40% X 60%),B是20%(100%-80%),C是100%(沒人拍C)。

(2)第二輪:

情況1: A活,B死(24% X 80% = 19.2%)

A射C,C射A——A的存活率是60%,C的存活率是20%。

案例二:活甲死亡(20% X 76% = 15.2%)。

B拍C,C拍B——B的活率是60%,C的活率是40%。

情況三:甲乙雙方都活著(24% X 20% = 4.8%)

重復第壹輪。

情況四:甲乙雙方均死亡(76% X 80% = 60.8%)

槍戰結束了。

指甲成活率為12.672%。

(19.2% X 60%)+(4.8% X 24%)= 12.672%

B的存活率為10.08%。

(15.2% X 60%)+(4.8% X 20%)= 10.08%

C的存活率為75.52%。

(19.2% X 20%)+(15.2% X 40%)+(4.8% X 100%)+(60.8% X 100%)= 75.52%

通過兩輪槍戰的詳細概率計算,我們仍然發現,神槍手最差的C生還幾率最大,而神槍手較好的A和B生還幾率仍然遠低於C。

對於這樣的例子,有人會感嘆“英雄創造歷史,平庸孕育孩子。”

我們現在改變壹下遊戲規則,假設甲、乙、丙不同時射擊,而是輪流射擊。在這個例子中,我們發現C的機會大於他的實力。c不會被第壹槍打死,下壹輪可能有很大機會先開槍。

假設射擊的順序是A、B、C,A壹槍打死B後(80%幾率),輪到C射擊,C有40%幾率壹槍打死A。即使B躲過了A的第壹槍,輪到B開槍,B還是會瞄準槍法最好的A。就算B用這壹槍幹掉了A,下壹輪還是輪到C出手。無論A還是B先出手,B在下壹輪都有先出手的優勢。

如果C先出手呢?

c可以先射擊A。即使C打不中A,A的最佳策略仍然是向B開槍,然而,如果C打中A,B將在下壹輪向C開槍。所以C的最佳策略是隨機出手。只要C沒有打中A或者B,他在下壹輪射擊中就會處於有利位置。

通過這個例子我們可以明白,人在遊戲中能否取勝,不僅取決於自身的實力,還取決於玩家實力對比所形成的關系。

在上面的例子中,B和C實際上是壹個聯盟。如果先殺了A,他們生存的幾率會增加。現在我們來判斷壹下B和C誰更容易背叛,誰更容易忠誠?

任何聯盟的成員總會權衡利弊。壹旦背叛的好處大於忠誠的好處,聯盟就會破裂。在B和C的聯盟中,B是最忠誠的。這不是因為B本身有更忠誠的品質,而是因為利益關系。只要A不死,B的槍肯定會對準A..但C就不是這樣了,C不瞄準a亂開槍顯然是反聯盟的,這樣壹來B的處境會更危險。

合作可以對抗強敵。只有在B和C的配合下,才能先幹掉A。如果乙方和丙方不和,乙方和丙方都不單獨優於甲方,由甲方先後解決。

第六,聰明豬遊戲

豬圈裏有兩頭豬,壹頭大豬和壹頭小豬。豬圈的壹側有壹個踏板。每踩壹次踏板,就會有少量的食物落在豬圈另壹側遠離踏板的餵食口。如果壹只豬踩了踏板,另壹只豬就有機會先吃掉掉在另壹邊的食物。豬壹踩踏板,大豬剛好會在豬跑到食槽前把所有食物吃完;如果大豬踩了踏板,在小豬吃完掉下來的食物之前,還有機會跑到食槽,爭奪剩下的另壹半。

那麽,兩只豬會采取什麽策略呢?答案是:小豬會選擇“搭便車”策略,即在低谷期舒服地等待;大豬不知疲倦地在踏板和食槽之間跑來跑去,只為了壹點剩菜。

這是什麽原因呢?因為,小豬通過踩踏板什麽也得不到,但不踩踏板卻能吃到食物。對於小豬來說,不管大豬踩不踩踏板,不踩總是壹個不錯的選擇。另壹方面,大豬知道小豬不會踩油門。自己踩油門總比不踩好,所以他得自己來。

變化方案1:還原方案。餵食只有原來體重的壹半。結果小豬和大豬都不蹬了。小豬會踩,大豬會把食物吃完;如果大豬踩上去,小豬也會把食物吃完。誰蹬就意味著給對方貢獻食物,所以誰也不會有蹬的動力。

如果目的是讓豬多蹬,這個遊戲規則的設計顯然是失敗的。

變化方案二:增量方案。比以前多餵壹倍。結果小豬和大豬都會蹬。誰想吃就蹬。反正對方不會壹次吃完所有的食物。小豬和大豬相當於生活在壹個物質相對豐富的“物欲橫流”的社會,競爭意識不是很強。

對於遊戲規則的設計者來說,這個規則的成本是相當高的(壹次提供雙份食物);而且因為競爭不強,讓豬多蹬也沒啥效果。

變化方案三:減量加移位方案。只餵原來重量的壹半,但同時要把餵食口移到踏板附近。結果小豬和大豬都拼命蹬。等的人不會吃,努力的人會得到更多。每壹次收獲都只是花。

對於遊戲設計師來說,這是最好的解決方案。成本不高,但收獲最大。

很多人沒看過“聰明豬遊戲”的故事,但都在有意識地使用豬的策略。散戶在股市裏等著莊家上轎;等待產業市場出現有利可圖的新產品,然後大規模復制遊資牟取暴利;公司裏不創造效益但分享成果的人,等等。比如公司的激勵制度設計,獎勵太強,而且還是持股和期權。公司的所有員工都成了百萬富翁。且不說成本高,員工的積極性也不壹定高。這相當於《聰明豬遊戲》增量方案中描述的情況。但是,如果獎勵力度不大,觀眾有分成(即使是不幹活的“小豬”),曾經很努力的大豬們也就沒有動力了——就像《聰明豬遊戲》第壹期縮減計劃中描述的情況。最好的激勵機制設計就好比換第三種方案——減員加換班。獎勵不是人人共享,而是針對個人(如業務比例提成),既節約了成本(對公司而言),又杜絕了“搭便車”現象,可以實現有效激勵。

就整個社會而言,自我需求大的群體往往是推動社會生產力的主力軍。換句話說,要快速提高整個社會的生產力水平,需要有壹個消費需求大的群體,並給予他們壹定程度的獎勵。第三種改變方案反映了這種情況,降低了飼養成本,現實中也可以等同於增加飼養獎勵。

  • 上一篇:貞姬和兩個孩子兩天大。
  • 下一篇:生化危機7DLC傑克55歲生日通關積分排行榜。
  • copyright 2024遊戲中心平台