博弈論案例

首先，囚徒困境

故事講述了兩個犯罪嫌疑人作案後被警察抓住，分別關押在不同的房間進行審訊。警察知道那兩個人有罪，但他們缺乏足夠的證據。警察告訴大家:如果兩人都否認，各判壹年；如果兩人都坦白，各判八年；如果兩個人有壹個坦白，壹個否認，坦白釋放，否認判十年。所以，每個犯人都面臨著兩個選擇:認罪或者否認。但不管搭檔怎麽選擇，每個犯人最好的選擇都是坦白:如果搭檔否認，自己坦白，就釋放，不坦白就判壹年，坦白總比不坦白好；如果伴侶坦白，自己坦白，判八年，不坦白，判十年。坦白總比不坦白好。結果兩名嫌疑人都選擇了坦白，被判處有期徒刑八年。如果兩人都否認，各判壹年，顯然是個不錯的結果。但這種帕累托改進是做不到的，因為它不能滿足人類的理性要求。囚徒困境反映的深刻問題是，人類的個體理性有時會導致集體的非理性——聰明的人類會被自己的聰明所困。

第二，旅行者的困境

兩個旅行者從壹個以生產精美瓷器花瓶而聞名的地方旅行回來。他們都買了花瓶。當他們取行李時，發現花瓶被打碎了，於是他們向航空公司索賠。航空公司知道花瓶的價格在80-90元左右浮動，但不知道兩位乘客購買時的確切價格。於是，航空公司要求兩名乘客寫下花瓶的價格，100元以內。如果兩個人寫的壹樣，航空公司會認為他們說的是實話，按照他們寫的金額賠償；如果兩個人寫的不壹樣，航空公司會認定寫的差的乘客說的是實話，原則上按這個低價賠償。同時，航空公司將對說真話的獎勵2元，說假話的罰款2元。

為了得到最大的賠償，雙方的最佳策略是寫100元，這樣雙方都能得到100元。但是沒有，A很聰明。他想:如果我寫1元變成99元，B寫100元，那麽我就得到101元。為什麽不呢？所以他準備寫99元左右。但是B更聰明。他估摸著A要密謀他寫99元，所以他要寫98元。沒想到，A更聰明。估計B會寫98元騙他，所以他準備寫97元...眾所周知，下棋的時候，不是說要多“看”幾步嗎？“看”得越遠，贏的幾率就越大。再看兩步，我比妳強，再看三步，妳看四步，我比妳老練，再看五步。在花瓶索賠這件事上，如果兩個人都是“完全理性”的，都能看透十幾步甚至幾十步，那麽上面那場“聰明競賽”的結果，最終會落到大家都只寫壹兩元的地步。其實在完全理性的假設下，這個博弈唯壹的納什均衡就是兩人都寫0。

第三，競爭也是劫持。

費城西區有兩家對立的商店——紐約廉價商店和美國廉價商店。他們緊挨著彼此。這兩家店的老板是死敵。他們壹直在進行無休止的價格戰。即使是鷹眼貝蒂·瑞普女士也找不到任何缺陷。不信妳問她。而且這種床單的價格低得離譜，只有6美元50美分。“當這樣的手寫通知出現在壹家商店的櫥窗裏時，每個顧客都會習慣於等待另壹家廉價商店的回復。果不其然，大約兩個小時後，另壹家商店的櫥窗裏出現了這張通知:“瑞皮女士需要壹副近視眼鏡，我的床單質量壹流。只有5美元95美分”。價格戰的日子就這樣開始了。兩家店的老板除了張貼告示，還經常站在店外對著對方大喊大叫，經常導致拳腳相加。最後壹方老板在這場價格戰中不打了，價格不再下跌。說那個人瘋了，說明對方贏了。這個時候，每壹個圍觀的，路過的，附近的，都會湧向中獎的便宜貨店。搶購所有的床單和其他物品。在這壹帶，兩家店的爭吵最激烈，時間也最長，所以口碑很好。住在附近的每個人都從他們的奮鬥中受益匪淺，買了各種“精致”的商品。突然有壹天，壹家商店的老板去世了。幾天後，另壹家店的老板聲稱要去外地做貨，兩家店都倒閉了。兩家店都有了自己的新老板。他們各自對兩家店的前老板的財產做了詳細的調查。有壹天，他們在檢查的時候，發現兩家店之間有壹條秘密通道，在兩家店樓上兩位老板住的套房裏發現了壹扇連接兩家的門。新老板很奇怪，後來他們才知道這兩個死敵其實是兄弟。所有的咒罵，謾罵，威脅，人身攻擊都是上演的，每壹次價格戰都是假的。不管誰贏，他最後都是用自己的把對方庫存的商品全部賣給客戶。多麽精彩的騙局。

第四，酒吧遊戲問題(bar problem)

酒吧博弈的問題是由美國人W.B. Arthur在1994期《美國經濟評論》上發表的壹篇題為《歸納論證與有限理性》的問題中提出的，隨後他在1999期《科學》雜誌上發表的壹篇文章《復雜性與經濟學》中對博弈進行了闡述。遊戲是壹群人，比如n = 100，決定每個周末是去酒吧還是呆在家裏。酒吧的容量有限，假設60人。如果有人預測會有60多人去酒吧，他會決定去不去嗎？.....每個參與者或決策者面對的只是之前去過酒吧的人數，只能根據之前的人數信息總結策略。這是壹個典型的動態博弈問題。.....通過計算機模型實驗，亞瑟得到了壹個有趣的結果:不同的演員根據自己的感應行動，去酒吧的人數沒有固定的規律。然而，壹段時間後，去酒吧的平均人數總是傾向於60人。亞瑟說，預報員把自己組織成壹個去或不去的人的平衡系統，或者形成壹個生態穩定系統。.....這是酒吧的問題。

酒吧問題反映了這樣壹種社會現象。就像亞瑟教授說的，在很多行動中，我們要猜測別人的行動。然而，我們沒有關於其他人的更多信息。我們只能通過分析過去的歷史來預測未來。

五、槍手遊戲

今天，我講壹個關於博弈論的經典故事。

三個互相仇視的槍手A、B、C準備打起來。a槍法最好，十發八中；第二槍法，十分之六；c是最差的神槍手，十中四。

先問第壹個問題:如果三個人同時開槍，而每個人只開了壹槍；第壹輪槍戰後誰的生還幾率更大？

壹般認為A是神槍手，生還幾率較大。但合乎邏輯的結論是，C這個最差的神槍手活下來的機會最大。

我們來分析壹下每個槍手的策略。

槍手A必須先射擊射手B。因為B對A的威脅大於C對A的威脅，所以A應該先殺B，這是A的最佳策略..

同理，射手B的最佳策略是第壹槍瞄準裝甲。壹旦B幹掉A，B和C就會攤牌，B贏的概率自然大很多。

射手C的最佳策略是先射A。畢竟B的槍法比A差。C先殺A再對抗b，C的生存概率還是比較高的。

我們來計算壹下上述情況下三個槍手的生存概率:

答:24% (40% X 60% = 24%)

B: 20% (100%-80% = 20%)。

C: 100%(沒人拍C)

通過概率分析，我們發現，神槍手最差的C，生存幾率最大，而神槍手比C好的A和B，生存幾率要低很多。

但上面的例子隱含了壹個假設，即甲、乙、丙三方都清楚自己對手的投籃命中率。但在現實生活中，因為信息不對稱，比如槍手A偽裝，槍手B和槍手C認為槍手A是最差的神槍手。在這種情況下，最終的幸存者壹定是a，所以，無論是歷史還是現實，那些奸詐有城府的男人，往往都能成為最後的贏家。這個例子對妳的職業生活或者官場生涯有啟發嗎？

我們繼續假設甲、乙、丙三方互不知道對方的槍法水平。在這種情況下，A被B射中，A被C射中，A被B射中，A不被B射中的概率分別為25%，根據貝葉斯定理計算A的存活率:

甲活率:365，438+0%([被B照射:25% x 40% = 65，438+00%]+[被C照射:25% x 60% = 65，438+05%]+[被B-C照射:25% X 40% X 60% = 6%]。

乙的活率:23%([甲出手:25% X 20% = 5%]+[丙出手:25% X 60% = 15%]+[甲出手:25%X20%X60% = 3%])。

C的存活率:17%([被A射中:25% X 20% = 5%]+[被B射中:25% X 40% = 10%]+[被A和B射中:25% X 20% X 40% = 2%])。

在槍手不知道對方命中率信息的情況下，命中率最高的槍手A生存幾率最大，射擊最差的槍手C生存幾率最小。

我們再回到甲、乙、丙都知道對方命中率的情況下，分析第二輪槍戰。

第壹輪槍戰後，C可能同時面對A，B，甚至A和B，除非兩人都在第壹輪死亡。雖然很有可能第壹回合後C會贏(也就是A和B都會死)，但是第二回合開始C肯定處於劣勢，因為A和B的命中率都比C高。

這是槍手C. C的悲哀，無能的他雖然能暫時贏得第壹輪槍戰，但也能玩點花樣。但是，如果甲乙雙方在第壹輪槍戰中沒有死亡，第二輪槍戰之後，丙方生存的幾率會低於甲乙雙方..

第二輪槍戰的生存概率大致計算如下:

(1)假設A和C戰鬥:A的存活率是60%，C的存活率是20%。

(2)假設B的存活率為60%，C的存活率為40%。

這似乎說明，能力差的人在競爭中耍花招能贏壹時，但最後往往不能成功。現在我們用嚴格概率法計算兩輪槍戰後甲、乙、丙三方的生存概率。

(1)第壹輪:

甲射乙，乙射甲，丙射甲..

A的存活率是24%(40% X 60%)，B是20%(100%-80%)，C是100%(沒人拍C)。

(2)第二輪:

情況1: A活，B死(24% X 80% = 19.2%)

A射C，C射A——A的存活率是60%，C的存活率是20%。

案例二:活甲死亡(20% X 76% = 15.2%)。

B拍C，C拍B——B的活率是60%，C的活率是40%。

情況三:甲乙雙方都活著(24% X 20% = 4.8%)

重復第壹輪。

情況四:甲乙雙方均死亡(76% X 80% = 60.8%)

槍戰結束了。

指甲成活率為12.672%。

(19.2% X 60%)+(4.8% X 24%)= 12.672%

B的存活率為10.08%。

(15.2% X 60%)+(4.8% X 20%)= 10.08%

C的存活率為75.52%。

(19.2% X 20%)+(15.2% X 40%)+(4.8% X 100%)+(60.8% X 100%)= 75.52%

通過兩輪槍戰的詳細概率計算，我們仍然發現，神槍手最差的C生還幾率最大，而神槍手較好的A和B生還幾率仍然遠低於C。

對於這樣的例子，有人會感嘆“英雄創造歷史，平庸孕育孩子。”

我們現在改變壹下遊戲規則，假設甲、乙、丙不同時射擊，而是輪流射擊。在這個例子中，我們發現C的機會大於他的實力。c不會被第壹槍打死，下壹輪可能有很大機會先開槍。

假設射擊的順序是A、B、C，A壹槍打死B後(80%幾率)，輪到C射擊，C有40%幾率壹槍打死A。即使B躲過了A的第壹槍，輪到B開槍，B還是會瞄準槍法最好的A。就算B用這壹槍幹掉了A，下壹輪還是輪到C出手。無論A還是B先出手，B在下壹輪都有先出手的優勢。

如果C先出手呢？

c可以先射擊A。即使C打不中A，A的最佳策略仍然是向B開槍，然而，如果C打中A，B將在下壹輪向C開槍。所以C的最佳策略是隨機出手。只要C沒有打中A或者B，他在下壹輪射擊中就會處於有利位置。

通過這個例子我們可以明白，人在遊戲中能否取勝，不僅取決於自身的實力，還取決於玩家實力對比所形成的關系。

在上面的例子中，B和C實際上是壹個聯盟。如果先殺了A，他們生存的幾率會增加。現在我們來判斷壹下B和C誰更容易背叛，誰更容易忠誠？

任何聯盟的成員總會權衡利弊。壹旦背叛的好處大於忠誠的好處，聯盟就會破裂。在B和C的聯盟中，B是最忠誠的。這不是因為B本身有更忠誠的品質，而是因為利益關系。只要A不死，B的槍肯定會對準A..但C就不是這樣了，C不瞄準a亂開槍顯然是反聯盟的，這樣壹來B的處境會更危險。

合作可以對抗強敵。只有在B和C的配合下，才能先幹掉A。如果乙方和丙方不和，乙方和丙方都不單獨優於甲方，由甲方先後解決。

第六，聰明豬遊戲

豬圈裏有兩頭豬，壹頭大豬和壹頭小豬。豬圈的壹側有壹個踏板。每踩壹次踏板，就會有少量的食物落在豬圈另壹側遠離踏板的餵食口。如果壹只豬踩了踏板，另壹只豬就有機會先吃掉掉在另壹邊的食物。豬壹踩踏板，大豬剛好會在豬跑到食槽前把所有食物吃完；如果大豬踩了踏板，在小豬吃完掉下來的食物之前，還有機會跑到食槽，爭奪剩下的另壹半。

那麽，兩只豬會采取什麽策略呢？答案是:小豬會選擇“搭便車”策略，即在低谷期舒服地等待；大豬不知疲倦地在踏板和食槽之間跑來跑去，只為了壹點剩菜。

這是什麽原因呢？因為，小豬通過踩踏板什麽也得不到，但不踩踏板卻能吃到食物。對於小豬來說，不管大豬踩不踩踏板，不踩總是壹個不錯的選擇。另壹方面，大豬知道小豬不會踩油門。自己踩油門總比不踩好，所以他得自己來。

變化方案1:還原方案。餵食只有原來體重的壹半。結果小豬和大豬都不蹬了。小豬會踩，大豬會把食物吃完；如果大豬踩上去，小豬也會把食物吃完。誰蹬就意味著給對方貢獻食物，所以誰也不會有蹬的動力。

如果目的是讓豬多蹬，這個遊戲規則的設計顯然是失敗的。

變化方案二:增量方案。比以前多餵壹倍。結果小豬和大豬都會蹬。誰想吃就蹬。反正對方不會壹次吃完所有的食物。小豬和大豬相當於生活在壹個物質相對豐富的“物欲橫流”的社會，競爭意識不是很強。

對於遊戲規則的設計者來說，這個規則的成本是相當高的(壹次提供雙份食物)；而且因為競爭不強，讓豬多蹬也沒啥效果。

變化方案三:減量加移位方案。只餵原來重量的壹半，但同時要把餵食口移到踏板附近。結果小豬和大豬都拼命蹬。等的人不會吃，努力的人會得到更多。每壹次收獲都只是花。

對於遊戲設計師來說，這是最好的解決方案。成本不高，但收獲最大。

很多人沒看過“聰明豬遊戲”的故事，但都在有意識地使用豬的策略。散戶在股市裏等著莊家上轎；等待產業市場出現有利可圖的新產品，然後大規模復制遊資牟取暴利；公司裏不創造效益但分享成果的人，等等。比如公司的激勵制度設計，獎勵太強，而且還是持股和期權。公司的所有員工都成了百萬富翁。且不說成本高，員工的積極性也不壹定高。這相當於《聰明豬遊戲》增量方案中描述的情況。但是，如果獎勵力度不大，觀眾有分成(即使是不幹活的“小豬”)，曾經很努力的大豬們也就沒有動力了——就像《聰明豬遊戲》第壹期縮減計劃中描述的情況。最好的激勵機制設計就好比換第三種方案——減員加換班。獎勵不是人人共享，而是針對個人(如業務比例提成)，既節約了成本(對公司而言)，又杜絕了“搭便車”現象，可以實現有效激勵。

就整個社會而言，自我需求大的群體往往是推動社會生產力的主力軍。換句話說，要快速提高整個社會的生產力水平，需要有壹個消費需求大的群體，並給予他們壹定程度的獎勵。第三種改變方案反映了這種情況，降低了飼養成本，現實中也可以等同於增加飼養獎勵。

上一篇:貞姬和兩個孩子兩天大。

下一篇:生化危機7DLC傑克55歲生日通關積分排行榜。

有創意的團建活動方案

隱藏我的遊戲2，24號

兒童體重差異排名簡介

我比較喜歡網遊小說《網遊大話西遊》。有沒有類似的作品？

遊戲名字統壹格式大全

權力的遊戲小玫瑰寶箱

90後還壹邊工作壹邊打遊戲，這是玩物嗎？