什麽是納什均衡？

也稱為非合作博弈均衡

來源

約翰·納什(Johnf nash)於65438年至0948年作為壹名年輕的數學博士生進入普林斯頓大學。他的研究成果可以在他的博士論文《非合作博弈》(1950)中找到。這篇博士論文促成了N人博弈中的均衡點(1950)和非合作博弈(1951)兩篇論文的發表。納什在上面的論文中介紹了合作博弈和非合作博弈的區別。他對非合作博弈最重要的貢獻是明確了壹個包含任意人數和任意偏好的壹般解概念，即不局限於兩人零和博弈。這個解的概念後來被稱為納什均衡。

編輯此段落定義

假設有n個參與博弈的人，給定其他人的策略，每個人選擇自己的納什均衡。

最優策略(個人最優策略可能依賴也可能不依賴於他人的策略)，從而使自己的利益最大化。所有玩家的策略構成壹個策略剖面。納什均衡就是指這樣壹種戰略組合，由所有參與者的最優策略組成。也就是給定別人的策略，沒有人有足夠的理由打破這個均衡。納什均衡，本質上是壹種非合作博弈狀態。當達到納什均衡時，並不意味著博弈雙方都處於不動狀態。在順序遊戲中，這種均衡是在玩家的連續動作和反應中實現的。納什均衡並不意味著博弈雙方達到了整體最優狀態。下面的囚徒困境就是壹個例子。

編輯此段落的標準定義

納什均衡的定義:在博弈G = (S1，…，Sn: U1，…，UN)中，如果任壹局中人在每個局中人的壹個策略構成的博弈組合(s1*，…，sn*)中進行博弈，Sn*)，即UI (s1*，… S * I-1，Si *，S * I+1，…，Sn *)≥UI(S 654338

編輯這個納什均衡的經典案例:囚徒困境

(1950，數學家塔克是斯坦福大學的客座教授。在給壹些心理學家做演講時，他講了兩個囚犯的故事。假設甲、乙兩個小偷共同作案，私自入室，被警察抓住。警察把這兩個人放在兩個不同的房間裏審問。對於每壹個嫌疑人，警方給出的政策是:如果壹個嫌疑人供認犯罪並交出贓物，納什均衡將被證明。

據證實，他們兩人都被判有罪。如果另壹名嫌疑人也供認不諱，他們各被判處8年徒刑；如果另壹個犯罪嫌疑人在沒有坦白的情況下否認，會以妨礙公務罪(因為有證據證明他有罪)再判兩年有期徒刑，坦白者減刑八年後立即釋放。如果兩人都否認，警方因證據不足不能判他們盜竊罪，但可以以非法侵入罪各判1年有期徒刑。表2.2顯示了這個博弈的收益矩陣。表2.2囚徒困境博弈A╲B供認否認

表白-8，-8 0，-10

拒絕-10，0 -1，-1

關於案件，很明顯最佳策略是雙方都否認，結果大家都只判了1年。但由於兩人的隔絕，首先從心理學角度來看，雙方都會懷疑對方為了自保而背叛自己，其次亞當·斯密的理論假設每個人都是“理性經濟人”，都會以利己為目的做出選擇。這兩個人會有這樣壹個計算過程:如果他招供，我就否認，我要坐牢10年，招供最多也就8年；如果他否認，我可以被釋放，他要坐牢10年。考慮到以上情況，無論他是否坦白，我坦白都是劃算的。兩個人都會用這樣的腦子。最終，兩人都選擇了坦白，被判處有期徒刑八年。基於經濟學中理性代理人的前提，兩個囚徒在各自利益上的選擇是懺悔，原納什均衡

這種對雙方都有利的策略是不會出現的，除非他們坦白，都被釋放。就這樣，兩人都選擇了坦白的策略，被判了八年監禁。納什均衡首先挑戰了亞當·斯密的“看不見的手”原理:根據斯密的理論，在市場經濟中，每個人都是從利己的目的出發，最終整個社會達到利他的效果。但是，我們可以從納什均衡中得出壹個“看不見的手”原理的悖論:從利己目的出發，結果會是損人不利己，對自己無益。

編輯這壹段的另壹個簡單例子。

妳坐在圖書館裏，壹個陌生的美女過來搭訕，要求和妳玩壹個數學遊戲。美女建議道:“讓我們各自展示硬幣的壹面，要麽正面，要麽反面。如果我們都是頭，那我給妳3元，如果我們都是尾，我給妳1元，剩下的妳給我2元。”那麽我們應該和這個女孩玩這個遊戲嗎？這基本上是廢話，當然。問題是，這個遊戲公平嗎？根據不同的規則，每個博弈有兩種納什均衡。壹種是純策略納什均衡，即玩家可以采取固定的策略(比如總是玩正面或者反面)，讓每個人賺的最多或者虧的最少；或者混合策略納什均衡，而在這個博弈中，應該采用混合策略納什均衡。N\m美女有頭，美女有尾。

妳玩正面+3，-3 -2，+2。

妳玩尾數-2，+2 +1，-1。

假設我們正面的概率是x，反面的概率是1-x，為了利益最大化，我們應該在對手露出正面或者反面的時候獲得相等的收益，否則對手總是可以改變正面和反面的概率來減少我們的總收益，這裏列出的等式是3x+(-2)*(1-x)=(-2)* x+1 *(1-x)。將x= 3/8代入收益表達式3*x+(-2)*(1-x)可以得到每次的預期收益，計算結果為-1/8元。同樣，假設美女臉的概率是y，她臉的概率是1-y，等式-3y+2(1-y)= 2y+(-1)*(1-y)等於3/8，每次對美女的期望。這告訴我們，在雙方都采取最優策略的情況下，平均每次美女贏1/8元。其實只要美女采用(3/8，5/8)的方案，無論妳采用什麽方案，都改變不了局面。如果都是人頭，每次的預期收益是(3+3+3-2-2-2-2)/8 =-1/8元；如果把所有的尾部都顯示出來，那麽每次的預期收益是(-2-2-2+1+1)/8 =-1/8元。任何策略無非是以上兩種策略的線性組合，所以期望仍然是-1/8元。但是當妳也采取最優策略的時候，至少可以保證妳損失最小。否則妳肯定會被美女采取的策略盯上，從而失去更多。

編輯這壹段的重要影響

納什均衡理論奠定了現代主流博弈論和經濟理論的根本基礎。正如克雷普斯(1990)在《博弈論與經濟建模導論》中所說，“在過去的二三十年裏，經濟學經歷了壹場方法論、語言和概念的溫和革命，非合作博弈論成為範式的中心...納什均衡的重要影響可以概括為以下六個方面:1。它改變了經濟學的體系和結構。非合作博弈論的概念、內容、模型和分析工具已經滲透到微觀經濟學、宏觀經濟學、勞動經濟學、國際經濟學、環境經濟學等經濟學學科的大部分學科中，改變了這些學科的內容和結構，成為這些學科的基本研究範式和理論分析工具，從而改變了原有經濟學理論體系各個分支的內涵。2.擴大了經濟學研究經濟問題的範圍。原始經濟學缺乏對不確定因素、變化的環境因素以及經濟個體之間的相互作用進行建模的有效方法，因此無法解剖和分析微觀層面的經濟問題。納什均衡及相關模型分析方法，包括擴展博弈方法、逆向歸納法、子博弈完美納什均衡等概念方法，為經濟學家提供了深入的分析工具。3.加強了經濟研究的深度。納什均衡理論不回避經濟個體之間的直接互動，也不滿足於經濟個體之間復雜經濟關系的簡單化。在分析問題時，不僅僅停留在宏觀層面，而是深入分析表象背後的深層次原因和規律，強調從微觀個體行為規律的角度發現問題的根源，從而更深入、更準確地理解和解釋經濟問題。4.形成了基於經典博弈的研究範式體系。也就是說，我們可以將各種問題或經濟關系按照經典博弈的類型或特點進行分類，按照經典博弈相應的分析方法和模型進行研究，從而方便地將在壹個領域獲得的經驗移植到另壹個領域。5.經濟學與其他社會和自然科學之間的關系得到了擴大和加強。納什均衡之所以偉大，是因為它平凡，它幾乎無處不在。納什均衡理論不僅適用於人類的行為規律，也適用於人類以外的其他生物的生存、運動和發展規律。納什均衡和博弈論的橋梁作用使得經濟學與其他社會科學和自然科學的聯系更加緊密，形成了經濟學與其他學科相互促進的良性循環。6.改變了經濟學的語言和表達方式。在進化博弈論方面頗有造詣的坎多裏(1997)曾經對保羅·薩繆爾森的名言做了壹個幽默的引申，“妳甚至可以把壹只鸚鵡變成壹個訓練有素的經濟學家，因為它只需要學會兩個詞，那就是‘供給’和‘需求’。”他說，“現在這只鸚鵡需要。

上一篇:NDS上神奇寶貝什麽版本最好玩？

下一篇:《找七星瓢蟲》說課稿

射擊遊戲設備

電腦在森林裏還能玩什麽遊戲？

紅警3為何被中國禁止？

求遊戲王青冰之白夜龍第壹效果詳解。(什麽時候可以發動?光封等不止以他為對象的魔陷有沒有用?可不可以破壞)

十年前《讓子彈飛》被扯下肚兜的配角女演員，後來經歷了什麽？

哪個牌子的平板電腦好用又實惠？

強大的名字顯示妳的能力。有哪些好聽的遊戲名？