納什均衡
出自 MBA智库百科(https://wiki.mbalib.com/)
納什均衡(Nash equilibrium)——完全信息靜態博弈
目錄 |
納什均衡,又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名。在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。如果兩個博弈的當事人的策略組合分別構成各自的支配性策略,那麼這個組合就被定義為納什均衡。
一個策略組合被稱為納什均衡,當每個博弈者的均衡策略都是為了達到自己期望收益的最大值,與此同時,其他所有博弈者也遵循這樣的策略。
關於納什均衡的普遍意義和存在性定理的證明等奠定非合作博弈理論發展基礎的重要成果,是約翰·納什在普林斯頓大學攻讀博士學位時完成的。實際上,博弈論的研究起始於1944年馮·諾依曼(Von Neumann)和奧斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈論和經濟行為》。然而卻是納什首先用嚴密的數學語言和簡明的文字準確地定義了納什均衡這個概念,併在包含“混合策略(mixed strategies)”的情況下,證明瞭納什均衡在n人有限博弈中的普遍存在性,從而開創了與諾依曼和摩根斯坦框架路線均完全不同的“非合作博弈(Non-cooperative Game)”理論,進而對“合作博弈(Cooperative Game)”和“非合作博弈”做了明確的區分和定義。阿爾伯特·塔克(Albert tucker)教授評價其論文,“這是對博弈理論的高度原創性和重要的貢獻。它發展了本身很有意義的n人有限非合作博弈的概念和性質。並且它很可能開拓出許多在兩人零和問題以外的,至今尚未涉及的問題。在概念和方法兩方面,該論文都是作者的獨立創造。”
1.囚徒困境
博弈論中一個著名的例子就是囚徒困境。囚徒困境是一個非零和博弈,說的是兩個嫌疑犯甲和乙私入民宅聯手作案,被警方逮住但未獲證據。警方於是將兩個嫌疑犯分開審訊。警官分別告訴 兩個囚犯,如果你招供,而對方不招供,則你將被判刑3個月,對方將被判刑10年;若兩人都不招供則因未獲證據但私入民宅將各拘留1年;如果兩人均招供,每人將被判刑5年。於是,兩個人同時陷入招供還是不招供的兩難處境。結果是,儘管甲不知乙是否招供,但他認為自己選擇“招供”最好,因而甲會選擇“招供”,同樣乙也會選擇“招供”,兩人各判5年。而兩人都選擇不招供,雖證據不足但因私入民宅將各拘留1年的結果是不會出現的。
博弈矩陣 | 囚犯甲 | ||
---|---|---|---|
招供 | 不招供 | ||
囚犯乙 | 招供 | 判刑五年 | 甲判刑十年;乙判刑三個月 |
不招供 | 甲判刑三個月;乙判刑十年 | 判刑一年 |
在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。如果兩個博弈的當事人的策略組合分別構成各自的支配性策略,那麼這個組合就被定義為納什均衡。納什均衡又稱為非合作博弈均衡,是博弈論的一個重要術語,它是以美國數學家、日後成為電影《美麗心靈》主人公的納什的名字命名的。在上述囚徒困境例子中,兩個囚犯符合自己利益的選擇是坦白招供。這種兩人都選擇坦白的策略以及因此被判刑五年的結局就是“納什均衡”。
2.打獵
兩個獵人出發去打獵。假設一頭鹿有400公斤肉,但必須兩人合作才能打到,一個人打什麼都獲得不了。同地區有一群兔子,一共有200公斤肉,兩人合作可以全部打完,但一個人打也可以獲得100公斤肉。兩個獵人各自都知道對方的平衡策略,但不能通過任何方式影響對方的決策。最終的結果會怎樣?
決策 | 結果 | ||
---|---|---|---|
A | B | A | B |
獵鹿 | 獵鹿 | 200 | 200 |
獵鹿 | 獵兔 | 0 | 100 |
獵兔 | 獵鹿 | 100 | 0 |
獵兔 | 獵兔 | 100 | 100 |
這裡面有兩個納什均衡。
(1)兩人都獵鹿:任何一人單方切換成獵兔子,都會讓自己的收益從200跌到100。
(2)兩人都獵兔子:任何一人單方切換成獵鹿,都會讓自己的收益從100跌到0。
註意,這裡面都是單方更改。要是雙方同時從兔子換成鹿,都會更好——但納什均衡不考慮這個。
這也造成了一個問題:納什均衡從全局看起來不見得是“理性”的,不是看起來的最優解,但是對每個人來說,它的確是在別人不可控時自己的最優解。
納什均衡的重要影響[1]
納什均衡理論奠定了現代主流博弈理論和經濟理論的根本基礎,正如克瑞普斯(Kreps,1990)在《博弈論和經濟建模》一書的引言中所說,“在過去的一二十年內,經濟學在方法論以及語言、概念等方面,經歷了一場溫和的革命,非合作博弈理論已經成為範式的中心……在經濟學或者與經濟學原理相關的金融、會計、營銷和政治科學等學科中,現在人們已經很難找到不懂納什均衡能夠‘消費’近期文獻的領域。”納什均衡的重要影響可以概括為以下六個方面(謝識予,1999):
(1)改變了經濟學的體系和結構。非合作博弈論的概念、內容、模型和分析工具等,均已滲透到微觀經濟學、巨集觀經濟學、勞動經濟學、國際經濟學、環境經濟學等經濟學科的絕大部分學科領域,改變了這些學科領域的內容和結構,成為這些學科領域的基本研究範式和理論分析工具,從而改變了原有經濟學理論體系中各分支學科的內涵。
(2)擴展了經濟學研究經濟問題的範圍。原有經濟學缺乏將不確定性因素、變動環境因素以及經濟個體之間的交互作用模式化的有效辦法,因而不能進行微觀層次經濟問題的解剖分析。納什均衡及相關模型分析方法,包括擴展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經濟學家們提供了深入的分析工具。
(3)加強了經濟學研究的深度。納什均衡理論不迴避經濟個體之間直接的交互作用,不滿足於對經濟個體之間複雜經濟關係的簡單化處理,分析問題時不只停留在巨集觀層面上而是深入分析表象背後深層次的原因和規律,強調從微觀個體行為規律的角度發現問題的根源,因而可以更深刻準確地理解和解釋經濟問題。
(4)形成了基於經典博弈的研究範式體系。即可以將各種問題或經濟關係,按照經典博弈的類型或特征進行分類,並根據相應的經典博弈的分析方法和模型進行研究,將一個領域所取得的經驗方便地移植到另一個領域。
(5)擴大和加強了經濟學與其他社會科學、自然科學的聯繫。納什均衡之所以偉大,就因為它普通,而且普通到幾乎無處不在。納什均衡理論既適用於人類的行為規律,也適合於人類以外的其他生物的生存、運動和發展的規律。納什均衡和博弈論的橋梁作用,使經濟學與其他社會科學、自然科學的聯繫更加緊密,形成了經濟學與其他學科相互促進的良性迴圈。
(6)改變了經濟學的語言和表達方法。在進化博弈論方面相當有造詣的坎多利(Kandori,1997)對保羅·薩繆爾森(Paul Samuelson)的名言“你甚至可以使一隻鸚鵡變成一個訓練有素的經濟學家,因為它必須學習的只有兩個詞,那就是‘供給’和‘需求’”,曾做過一個幽默的引申,他說,“現在這隻鸚鵡需要再學兩個詞,那就是‘納什均衡’”。
案例一:納什均衡在貨幣政策效應中的應用[2]
- 一、博弈論下的貨幣政策博弈分析
貨幣政策博弈分析 利用博弈論方法分析巨集觀金融博弈問題。因而,博弈論是巨集觀金融博弈分析的方法論基礎。納什(Nash) 在195O年和1951年發表了兩篇關於非合作博弈的重要文章,從一般意義上定義了非合作博弈及其均衡解.並證明瞭均衡的存在.基本奠定了現代非合作博弈論的基礎。因而,該均衡以後被博弈理論稱為“納什均衡”。即是指由所有的參與者的最優策略組成的策略組合。在這種策略組合中 給定其他參與者的策略,沒有任何單個參與者有積極性選擇其他策略 也就沒有人主動去打破這種均衡。相反如果一種均衡或制度安排,如果不是一種納什均衡.即不是所有參與者的最優策略組合 那麼,這種組合就不能成立或者至少不能持續。合作博弈強調團體理性、效率和公平。而非合作博弈強調個人理性、個人最優決策。其結果可能是有效的 也可能是無效的。現實中 大量的經濟博弈問題是非合作博弈。非合作博弈理論的發展為其在經濟研究中的廣泛應用創造了條件並推動了合作博弈的進一步發展。
納什均衡假定博弈參與者在選擇自己的策略時,把其他參與者的策略當做給定的。而不考慮自己的選擇如何影響博弈對手的選擇。這個假定在靜態博弈下是成立的,但在動態博弈下卻不成立。
在靜態博弈中,所有參與者同時行動,不可能在自己採取行動前觀察到其他人的行動 因而就無暇反應。但在動態博弈中 一方行動在先 另一方行動在後.後者自然會根據前者的選擇而調整自己的選擇,前者自然會理性地預期到這一點,所以不能不考慮自己的選擇對其他參與者的影響,由於決策者不考慮自己的選擇對他人選擇的影響,納什均衡允許了不可置信威脅的存在。1965年澤爾騰(Selten) 將納什均衡的概念引入了動態分析定義了子博弈精練納什均衡” 的概念。將不可置信的威脅策略從納什均衡中剔除出去,從而解決了完全信息動態博弈均衡求解問題 將不可置信的策略變成可置信策略的行動 即經濟學中的 承諾行動”。如果當事人不履行其承諾時將為之付出相應的代價 這種承諾就是可置信的,否則就是不可置信的。該概念的提出,對利用博弈論方法研究貨幣政策問題奠定了基礎。
- 二、納什均衡在貨幣政策效應中的應用
在理性預期條件下,我們考察一期的貨幣政策博弈均衡。假定中央銀行的目標成本函數為:。
其中:π為通貨膨脹率;y為實際經濟增長率;y * 為中央銀行期望的經濟增長率。
根據盧卡斯供給曲線:y = yn + α(π − πe),α > 0.其中:為潛在經濟增長率;為公眾的預期通貨膨脹率:a表示非預期通膨脹對經濟的影響程度,即總供給曲線的斜率。
假定α=1,即:y = yn + (π − πα)
同時假定中央銀行對貨幣增長有完全的控制能力.公眾的預期完全理性 不存在真實供給衝擊和貨幣流通速度變化的影響.通貨膨脹率π等於貨幣供給增長率m,通貨膨脹預期πα。等於貨幣供給增長率me,中央銀行期望的經濟增長率與潛在的經濟增長率相等。有。
令公眾的目標函數為避免由於預期誤差導致的通貨膨脹之害,因此可把公眾的效用函數定義為:U = − (m − me)2
可得該貨幣政策博弈的支付矩陣如下:
中央銀行策略(m) | 公眾策略(me) | |
0 | 1 | |
0 | (0,0) | (0,0,5) |
1 | (1,-1) | (0,5,0) |
矩陣中m=0表示中央銀行選擇零的貨幣增長率 m=1表示中央銀行選擇正的貨幣增長率:公眾策略的含義同上。由支付矩陣可知 對中央銀行來說,m=1的效用嚴格優於m=0的效用.m=1為其最優策略。在理性預期下,公眾迅速認識到中央銀行會選擇正的貨幣增長率,其必然選擇m=1以使其效用最大化,該博弈模型的納什均衡是中央銀行選擇正的貨幣增長率,公眾選擇正的通貨膨脹率預期,效用函數為(0,5,0)。均衡結果顯示貨幣政策只會影響通貨膨脹率而真實產出不變。
貨幣政策博弈具體表現為貨幣政策的決策和執行過程中存在動態不一致性問題。博弈主體在當前做出的關於未來的最優決策,在決策執行時對決策制定者已不再是最優決策.因而他必然要調整其決策。例如 在公眾預期形成之前 對於貨幣政策制定者來說,零通貨膨脹(或較低通貨膨脹)可能是最優的選擇。因而為了影響公眾預期,他可能在此選擇和許諾他將實行零通貨膨脹(或較低通貨膨脹)。但是,當公眾預期形成以後零通貨膨脹(或較低通貨膨脹)對政策制定者來說已不是最優決策。為了獲得非預期通貨膨脹對經濟增長和就業增加的刺激作用,政策制定者必須實行正的(或更高的)通貨膨脹.在完全信息條件下公眾知道政策制定者會這樣做.因而他的許諾是不可置信的。具有理性和完全信息的公眾不會被其愚弄.最後結果必然是被預期到的正的(或更高的)通貨膨脹。相機選擇貨幣政策的這種通貨膨脹(通貨緊縮)傾向是由該博弈結構內生性決定的,即該均衡(納什均衡)允許了不可置信的威脅策略的存在,中央銀行關於零通脹(或低通脹)的許諾是不可置信的。
要消除貨幣政策的通貨膨脹(通貨緊縮)傾向 必須消除這種不可置信因素——中央銀行在公眾預期形成之前承諾其將毫不改變地執行單一規則的貨幣政策 通過承諾行動中央銀行獲得了影響公眾預期的能力。因而,在選擇其貨幣供給增長率時.就必須考慮它對公眾預期的立即和充分的影響 就不能期望製造非預期通貨膨脹(通貨緊縮)來刺激經濟、增加就業或為預算融資。這就是說,提高政策的穩定性和可信程度是消除通貨膨脹(通貨緊縮)的關鍵。
本条目由以下用户参与贡献
Vulture,Angle Roh,山林,Mingshi,苦行者,Zfj3000,Leonardolee,Yixi,laogaogao,Dan,郭凯,金龙,Mis铭,赵丽娜,otf125,M id 6cbe1c39db3914adbbd5c9437b981725,LuyinT.評論(共68條)
越是多數人覺得容易理解的理論或道理,越是難以用簡陋的文字和圖表表示清楚.所以,能解釋簡單道理的人,往往都瘋掉了,原因最簡單的就是只有一個人瘋了,對大部分瑣碎都麻木了,他才能有足夠的時間,精力和註意力去接近和感受真相.
越是多數人覺得容易理解的理論或道理,越是難以用簡陋的文字和圖表表示清楚.所以,能解釋簡單道理的人,往往都瘋掉了,原因最簡單的就是只有一個人瘋了,對大部分瑣碎都麻木了,他才能有足夠的時間,精力和註意力去接近和感受真相.
你在講什麼東西?還是先把中文讀好再來寫評論吧!
NASH的理論最煩的不是2個囚徒和坦白,抵賴的運算。是N個囚徒和N種方式的概率實現,那就煩了。 只有2種當然容易理解,但有N行乘N列的MATRIX運算,那頭就大嘍。。。
納什精神出現狀況並不因為這“簡單的理論”,而是因為對數字超乎尋常的敏感~ 甚至用公式來計算很多隨機性的事件 可以這樣說吧 說不定他還能通過演算法分析計算出你在鬧市撿到100塊之後的行為
你們有沒想過 如果這2個人重覆進行多次博弈 而且多人多次進行這樣的博弈 最後會這麼樣呢 你們能得到答案嗎 能解出多人多次這樣博弈如果你想獲得最後的成功 你要用什麼樣的策略呢
有沒有人能夠告訴我 占優策略是否就一定是納什均衡呢?
不管其他人選擇什麼策略,最優選擇都是某一個固定的策略,也就是“以不變應萬變”。那麼這個固定的策略就是占優策略。如果每個參與人都有占優策略,那麼這些占優策略的組合就是占優均衡。比如囚徒困境中,“招供”就是每個參與人的占優策略,(招供,招供)就是占優均衡。
納什均衡也是各參與人策略的組合。它的要求沒有占優均衡這麼強,它只要求在這個組合中,給定其他人的選擇,這個選擇是最優的,而不要求“不管其他人怎麼選擇,我的這個選擇都是最優的”。
說白了就是:占優均衡是一種特殊的納什均衡。
囚徒困境不是納什均衡,是占優均衡。請不要誤傳。
個人覺得,條目中的囚徒困境例子,只是想表達在囚徒困境中存在著納什均衡
例子那裡有點問題.大家發現了嗎.
應該是: 1,兩個人都不招,那麼只按盜竊罪,兩個人同時最多只判一年. 2,第二方面,甲/乙招了,而對方剛好沒招,那麼招認一方輕判3個月,對方(不招一方)將被重判10年 3,雙方都招了,一起判5年
例子那裡沒說清楚前提,也說錯了服刑的時間.
個人覺得這個例子是有問題的。如果是你,你會招供麽?顯然不會,你也不會擔心你的同伙會招供。因為如果他招供的話他要做一年牢,如果他不招供的話只會做三個月,同理你也是。互相不擔心對方會招供,誰還會招供。所以我覺得作者應該把他招你不招改成他服刑三個月你服刑10年,都不招供改成服刑1年。
發現了,看的時候就覺得有問題。發表了評論才發現你已經提出來了。
有沒有看過電影《美麗心靈》 一個講述約翰納什的美麗故事 不僅為他的數學才能折服
看過,很感人~真的被約翰納什震撼了
這個說法是正道。
為什麼這麼間單的理論會搞到人瘋掉
他不是搞這個理論然後瘋了 納什自己說對數字圖形等非常的敏感使他產生了幻覺 The idea I had about supernatural beings came to me the same way that my mathematical ideas did. So I took them seriously.----A Beautiful Mind.
覺得簡單是因為在我們之前雙贏的理論就已經被提出了,如果沒有人提出的情況下你想到並證明瞭,像納什這樣,那你也是一個開拓者。
聽到NASH 這個名字一股熱情涌上來了,神秘的均衡~~ 翻譯的作者也無法理解NASH Equilibrium,所以他寫的是自己能理解的部分加工翻譯的吧。 也不要怪他,他也沒辦法.應該謝謝. 那位知道中文版 NASH Equilibrium 詳細的書? 請推薦.
原文已修正,謝謝指正哦~並添加了新的案例,希望對您有幫助哦~
有沒有看過電影《美麗心靈》 一個講述約翰納什的美麗故事 不僅為他的數學才能折服
我就是看了之後,才初次瞭解納什均衡,一段時間內瘋狂的愛數學!超贊的電影!!!!!!!!!!!
有沒有看過電影《美麗心靈》 一個講述約翰納什的美麗故事 不僅為他的數學才能折服
超贊的電影!!
囚徒困境不是納什均衡,是占優均衡。請不要誤傳。
囚徒困境就是典型的納什博弈,我現在正在學習納什博弈,囚徒困境時教科書中舉出的例子。不懂請別裝懂。
有誰能告訴我這四種的關係麽? 1.Static Nash equilibrium 2.Prisoner’s dilemma and Battle of the sexes 3.Cournot and Bertrand Duopoly 4.Mixed Strategy 好像是說後面三種是第一種的example?是這樣麽?
為什麼這麼間單的理論會搞到人瘋掉
這是個平凡而又偉大的理論,平凡因為普通,偉大是因為可以說這麼複雜。
為什麼這麼間單的理論會搞到人瘋掉
那就問問自己為什麼1+1=2有人論證了幾十年
這個理論厲害在把複雜的寫的很簡單, 並把這個理論用數字給表達出來了。 說簡單的估計你看不懂那個公式吧。 不要輕看任何被大部分世界科學家都贊同的理論。
數學不好的就別逼逼了,你能看得懂例子不代表這個理論簡單。人家只是用一個通俗的例子來說明一個數學問題,說到底,這還是個數學問題。
囚徒困境不是納什均衡,是占優均衡。請不要誤傳。
占優均衡就是強納什均衡
越是多數人覺得容易理解的理論或道理,越是難以用簡陋的文字和圖表表示清楚.所以,能解釋簡單道理的人,往往都瘋掉了,原因最簡單的就是只有一個人瘋了,對大部分瑣碎都麻木了,他才能有足夠的時間,精力和註意力去接近和感受真相.
越簡單越不容易用平常的眼光去看待
為什麼這麼間單的理論會搞到人瘋掉
簡單源於無知
為什麼這麼間單的理論會搞到人瘋掉
讀讀納什的博士論文,可能瘋掉都搞不懂。或者買本梯若爾的教材、博弈論文集再瞭解一下。
你在講什麼東西?還是先把中文讀好再來寫評論吧!
你寫的是什麼東西?還是先把漢語和中文都學好再來評論吧!
你在講什麼東西?還是先把中文讀好再來寫評論吧!
你寫的什麼東西,學好中文再來評論吧,這麼簡單的一句話都讀不懂,還指責別人
為什麼這麼間單的理論會搞到人瘋掉
你看美麗心靈電影就知道了,納什精神狀況出現問題不是因為這個理論,而是當時的時代背景。
為什麼這麼間單的理論會搞到人瘋掉