子博弈精煉納什均衡

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

完全信息動態博弈——子博弈精煉納什均衡（subgame perfect Nash equilibrium）

子博弈精煉納什均衡概述

　　子博弈精煉納什均衡的創立者. ——1994年諾貝爾經濟學獎獲獎者、萊茵哈德·澤爾騰(Reinhard Selten).

　　澤爾騰則在60年代中期將納什均衡概念引入動態分析。在1965年發表《需求減少條件下寡頭壟斷模型的對策論描述》一文，提出了“子博弈精煉納什均衡”的概念，又稱“子對策完美納什均衡”。這一研究對納什均衡進行了第一次改進，選擇了更具說服力的均衡點。海薩尼在60年代末把不完全信息引入博弈分析。

　　將納什均衡中包含的不可置信的威脅策略剔除出去。它要求參與者的決策在任何時點上都是最優的，決策者要“隨機應變”，“向前看”，而不是固守舊略。

　　由於剔除了不可置信的威脅，在許多情況下，精煉納什均衡也就縮小了納什均衡的個數。這一點對預測分析是非常有意義的。

　　用動態博弈理論來討論實際究竟發生哪個納什均衡。

　　給定“歷史”，每一個行動選擇開始至博弈結束構成了一個博弈，稱為“子博弈”。

　　只有當參與人的策略在每一個子博弈中都構成納什均衡叫做精煉納什均衡。或者說，組成精煉納什均衡的策略必須在每一個子博弈中都是最優的。

[編輯]

子博弈精煉納什均衡的定義

　　子博弈:一個擴展式表示博弈的子博弈G是由一個單結信息集x開始的與所有該決策結的後續結(包括終點結)組成的能自成一個博弈的原博弈的一部分。

　　對於擴展式博弈的策略組合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的納什均衡;它在每一個子博弈上也都構成納什均衡,則它是一個子博弈精煉納什均衡。

　　博弈論專家常常使用“序慣理性”(Sequential rationality)：指不論過去發生了什麼，參與人應該在博弈的每個時點上最優化自己的策略。子博弈精練納什均衡所要求的正是參與人應該是序慣理性的。對於有限完美信息博弈，逆向歸納法是求解子博弈精煉納什均衡的最簡便的方法。因為有限完美信息博弈的每一個決策結都開始一個子博弈。求解方法：　最後一個結點上的子博弈（納什均衡）→倒數第二個（納什均衡） → ······ → 初始結點上的子博弈（納什均衡）。

[編輯]

完全信息動態博弈

　　動態是世間萬物的基本特征。完全信息靜態博弈只是一種獨特的理想狀態。在現實中，當後一個參與人行動時，自然會根據前者的選擇而調整自己的選擇，而前者也會理性地預期到這一點，所以不可能不考慮自己的選擇對他人的影響。1965年，澤爾騰通過對動態博弈的分析，提出了“子博弈精煉納什均衡”的概念，它要求任何參與人在任何時間、地點的決策都是最優的，決策者應該隨機應變，而不是固守前謀。這就推導出子博弈的概念。當參與人的戰略在每一個子博弈中都構成納什均衡時，則形成“子博弈精煉納什均衡”。也就是說，組成“子博弈精煉納什均衡”的戰略必須在每一個子博弈中都是最優的。

[編輯]

動態博弈的納什均衡的意義

　　子博弈精煉納什均衡用於區分動態博弈中的"合理納什均衡"與"不合理納什均衡",將納什均衡中包含有不可置信威脅策略的均衡剔除出去,就是說,使最後的均衡中不再包含有不可置信威脅策略的存在。

[編輯]

子博弈精煉納什均衡求法——逆向歸納法求解

　　逆向歸納法（Backward Induction）是求解子博弈精煉納什均衡的最簡便方法。在求解子博弈精煉納什均衡時,從最後一個子博弈開始逆推上去,這就是逆向歸納法。所以逆向歸納法就是從動態博弈的最後一個階段或最後一個子博弈開始,逐步向前倒推以求解動態博弈均衡的方法。

　　用逆向歸納法求解子博弈精煉納什均衡；承諾行動與子博弈精煉納什均衡；逆向歸納法與子博弈精煉均衡存在的問題。

[編輯]

子博弈精練納什均衡的應用舉例

　　在表1描述的博弈模型中，每一次微觀主體間的博弈均可看作一個子博弈。子博弈精煉納什均衡包含兩層含義:

　　（1）它是原博弈的納什均衡；

　　（2）它在每一個子博弈上給出納什均衡。

　　子博弈精煉納什均衡就是要剔除那些只在特定情況下是合理的，而在其他情況下並不合理的行動規則。

　　表１　微觀主體間的博弈

　　在表1中，a代表只有一個微觀主體創新時所帶來的收益，c代表該微觀主體創新所需付出的成本。當只有一個微觀主體進行創新時將會獲得創新帶來的全部收益（a-c），而當兩個主體同時創新時，收益將會減半(a-c)/2。一般情況下“a-c>0”，則很明顯在這個博弈過程中，（創新，創新）是一個納什均衡，更嚴格地說，是一個嚴格優勢策略均衡。依此類推，可以得出，在每一次新的金融規制後，（創新，創新）這個策略都將是至下次新規制出現前的子博弈的納什均衡。因此，在利潤的驅動下，微觀主體都會選擇創新這樣一個策略。

　　舉例的進一步分析

　　在市場進入博弈中，在給定企業B已經進入的情況下，在位者的“鬥爭”，“高價”策略已不再是最優的，這種“鬥爭”是不可置信的威脅，因為鬥爭的結果是沒有利潤；而合作會帶來50單位利潤。所以，（進入，高價）不是一個精煉納什均衡。剔除這個均衡，可以證明，（進入，高價）是唯一的子博弈精煉納什均衡。

　　在動態博弈中，參與人的行動有先後順序，後行動的參與人在自己行動之前就可以觀察到先行動者（參與人）的行為，併在此基礎上選擇相應的策略。而且，由於先行動者擁有後行動者可能選擇策略的完全信息，因而先行動者在選擇自己的策略時，就可以預先考慮自己的選擇對後行動者選擇的影響，並採取相應的對策。

　　利用房地產開發的例子，討論子博弈精煉納什均衡。表２給出了靜態條件下雙方參與人的收益情況。

　　表2　房地產開發博弈（靜態）的收收益矩陣

　　從表２可以知道，該博弈有兩個納什均衡，即（Ａ開發，Ｂ不開發）和（Ａ不開發，Ｂ開發），我們無法確定是開發商Ａ選擇開發，開發商Ｂ選擇不開發，還是恰恰相反的結果。

　　現在，我們討論動態博弈。假定房地產開發商Ａ是先行動者。在行動之前，開發商Ａ對對手開發商Ｂ的策略進行了預測。在行動開始之前的Ａ看來，如果不計得失，Ｂ有四種策略可供選擇：

　　策略一：無論Ａ是否選擇開發，Ｂ選擇開發。

　　策略二：若Ａ選擇開發，Ｂ也選擇開發；若Ａ選擇不開發，Ｂ也選擇不開發。

　　策略三：若Ａ選擇開發，Ｂ就選擇不開發；若Ａ選擇不開發，Ｂ就選擇開發。

　　策略四：無論Ａ是否選擇開發，Ｂ都選擇不開發。

　　在表２的基礎上，結合Ａ先行動，Ｂ可能選擇的四種策略，不難得出表3。

　　表3　　先行動者Ａ對Ｂ預測結果的收益矩陣

　　由表3可以看出，在開發商Ａ先行動的情況下，開發商Ｂ可供選擇的策略中，策略一隻包括了上述兩個納什均衡中的後一種均衡，即（Ａ不開發，Ｂ開發），而沒有包括前一種納什均衡，即（Ａ開發，Ｂ不開發）；策略二上述兩種納什均衡都沒有包括；策略四隻包括了上述兩種納什均衡中的前一種均衡，即（Ａ開發，Ｂ不開發），而未包括後一種納什均衡，即（Ａ不開發，Ｂ開發）；只有策略三既包括了上述兩種納什均衡中的前一種均衡，又包括了後一種均衡。也就是說，如果Ｂ選擇策略三，那麼，無論Ａ作出什麼選擇，Ｂ的回應都能達到納什均衡。反過來，在給定Ｂ會選擇策略三來回應Ａ的選擇的前提下，開發是Ａ的占優選擇。因此，Ａ一定會選擇開發

[編輯]

本条目由以下用户参与贡献

Amy,Angle Roh,Annie,Lolo,Zfj3000,Cabbage,Dan,黄云坤,185****3890,LuyinT.

頁面分類: 博弈論

評論(共13條)

提示:評論內容為網友針對條目"子博弈精煉納什均衡"展開的討論，與本站觀點立場無關。

121.15.167.* 在 2009年2月20日 16:03 發表

如何理解元博弈（meta-game）與普通博弈之間的區別？試用你生活或工作中的實際例子或者熟悉的例子來說明什麼是元博弈。

回複評論

31648077 (討論 | 貢獻) 在 2009年12月22日 10:37 發表

對博弈論的理解還是提留在納什均衡上面，能否將博弈論相關的理論都能舉一個好像囚徒困境的例子來說明一下

回複評論

222.88.196.* 在 2011年6月12日 10:28 發表

寫的很好，謝謝！

回複評論

117.32.153.* 在 2011年6月14日 14:24 發表

good

回複評論

F128102 (討論 | 貢獻) 在 2011年12月2日 00:20 發表

為何不用樹枝圖?

回複評論

徐冰 (討論 | 貢獻) 在 2011年12月10日 02:39 發表

動態博弈中，能不能說明每一個格子對應的策略案例2房地產開發的案例表達不清

回複評論

Yixi (討論 | 貢獻) 在 2011年12月10日 11:40 發表

徐冰 (討論 | 貢獻) 在 2011年12月10日 02:39 發表

動態博弈中，能不能說明每一個格子對應的策略案例2房地產開發的案例表達不清

原文提到：策略一：無論Ａ是否選擇開發，Ｂ選擇開發。策略二：若Ａ選擇開發，Ｂ也選擇開發；若Ａ選擇不開發，Ｂ也選擇不開發。策略三：若Ａ選擇開發，Ｂ就選擇不開發；若Ａ選擇不開發，Ｂ就選擇開發。策略四：無論Ａ是否選擇開發，Ｂ都選擇不開發。在表２的基礎上，結合Ａ先行動，Ｂ可能選擇的四種策略，不難得出表3。希望對您有幫助哦！

回複評論

221.193.66.* 在 2012年1月7日 14:21 發表

似乎有問題，動態是世界萬物的基本特征？物理上沒這樣的話，運動是相對的！

回複評論

孙洋 (討論 | 貢獻) 在 2012年5月12日 07:19 發表

靜止才是相對的吧

回複評論

59.41.175.* 在 2012年9月14日 16:27 發表

表3　　先行動者Ａ對Ｂ預測結果的收益矩陣

表格內內容似乎表達有誤，望求證

回複評論

222.178.10.* 在 2012年11月18日 22:15 發表

擴展式博弈

回複評論

222.178.10.* 在 2012年11月18日 22:16 發表

一些基礎的理論知識，呵呵

回複評論

120.236.174.* 在 2016年1月3日 21:06 發表

我想知道表三的B的行動策略怎麼看。看不懂收益矩陣

回複評論

發表評論請文明上網，理性發言並遵守有關規定。

查看

工具▼

子博弈精煉納什均衡

出自 MBA智库百科(https://wiki.mbalib.com/)

目錄

子博弈精煉納什均衡概述

子博弈精煉納什均衡的定義

完全信息動態博弈

動態博弈的納什均衡的意義

子博弈精煉納什均衡求法——逆向歸納法求解

子博弈精練納什均衡的應用舉例

相關條目

温馨提示

本条目相关课程

本条目由以下用户参与贡献

評論(共13條)

導航

意见反馈

查看

工具▼

子博弈精煉納什均衡

出自 MBA智库百科(https://wiki.mbalib.com/)

目錄

子博弈精煉納什均衡概述

子博弈精煉納什均衡的定義

完全信息動態博弈

動態博弈的納什均衡的意義

子博弈精煉納什均衡求法——逆向歸納法求解

子博弈精練納什均衡的應用舉例

相關條目

温馨提示

本條目相關文檔

本条目相关课程

本条目由以下用户参与贡献

評論(共13條)

導航

意见反馈