優勢策略均衡
出自 MBA智库百科(https://wiki.mbalib.com/)
優勢策略均衡(Dominant strategy equilibrium)
目錄 |
優勢策略均衡也稱占優策略均衡,是指不管其他人採取什麼策略,每個博弈者都會找到對自己最有利的策略所構成的一個策略組合。
優勢策略均衡的實質是:不管其他參與者如何行動,每個參與者都有一個對自己來說最好的策略;而在納什均衡中,需給定其他參與者的行動,每個參與者才可以選擇一個對自己來說是最好的策略。因此,納什均衡的核心思想是“換位思考”。
優勢策略均衡和納什均衡的區別在於:在優勢策略均衡中,我所做的是不管你做什麼,我所能做的是最好的;在納什均衡中,我所做的是給定你所做的前提下,我所能做的是最好的,你所做的是在給定我所做的前提下你所能做的是最好的,從二者的關係可以看出,優勢策略均衡是納什均衡的一個特例,一個優勢策略均衡首先是一個納什均衡.
優勢策略均衡實例分析[1]
假定有甲乙兩個作案的嫌疑犯分別被審訊。如兩人都坦白,各判3年,兩人都抵賴,各判1年,1人坦白1人抵賴,抵賴者判6年,坦白者釋放。這些結果可寫成一個矩陣:
在上表中,每個囚犯都有兩種戰略:坦白或抵賴。表中每一格的兩個數字代表對應戰略組合下兩個囚犯的結局,第一個數字屬甲,第二個數字屬乙。顯然,在此例中,納什均衡是(坦白,坦白)。這是因為,不管乙是坦白還是不坦白,甲的最好戰略都是坦白;同樣,不管甲坦白不坦白,乙最好的戰略也是坦白。結果,兩人都選擇坦白,各判3年。這樣的結局,稱為優勢策略均衡。
博弈者都會找到對自己最有利的策略所構成的一個策略組合。通過這個例子,我們也可說明博弈論中幾個基本概念:(1)參與人或局中人,這裡就是囚犯甲和囚犯乙,他們是博弈當事人,總要選擇最佳策略以實現自己效用或收益最大化;(2)策略集合,指參與人可能採取的全部策略,如例子中的坦白和抵賴兩種策略;(3)收益或支付,指參與人採取一定策略後會得到的報酬,它是參與人採取的策略的函數,如甲坦白而乙抵賴時,甲收益為0,而乙為—6;(4)均衡,指所有參與人最優策略的組合,如例子中的(甲坦白,乙坦白)就是一種均衡,並且是一個優勢策略均衡。需要指出的是,優勢策略均衡一定是納什均衡,但納什均衡不一定是優勢策略均衡。
- ↑ 尹伯成.西方經濟學簡明教程(第四版)[M].上海人民出版社,2003年07月第1版.
可以舉個納什均衡不是優勢策略均衡的例子嗎