最大最小策略
出自 MBA智库百科(https://wiki.mbalib.com/)
最大最小策略(Maximin strategy),也稱最小最大化策略(Minmax Strategy)、極大最小化策略、保留策略
目錄 |
需要強調說明的是,優勢策略均衡與納什均衡的概念是建立在博弈者理性行為的基礎上的。每一個博弈者的策略選擇不僅依賴於自己的理性行為,也依賴於對手的理性行為。即,不僅每個博弈者自己是理性的,而且每個博弈者知道對手是理性的,每個博弈者知道對手知道自己是理性的,每個博弈者知道對手知道自己知道對手是理性的,……等等。
正是因為要達到優勢策略均衡或納什均衡是需要絕對理性的。任何出現了一點錯誤將可能使博弈者蒙受巨大的損失,因而可能有player會採取比較保守的策略。
其中一種保守的策略是最大最小策略(Maximin strategy)。
最大最小策略是什麼呢?它是指博弈者所採取的策略是使自己能夠獲得的最小收入最大化。所謂最小收入是指採取某一種策略所能獲得的最小收入。
最大最小策略是一種保守的策略而不是利潤最大化的策略。
很顯然,博弈者往往是在信息不完全的情況下才採取最大最小策略。在信息完全的情形下,他肯定是會採取促使他利潤最大化的策略。
在某些情況下,最大最小策略所達到的均衡也是一種納什均衡。
納什均衡是建立在參與者理性行為基礎上的,這就使參與者的決策時面臨可能出現某些非理性行為的風險。為了降低風險,決策者可以採取最大最小策略以便降低風險,即在各種策略的最小收益中,選擇具有最大收益的策略。其代價是放棄最優策略。
下圖是一個產品開發博弈的收益矩陣。其中,按照理性行為會有兩種納什均衡,(無新產品,有新產品)以及(有新產品,無新產品)。但如果採取最大最小策略,兩個企業都不推出新產品。
在有些情況下,為了避免陷入被動,採取最大最小策略十分必要。在下圖的博弈中,乙方採取“右”是一個支配性策略。因為不管甲方選什麼,乙方採取右的策略都比左的策略好,可以得到1的收益。在期望乙方採取右的情況下,甲方應該採取“下”,並得到2的收益。這樣,支配性策略均衡為(下,右)。 如果甲方比較慎重,考慮到乙方可能不一定理性,或者可能故意捉弄甲方,則應該採取最大最小策略,形成(上,右)的博弈結果。
最大最小策略的舉例[1]
在實際生活中,往往還會遇到非常糟糕的情況,如何選擇,做到最大化可能遭遇到的最小的利益,也是傷透腦筋的事情。有時個體的理智不一定會帶來理想的結局,甚至可能是最壞的結果。
例如,其中的囚徒困境(Prisoners Dilemma)值得我們深思。用表1來解釋。從表中可知,對兩囚徒而言最好的結果應該是都不坦白,入獄年數是最短的,可這裡雙方都存在一個非常穩定的占優策略――坦白,因為坦白可以避免自己陷入最糟糕境地,不論對方採取何態度自己坦白都是最好的,但結果卻對於雙方來說都及其糟糕。其實,這就是一種最大最小策略。這種情況下,個人理性與團隊理性顯然存在激烈的衝突。
囚徒乙 | |||
坦白 | 不坦白 | ||
囚徒甲 | 坦白 | -6,-6 | 0,-10 |
不坦白 | -10,0 | -1,-1 |
廠商乙 | |||
合作 | 不合作 | ||
廠商甲 | 合作 | 200,200 | 120,240 |
不合作 | 240,120 | 160,160 |
囚徒困境同樣適於分析寡頭壟斷廠商合作的不穩定性。見表2。分析表中數據,整體而言最理性的做法是(合作,合作)。於是,諸如OPEC等組織會聯手以期達到利潤最大化。但同時,另外有種激勵,若自己悄悄毀約、不遵守協議自己的獲利會高於合作下的獲利。於是(不合作,不合作)的策略組合排擠掉了(合作,合作)的策略組合,並且由於(不合作,不合作)組合還是一個占優策略均衡,所以,卡特爾經常以失敗告終也就屬情理之中了。還有一種最大最小策略的應用,見表3:
廠商乙 | |||
A | B | ||
廠商甲 | C | 100,50 | 100,100 |
D | -50000,50 | 200,100 |
- ↑ 《微觀經濟學》第七章 壟斷博弈原理,第三節 博弈論在壟斷市場中的初步運用,上海師範大學商學院課件
多謝分享