旅行者困境
出自 MBA智库百科(https://wiki.mbalib.com/)
目錄[隱藏] |
旅行者困境是一種非零和博弈,博弈雙方都為了讓自己收益最大化,而不考慮對方收益。
該博弈是1994年由考希克·巴蘇教授(Kaushik Basu)提出,博弈情形如下:
航空公司丟失了兩位互相不認識乘客的旅行包。兩個旅行包正好都是一樣的,並且裡面有相同價值的古董,兩位乘客都向航空公司索賠100美元。為了評估出古董的真實價值,公司經理將兩位乘客分開以避免兩人合謀,分別讓他們寫下古董的價值,其金額要不低於2美元,並且不高於100美元。同時還告訴兩人:如果兩個數字是一樣的,那麼會被認為是其真實價值,他們能獲得相應金額的賠償。如果數字不一樣,較小的會被認為是真實價值,而兩人在獲得這個金額的同時有相應的獎賞/懲罰:寫下較小金額的會獲得2美元額外的獎勵,較大的會有2美元的懲罰。
本來,為了獲得最大賠償,雙方最好的策略就是都寫100元,獲賠100元。但甲卻精明地認為如果寫99元而乙會寫100元,這將得到101元;可是乙卻更聰明,他算計到甲會算計他寫99元,而準備寫98元;可甲更聰明一個層次,算計到乙會寫98元而準備寫97元……如此重覆博弈下去,兩人都“徹底理性”地能看透對方十幾步甚至上百步的博弈過程,最後落到每個人都寫一、兩元。在“徹底理性”的假設下,這個博弈惟一的納什均衡就是兩人都寫0。
旅行者困境收益矩陣:
100 | 99 | 98 | 97 | ⋮ | 3 | 2 | |
100 | 100, 100 | 97, 101 | 96, 100 | 95, 99 | ⋯ | 1, 5 | 0, 4 |
99 | 101, 97 | 99, 99 | 96, 100 | 95, 99 | ⋯ | 1, 5 | 0, 4 |
98 | 100, 96 | 100, 96 | 98, 98 | 95, 99 | ⋯ | 1, 5 | 0, 4 |
97 | 99, 95 | 99, 95 | 99, 95 | 97, 97 | ⋯ | 1, 5 | 0, 4 |
⋮ | ⋮ | ⋮ | ⋮ | ⋮ | ⋮ | ⋮ | ⋮ |
3 | 5, 1 | 5, 1 | 5, 1 | 5, 1 | ⋯ | 3, 3 | 0, 4 |
2 | 4, 0 | 4, 0 | 4, 0 | 4, 0 | ⋯ | 4, 0 | 2, 2 |
如果兩位旅行者的收益變成兩個整數的選擇,比如2美元和3美元,那麼旅行者困境在數學上就等同囚徒困境,所以可以被看作是囚徒困境的延伸。該困境還和猜均值的2/3博弈相似,為了得到納什均衡,兩個博弈都涉及到了迭代去除占優策略,並且實驗結果與博弈論的預測都嚴重不相符合。
博弈論認為,如果兩個人是理性人,那麼他們會都寫2美元,這個結果是該博弈的納什均衡。然而,實驗中大多數測試者都會選擇100美元,或者接近100美元。他們也清楚自己並沒有認真思考這個情況,選擇了非理性的結果。並且,旅行者們會因為在博弈中嚴重偏離納什均衡而獲得比理性行為高很多的收益。該實驗既沒有證明大多數人都是完全理性人,也沒有證明他們如果選擇理性行為就能獲得更多收益。這個困境讓人們對博弈論產生了懷疑,與此同時,有人建議需要有一種新的解釋,來幫助理解如何來完全理性的作出非理性選擇。
有一位因車禍而住院的老大爺,想藉此機會敲詐肇事司機,於是就在醫院開了許多與車禍創傷無關的營養藥品,花了許多不該花的錢。他認為這些錢都應該由肇事司機出。結果交通隊查明瞭事故原因,老大爺承擔60%的責任,也就是說,他花的越多,自己承擔的也越多。得知這個消息後,老大爺一臉的沮喪:“早知道是這樣,我不開這營養藥啊,醫院的藥這麼貴!真是聰明反被聰明誤啊!”
評論(共5條)
真要絕對理性的話會這樣去做麽?直接就填100了吧,就和商業聯盟統一定價一個道理吧,誰也不願意虧
懲罰/獎勵的代價不夠大吧,如果懲罰/獎勵的金額從2元變到100元,理性的人(以自身利益最大化為目標)會怎麼選呢?
真要絕對理性的話會這樣去做麽?直接就填100了吧,就和商業聯盟統一定價一個道理吧,誰也不願意虧
什麼叫難得糊塗
若是絕對理性的情況之下,兩乘客都應該能意識到最終的結果,那麼還不如直接寫下99比較的好吧~