MBA智庫百科:智庫前沿/囚徒困境

出自 MBA智库百科(https://wiki.mbalib.com/)

　　囚徒困境——非零和博弈中具代表性的例子

　　囚徒困境是博弈論的非零和博弈中具代表性的例子，反映個人最佳選擇並非團體最佳選擇。雖然困境本身只屬模型性質，但現實中的價格競爭、環境保護等方面，也會頻繁出現類似情況。

　　囚徒困境最早是由美國普林斯頓大學數學家阿爾伯特·塔克（Albert tucker）1950年提出來的。他當時編了一個故事向斯坦福大學的一群心理學家們解釋什麼是博弈論，這個故事後來成為博弈論中最著名的案例。故事內容是：兩個嫌疑犯(A和B)作案後被警察抓住，隔離審訊；警方的政策是“坦白從寬，抗拒從嚴”，如果兩人都坦白則各判8 年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判10年；如果都不坦白則因證據不足各判1年。

　　單次發生的囚徒困境，和多次重覆的囚徒困境結果不會一樣。在重覆的囚徒困境中，博弈被反覆地進行。因而每個參與者都有機會去“懲罰”另一個參與者前一回合的不合作行為。這時，合作可能會作為均衡的結果出現。欺騙的動機這時可能被受到懲罰的威脅所剋服，從而可能導向一個較好的、合作的結果。作為反覆接近無限的數量，納什均衡趨向於帕累托最優。

　　囚徒困境的主旨為，囚徒們雖然彼此合作，堅不吐實，可為全體帶來最佳利益（無罪開釋），但在資訊不明的情況下，因為出賣同伙可為自己帶來利益（縮短刑期），也因為同伙把自己招出來可為他帶來利益，因此彼此出賣雖違反最佳共同利益，反而是自己最大利益所在。但實際上，執法機構不可能設立如此情境來誘使所有囚徒招供，因為囚徒們必須考慮刑期以外之因素（出賣同伙會受到報複等），而無法完全以執法者所設立之利益（刑期）作考量。...[詳細]

取自"https://wiki.mbalib.com/zh-tw/MBA%E6%99%BA%E5%BA%93%E7%99%BE%E7%A7%91:%E6%99%BA%E5%BA%93%E5%89%8D%E6%B2%BF/%E5%9B%9A%E5%BE%92%E5%9B%B0%E5%A2%83"

查看

工具▼

MBA智庫百科:智庫前沿/囚徒困境

出自 MBA智库百科(https://wiki.mbalib.com/)

導航

意见反馈