夏普利值
出自 MBA智库百科(https://wiki.mbalib.com/)
夏普利值(Shapley value)
目錄 |
夏普利值指所得與自己的貢獻相等,是一種分配方式。由美國洛杉磯加州大學教授羅伊德·夏普利(Lloyd Shapley)提出。夏普利值的提出給合作博弈在理論上的重要突破及其以後的發展帶來了重大影響。
合作博弈在理論上的重要突破及其以後的發展在很大程度起源於夏普利(Shapley, 1953)提出的夏普利值的解的概念及其公理化刻畫。夏普利首先對主觀的、公平、合理等概念給予了嚴格的公理化描述,然後尋求是否有滿足人們想要的那些公理的解。當然,如果對一個解的性質或公理要求太多,則這樣的解可能不存在;另一方面,如果這些性質或公理要求得少,則又可能有許多解,即解存在但不唯一。夏普利值是一個滿足三個顯而易見的公平性質的唯一解。
考慮這樣一個聯盟博弈。有這樣一個三人財產分配問題。假定財產為100萬元,假定這100萬元在三個人之間進行分配。A擁有50%的票力,b擁有40%的票力,c擁有10%的票力。規則規定,當超過50%的票認可了某種方案時,才能獲得整個財產,否則三人將一無所獲。
我們看到,任何單獨一個人的票力都不超過50%,從而不能單獨決定財產的分配。要超過50%的票力必須要形成聯盟。也就是說,在這個例子中任何人的權利都不是“決定性的”,也沒有一個人是“無權利的”或權利為0.
此時財產應當按票力分配嗎?如果是的話,即a、b、c的財產分配為:50%,40%,10%。但如果這樣分配的話,c可以提出這樣的方案,a:70%,b:0,c:30%。這個方案能被a、c接受,因為對a、c來說這是一個比按票力分配有明顯改進的方案,儘管b被排除出去,但是a、c的票力構成大多數(60%)。
在這樣的情況下,b會向a提出這樣一個方案,a:80%,b20%,c:0。此時a和b所得均比剛纔c提出的方案要好,但c成了一無所有,但a、b票力綜合構成多數(90%)……這樣的過程可以一直進行下去。
在這個過程中,理性的人會形成聯盟ab、ac或abc。但哪個聯盟能夠形成呢?最終的分配結果應該是怎樣的呢?
夏普里提出了一種計算權利的度量。他給出了一個衡量博弈方先驗實力的方法,根據他的理論求的的聯盟者的先驗實力被稱之為夏普里值。
夏普里,一個在二戰中同中國人並肩與日本侵略者作戰的老兵,對中國人民懷有深厚的感情。二戰結束後,他回到美國接受高等教育,並從事數學研究。他於1955年提出的夏普里值隨著合作博弈在博弈論中的地位的提升而日顯重要。
夏普里值是這樣的一個值:在各種可能的聯盟次序下,參與者對聯盟的邊際貢獻之和除以各種可能的聯盟組合。
在財產分配問題上,我們可以寫出各種可能的聯盟順序。而邊際貢獻就在於在這個順序中誰是這個聯盟的“關鍵加入者”。如果是關鍵加入者,那麼他的邊際貢獻就為100萬元。
下表:財產問題中各種排列下的關鍵加入者
次序 | abc | acb | bac | bca | cab | cba |
關鍵加入者 | b | c | a | a | a | a |
由上表,我們得到abc的夏普里值分別為:
A=4/6,b=1/6,c=1/6
夏普里值是先驗實力的一種度量,我們可以根據夏普里值來劃分財產。按照夏普里值我們可以將財產分給a:2/3,b:1/6,c:1/6,單位為百萬元根據夏普里值定義,所有排列的順序是等可能的。而在每一個排列下,每個參與者對這個排列的聯盟有一個邊際貢獻。這樣,夏普里值所反映的是參與者在各種可能下的“影響程式”。在投票博弈中,這個值反映的是參與者與其他參與者結成聯盟的可能性,因此夏普里值反映的是參與者的“權力”。
從這個例子可以看到,票力是虛假的實力表示。b、c票里不同,但是夏普里值相同,即權利相同,他們在形成獲勝聯盟中作為關鍵加入者的課程性是一樣的。
參與者的真正實力體現在他與其他參與者形成獲勝聯盟的可能程度,一個參與者能形成獲勝聯盟可能性大——夏普里值大,同時意味著,一旦他退出,本來能獲勝的聯盟就歸於失敗。這也表明,該參與者的影響程度大。
在財產分配問題上,任何獲勝的聯盟必須有a加入,一旦a不同意某種分配方案,該種方案將歸於無效;但b或c不是必須的。因此a的權利比b、c要大。因此,夏普里值是參與者的權力的一個度量。