全球专业中文经管百科,由121,994位网友共同编写而成,共计436,047个条目

颤抖手精炼均衡

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

(重定向自颤抖手均衡)

颤抖手精炼均衡(trembling hand perfect equilibrium)

目录

什么是颤抖手精炼均衡

  “颤抖手精炼均衡”概念是泽尔腾提出的对纳什均衡的一个改进。颤抖手精炼均衡的基本思想是:在任何一个博弈中,每个局中人都有一定的犯错误的可能性(类似一个人用手抓东西时,手一颤抖,他就抓不住他想抓的东西)。一个策略对是一个颤抖手精炼均衡时,它必须具有如下性质:各局中人i要采用的策略,不仅在其他局中人不犯错误时是最优的,而且在其他局中人偶尔犯错误(概率很小,但大于0)时还是最优的。可以看出,颤抖手精炼均衡是一种较稳定的均衡。

  从博弈论中我们知道,泽尔腾的这种“颤抖手均衡(trembling hand equilibrium)”也是一种精炼纳什均衡。大致说来,泽尔腾(1975)假定,在博弈中存在一种数值极小但又不为0的概率,即在每个博弈者选择对他来说所有可行的一项策略时,可能会偶尔出错,这就是所谓的“颤抖之手”。因之,一个博弈者的均衡策略是在考虑到其对手可能“颤抖”(偶尔出错)的情况下对其对手策略选择所作的最好的策略回应。单从这一点来看,在演进博弈论中,最初的演进稳定性的出现,并不完全来自博弈双方的理性计算,而实际上可能是随机形成的(往往取决于博弈双方“察言观色”的一念之差)。按照这一分析思路,我们也可以认为,人们对一种习俗(演进稳定性)的偏离,也可能出自泽尔腾所说的那种人们社会博弈中的“颤抖”。

颤抖手精炼均衡的价值

  为了说明颤抖手精炼均衡的价值,我们考虑一个具有两个“委托人—代理人”对和两种自然状态的对称支付模型。设代理人1的策略有:α1(积极工作)和α2(偷懒);代理人2的策略同样有β1(积极工作)和β2(偷懒)。相应于两个代理人的策略,在自然状态s1和s2下,每个委托人收益如下:

状态s1(坏)
β1β2
α1(c1,c2)(d1,a2)
α2(a1,d2)(b1,b2)
状态s2(好)
β1β2
α1(d1,d2)(e1,b2)
α2(b1,e2)(c1,c2)

  其中,0<aj<bj<cj<dj<ej,j=1,2。这意味着当自然状态“坏”时,每个代理人都必须采用积极”的策略才可能使自己的委托人得到中等以上的收益(即不小于cj);而当自然状态“好”时,两代理人都选“偷懒”也可使各自的委托人得到cj的收益。现在设代理人j(j=1,2)在他的委托人的利润不小于cj单位时,都得到 Uj;否则所得为-M。假设代理人j选择“积极”策略时,就没有额外收益,而选择“偷懒”时,可有li>0单位的额外收益。因此,代理人的收益,可用如下标准形的二人非零和博弈给出:

状态s1(坏) 
α1β1 ( U1, U2)β2 ( U1-M)
α2(-M, U2)   (-M,-M) 
状态s2(好)
α1β1 ( U1, U2)β2 ( U1,-M)
α2(-M, U2) ( U1+l1, U2+l2)

  这样,在好的环境s2中,代理人之间的博弈有2个纳什均衡:(α1,β1)对应收益对( U1, U2)和(α2,β2)对应收益对( U1,+l1, U2+l2);而在坏的状态s1中,代理人间的博弈只有一个非合作均衡(α1,β1)对应收益对( U1, U2)。观察上述博弈,我们发现在状态s2中,(α1,β1)更加有效率(使每个委托人的收益都较大),然而两个代理人却更喜欢均衡(α2,β2),因为这个均衡使他们的效用从( U1, U2)升至( U1,+l1, U2+l2)。但是,如果这两个纳什均衡中只有(α1,β1)是颤抖手精炼均衡,代理人就可能不再偏爱均衡(α2,β2)。

颤抖手精炼均衡的举例[1]

  下面通过一个例子,分析如何应用“颤抖”对博弈的解(即Nash均衡)进行精炼。考察图1中的博弈,其中图1(b)为图1(a)中博弈的战略式描述。显然,博弈存在两个纯战略Nash均衡——(L1R2)和(R1L2)。

  Image:颤抖手精炼均衡.jpg

  首先考察均衡(L1R2)。假设参与人2选择行动R2时发生颤抖,其颤抖o_2^\varepsilon(\varepsilon,1-\varepsilon)(其中0<\varepsilon<1)。若0<\varepsilon≤1/2(即参与人2犯错误的可能性不大于1/2),则v1(L1,o_2^\varepsilon)≥v1(R1,o_2^\varepsilon)。假设参与人1选择行动L1时发生颤抖,其颤抖o_1^\varepsilon=(1一\varepsilon\varepsilon),由于R2为参与人2的占优战略,因此v2(R2o_1^\varepsilon)≥v2(L2o_1^\varepsilon)。所以,(L1R2)为颤抖手精炼均衡。同理可以证明(R1L2)不是颤抖手精炼均衡。所以,对于图1(b)所示的战略式博弈,合理的均衡为(L1R2),这与图1(a)中“博弈的合理均衡为(L1R2)”的结论相一致。

参考文献

  1. 罗云峰主编.博弈论教程.清华大学出版社,2007.9.
本条目对我有帮助24
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目投诉举报

本条目由以下用户参与贡献

Lolo,山林,001,Zfj3000,Yixi,KAER,jane409,Dan.

评论(共5条)

提示:评论内容为网友针对条目"颤抖手精炼均衡"展开的讨论,与本站观点立场无关。
李川 (Talk | 贡献) 在 2011年10月13日 21:34 发表

记得看过一个严格的定义: 在n人策略表达式的博弈G={S1,S2,...,Sn;u1,u2,...,u3}中我们说纳什均衡(p1,p2,...,pn)构成一个颤抖手精炼均衡,如果对于每个局中人i,存在一个严格混合策略序列{p(im)},满足下列条件: (1)对于每个i,lim(m→∞)p(im)=pi (2)对于每个i和每个m=1,2,...,pi是对策略组合{p(m1),...,p(m i-1),p(m i+1),...,p(m n)的最优反应,即pi∈arg max ui=(●,p(m,-i))

回复评论
119.123.142.* 在 2012年1月31日 12:58 发表

这其实就是赛马的那个原理,用上等马对对方的中等马,中等马对对方的下等马,下等马对对方的上等马,三局两胜

回复评论
1.85.36.* 在 2012年7月24日 19:04 发表

表示那张表格么看懂,那两个自然状态时什么意思。不是已经有积极和懒惰了?

回复评论
144.32.71.* 在 2013年1月29日 02:17 发表

说实话 例子我没看懂 有没有简单一点的例子啊?单纯数字的?

回复评论
219.98.178.* 在 2015年6月27日 22:40 发表

119.123.142.* 在 2012年1月31日 12:58 发表

这其实就是赛马的那个原理,用上等马对对方的中等马,中等马对对方的下等马,下等马对对方的上等马,三局两胜

没看懂不要瞎说误导别人。。。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

打开APP

以上内容根据网友推荐自动排序生成

官方社群
下载APP

闽公网安备 35020302032707号