汇率换算：

美元(USD)

美元(USD)
加元(CAD)
日元(JPY)
英镑(GBP)
欧元(EUR)
澳元(AUD)
新台币(TWD)
港元(HKD)
新加坡(SGD)
菲律宾(PHP)
泰铢(THB)

按当月汇率换算，

包含手续费

颤抖手精炼均衡

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

(重定向自颤抖手均衡)

颤抖手精炼均衡（trembling hand perfect equilibrium）

什么是颤抖手精炼均衡

　　“颤抖手精炼均衡”概念是泽尔腾提出的对纳什均衡的一个改进。颤抖手精炼均衡的基本思想是:在任何一个博弈中，每个局中人都有一定的犯错误的可能性(类似一个人用手抓东西时，手一颤抖，他就抓不住他想抓的东西)。一个策略对是一个颤抖手精炼均衡时，它必须具有如下性质:各局中人ｉ要采用的策略，不仅在其他局中人不犯错误时是最优的，而且在其他局中人偶尔犯错误(概率很小，但大于0)时还是最优的。可以看出，颤抖手精炼均衡是一种较稳定的均衡。

　　从博弈论中我们知道，泽尔腾的这种“颤抖手均衡(trembling hand equilibrium)”也是一种精炼纳什均衡。大致说来，泽尔腾(1975)假定，在博弈中存在一种数值极小但又不为0的概率，即在每个博弈者选择对他来说所有可行的一项策略时，可能会偶尔出错，这就是所谓的“颤抖之手”。因之，一个博弈者的均衡策略是在考虑到其对手可能“颤抖”(偶尔出错)的情况下对其对手策略选择所作的最好的策略回应。单从这一点来看，在演进博弈论中，最初的演进稳定性的出现，并不完全来自博弈双方的理性计算，而实际上可能是随机形成的(往往取决于博弈双方“察言观色”的一念之差)。按照这一分析思路，我们也可以认为，人们对一种习俗(演进稳定性)的偏离，也可能出自泽尔腾所说的那种人们社会博弈中的“颤抖”。

[编辑]

颤抖手精炼均衡的价值

　　为了说明颤抖手精炼均衡的价值，我们考虑一个具有两个“委托人—代理人”对和两种自然状态的对称支付模型。设代理人1的策略有:α1(积极工作)和α2(偷懒)；代理人2的策略同样有β1(积极工作)和β2(偷懒)。相应于两个代理人的策略，在自然状态ｓ1和ｓ2下，每个委托人的收益如下:

状态ｓ1(坏)
β1	β2
α1(ｃ1,ｃ2)	(ｄ1,ａ2)
α2(ａ1,ｄ2)	(ｂ1,ｂ2)

状态ｓ2(好)
β1	β2
α1(ｄ1,ｄ2)	(ｅ1,ｂ2)
α2(ｂ1,ｅ2)	(ｃ1,ｃ2)

　　其中,0<ａｊ<ｂｊ<ｃｊ<ｄｊ<ｅｊ,ｊ=1,2。这意味着当自然状态“坏”时，每个代理人都必须采用积极”的策略才可能使自己的委托人得到中等以上的收益(即不小于ｃｊ)；而当自然状态“好”时，两代理人都选“偷懒”也可使各自的委托人得到ｃｊ的收益。现在设代理人ｊ(ｊ=1,2)在他的委托人的利润不小于ｃｊ单位时，都得到 Uｊ；否则所得为-M。假设代理人ｊ选择“积极”策略时，就没有额外收益,而选择“偷懒”时，可有ｌｉ>0单位的额外收益。因此，代理人的收益，可用如下标准形的二人非零和博弈给出:

状态ｓ1(坏)
α1	β1　( U1, U2)	β2　( U1-M)
α2	(-M, U2)	(-M,-M)

状态ｓ2(好)
α1	β1　( U1, U2)	β2　( U1,-M)
α2	(-M, U2)	( U1+ｌ1, U2+ｌ2)

　　这样，在好的环境ｓ2中，代理人之间的博弈有2个纳什均衡:(α1,β1)对应收益对( U1, U2)和(α2,β2)对应收益对( U1,+ｌ1, U2+ｌ2)；而在坏的状态ｓ1中，代理人间的博弈只有一个非合作均衡(α1,β1)对应收益对( U1, U2)。观察上述博弈，我们发现在状态ｓ2中，(α1,β1)更加有效率(使每个委托人的收益都较大)，然而两个代理人却更喜欢均衡(α2,β2)，因为这个均衡使他们的效用从( U1, U2)升至( U1,+ｌ1, U2+ｌ2)。但是,如果这两个纳什均衡中只有(α1,β1)是颤抖手精炼均衡，代理人就可能不再偏爱均衡(α2,β2)。

[编辑]

颤抖手精炼均衡的举例^[1]

　　下面通过一个例子，分析如何应用“颤抖”对博弈的解(即Nash均衡)进行精炼。考察图1中的博弈，其中图1(b)为图1(a)中博弈的战略式描述。显然，博弈存在两个纯战略Nash均衡——( $L 1$ ， $R 2$ )和( $R 1$ ， $L 2$ )。

　　首先考察均衡( $L 1$ ， $R 2$ )。假设参与人2选择行动 $R 2$ 时发生颤抖，其颤抖 $o_2^\varepsilon$ ( $\varepsilon$ ，1- $\varepsilon$ )(其中0< $\varepsilon$ <1)。若0< $\varepsilon$ ≤1／2(即参与人2犯错误的可能性不大于1／2)，则 $v 1$ ( $L 1$ , $o_2^\varepsilon$ )≥ $v 1$ ( $R 1$ , $o_2^\varepsilon$ )。假设参与人1选择行动 $L 1$ 时发生颤抖，其颤抖 $o_1^\varepsilon$ =(1一 $\varepsilon$ ， $\varepsilon$ )，由于 $R 2$ 为参与人2的占优战略，因此 $v 2$ ( $R 2$ ， $o_1^\varepsilon$ )≥ $v 2$ ( $L 2$ ， $o_1^\varepsilon$ )。所以，( $L 1$ ， $R 2$ )为颤抖手精炼均衡。同理可以证明( $R 1$ ， $L 2$ )不是颤抖手精炼均衡。所以，对于图1(b)所示的战略式博弈，合理的均衡为( $L 1$ ， $R 2$ )，这与图1(a)中“博弈的合理均衡为( $L 1$ ， $R 2$ )”的结论相一致。

[编辑]

参考文献

↑ 罗云峰主编.博弈论教程.清华大学出版社,2007.9.

来自"https://wiki.mbalib.com/wiki/%E9%A2%A4%E6%8A%96%E6%89%8B%E7%B2%BE%E7%82%BC%E5%9D%87%E8%A1%A1"

打开MBA智库App, 阅读完整内容打开App

如果您认为本条目还有待完善，需要补充新内容或修改错误内容，请编辑条目或投诉举报。

本条目相关课程

财务经理微课堂，8小时打造卓越财务经理

张雪梅

¥559

造价争议解决之道·108个实战案例揭示高端造价业务的精髓

张雷

¥299

本条目由以下用户参与贡献

Lolo,山林,001,Zfj3000,Yixi,KAER,jane409,Dan.

页面分类: 博弈论

评论(共5条)

提示:评论内容为网友针对条目"颤抖手精炼均衡"展开的讨论，与本站观点立场无关。

李川 (Talk | 贡献) 在 2011年10月13日 21:34 发表

记得看过一个严格的定义：在n人策略表达式的博弈G={S1，S2，...,Sn；u1,u2,...,u3}中我们说纳什均衡（p1,p2,...,pn）构成一个颤抖手精炼均衡，如果对于每个局中人i，存在一个严格混合策略序列{p(im)},满足下列条件：（1）对于每个i，lim(m→∞)p(im)=pi （2）对于每个i和每个m=1,2，...，pi是对策略组合{p(m1),...,p(m i-1),p(m i+1)，...，p(m n)的最优反应，即pi∈arg max ui=(●,p(m,-i))

回复评论

119.123.142.* 在 2012年1月31日 12:58 发表

这其实就是赛马的那个原理，用上等马对对方的中等马，中等马对对方的下等马，下等马对对方的上等马，三局两胜

回复评论

1.85.36.* 在 2012年7月24日 19:04 发表

表示那张表格么看懂，那两个自然状态时什么意思。不是已经有积极和懒惰了？

回复评论

144.32.71.* 在 2013年1月29日 02:17 发表

说实话例子我没看懂有没有简单一点的例子啊？单纯数字的？

回复评论

219.98.178.* 在 2015年6月27日 22:40 发表

119.123.142.* 在 2012年1月31日 12:58 发表

这其实就是赛马的那个原理，用上等马对对方的中等马，中等马对对方的下等马，下等马对对方的上等马，三局两胜

没看懂不要瞎说误导别人。。。

回复评论

发表评论请文明上网，理性发言并遵守有关规定。

支付成功

查看

工具箱▼

颤抖手精炼均衡

出自 MBA智库百科(https://wiki.mbalib.com/)

目录

什么是颤抖手精炼均衡

颤抖手精炼均衡的价值

颤抖手精炼均衡的举例^[1]

参考文献

温馨提示

本条目相关课程

财务经理微课堂，8小时打造卓越财务经理

造价争议解决之道·108个实战案例揭示高端造价业务的精髓

本条目由以下用户参与贡献

评论(共5条)

导航

添加收藏

编辑收藏夹

意见反馈

支付成功

查看

工具箱▼

颤抖手精炼均衡

出自 MBA智库百科(https://wiki.mbalib.com/)

目录

什么是颤抖手精炼均衡

颤抖手精炼均衡的价值

颤抖手精炼均衡的举例[1]

参考文献

温馨提示

本条目相关文档

本条目相关课程

财务经理微课堂，8小时打造卓越财务经理

造价争议解决之道·108个实战案例揭示高端造价业务的精髓

本条目由以下用户参与贡献

评论(共5条)

导航

添加收藏

编辑收藏夹

意见反馈

颤抖手精炼均衡的举例^[1]