矩阵对策
出自 MBA智库百科(https://wiki.mbalib.com/)
矩阵对策(matrix game)、二人有限零和对策
目录 |
矩阵对策是指处于利益竞争的两个关系主体,各自可选的策略有限,且在一局对策中双方得失和为零的现象,即要不成功、要不失败。对策中,一方真正成功的措施应该是,针对对方所采取的行动相应地制定有利于自己的应对策略,各方选择的策略必定是自己对对方策略预测的最佳反应。
矩阵对策是对策论中的一个分支,通常认为矩降对策是静态对策中的有限零和对策。[1]
矩阵对策即为二人有限零和对策。“二人”是参加对策的局中人有两个, “有限”是指每个局中人的策略集均为有限集, “零和”是指在任一局势下, 两个局中人的赢得之和总等于零, 即一个局中人的所得值恰好等于另一个局中人的所失值, 双方的利益是完全对抗的。[2]
矩阵对策举例[1]
以最基本的两船避让决策为例,这也是多船避让决策的基础。在避碰过程中,无论是我船还是来船,都可以采用自己希望结局更好的策略。在确定策略前,决策者(驾驶员)可能是保守的,也可能是冒险的。一般说来,选择保守的策略,希望能使碰撞避免或使损失减少到最小,这种选择的目的是保证所预计的最坏结果尽可能地小。
其思路是:列出来船可能采取的任何策略,如来船向右转,则可根据海上实践经验,列出 来船向右转不同角度、不同航速的各种组合,设为m个。我船可能采取的策略,亦一-列出, 设为n个,则局势数为mxn.赢得函数可以是DCPA,可以是TCPA,也可以是CR (碰撞危险 度),一般以取DCPA较为方便。
矩阵对策的性质[2]
一般, 用Ⅰ和Ⅱ分别表示两个局中人, 并设局中人Ⅰ有m 个纯策略, 局中人Ⅱ有n 个纯策略; 局中人Ⅰ和局中人Ⅱ的策略集分别为S1 = {α1 ,α2 , …,αm} 和S2 = {β1 ,β2 , …,βn} 。
当局中人Ⅰ选定纯策略αi 和局中人Ⅱ选定纯策略βj后, 就形成一个纯局势(αi,βj) , 这样的纯局势共有m ×n个。对任一纯局势(αi,βj) , 记局中人Ⅰ的赢得值为αij , 称
A = ( aij) mxn =
a11 a12 … aln
a21 a22 …a2n
…………
am1 am2 …amn
为局中人Ⅰ赢得矩阵。由于对策为零和的, 故局中人Ⅱ的赢得矩阵- A 。