矩陣對策
出自 MBA智库百科(https://wiki.mbalib.com/)
矩陣對策(matrix game)、二人有限零和對策
目錄 |
矩陣對策是指處於利益競爭的兩個關係主體,各自可選的策略有限,且在一局對策中雙方得失和為零的現象,即要不成功、要不失敗。對策中,一方真正成功的措施應該是,針對對方所採取的行動相應地制定有利於自己的應對策略,各方選擇的策略必定是自己對對方策略預測的最佳反應。
矩陣對策是對策論中的一個分支,通常認為矩降對策是靜態對策中的有限零和對策。[1]
矩陣對策即為二人有限零和對策。“二人”是參加對策的局中人有兩個, “有限”是指每個局中人的策略集均為有限集, “零和”是指在任一局勢下, 兩個局中人的贏得之和總等於零, 即一個局中人的所得值恰好等於另一個局中人的所失值, 雙方的利益是完全對抗的。[2]
矩陣對策舉例[1]
以最基本的兩船避讓決策為例,這也是多船避讓決策的基礎。在避碰過程中,無論是我船還是來船,都可以採用自己希望結局更好的策略。在確定策略前,決策者(駕駛員)可能是保守的,也可能是冒險的。一般說來,選擇保守的策略,希望能使碰撞避免或使損失減少到最小,這種選擇的目的是保證所預計的最壞結果儘可能地小。
其思路是:列出來船可能採取的任何策略,如來船向右轉,則可根據海上實踐經驗,列出 來船向右轉不同角度、不同航速的各種組合,設為m個。我船可能採取的策略,亦一-列出, 設為n個,則局勢數為mxn.贏得函數可以是DCPA,可以是TCPA,也可以是CR (碰撞危險 度),一般以取DCPA較為方便。
矩陣對策的性質[2]
一般, 用Ⅰ和Ⅱ分別表示兩個局中人, 並設局中人Ⅰ有m 個純策略, 局中人Ⅱ有n 個純策略; 局中人Ⅰ和局中人Ⅱ的策略集分別為S1 = {α1 ,α2 , …,αm} 和S2 = {β1 ,β2 , …,βn} 。
當局中人Ⅰ選定純策略αi 和局中人Ⅱ選定純策略βj後, 就形成一個純局勢(αi,βj) , 這樣的純局勢共有m ×n個。對任一純局勢(αi,βj) , 記局中人Ⅰ的贏得值為αij , 稱
A = ( aij) mxn =
a11 a12 … aln
a21 a22 …a2n
…………
am1 am2 …amn
為局中人Ⅰ贏得矩陣。由於對策為零和的, 故局中人Ⅱ的贏得矩陣- A 。