方根
电&丿
据从最不利情形中选取最有利的结果的原则选择纯策略时,应分别选取:
2和冷,
此时局中人I贏得8,比其预期赢得6还多,原因就在于局中人U选择了S,使其对
手多得原来不该得的赢得,故“对局中人U来说并不是最优,因而它会考虑取徉
2。
局中人I亦会采取相应的办法,改取:
i以使赢得为9,而局中人U又可能仍取策略1来对付局中人I的策略。
这样,局中人I取或〉2的可能性以及局中人U取或二的可能性都不能排除,对两个局中人来说,不存在一个双方均可以接受的平衡局势,或者说当V,:
v时,矩阵对策G不存在纯策略意义下的解。
在这种情况下,一个比较合乎实际的想法是,既然各局中人没有最优纯策略
可取,是否可以给出一个选取不同策略的概率分布?
如在上的例子中,局中人
I可以制定如下一^中策略:
分别以概率1/4和3/4选取纯策略・■,或〉2,这种策略是局中人I的策略集上的一个概率分布,称之为混合策略。
同样局中人U也
可以制定这样一中混合策略,分别以概率1/2和1/2选取纯策略或-2。
F面给出矩阵对策混合策略的定义。
定义:
设G-SnSz,Al为矩阵对策,其中S,=(7)宀,…J,&二二「2,…,\?
,A二
[aj。
记
|mn—
S“=、x・E”Xi亠0,i=1,2,...,m,二Xi=1/
S2=yEyj-0,j=1,2,,n,、屮二1:
则S”和5分别称为局中人i和u的混合策略集(或策略集);S”和
yS?
分别称为局中人I和U的混合策略(或策略),对x•S,*S2称(x,y),为一个混合局势(或混合扩充)。
一个混合策略X=x>,Xs・・・可设想成当两个局中人多次重复进行对策时,局中人I分别采取纯策略J,■,…的频率。
若只进行一次时对策,混合对策可设想成局中人I对各纯策略的偏爱程度。
2、混合策略的求解
求解混合策略的问题有图解法,迭代法、线性方程组法和线性规划法,在此我们用线性规划解法。
以赢得矩阵/b‘°〕为例来建立此混合策略的线性规划模型。
<86丿
首先,设局中人I使用的概率为X/,使用:
・2的概率X2,并设在最坏的情况下(即为乙出对其最有利的策略情况下),甲的赢得的平均值等于V。
建立下面的数学尖系:
XiX2=1
X/-0,X2-0
5xi8x2_V
9X16X2-V
其次,考虑V的值,V与赢得矩阵A中各元素的值有尖,如果A中各元素的值都大于0,即不管局中人U采用什么策略,局中人I的赢得都是正的。
本例中A得所有元素都取正值,显然V.0。
X
再次,做变量替换,令XJi」,2‘以上五个数量尖系式变为
畑」
2V
%_0,X2-0
5xr8x2一1
9x「6x21
1
对于局中人I来说,他希望V越大越好,也就是希望1的值越小越好。
建
V
立局中人I的最优混合策略的线性规划模型如下:
minX-iX2
5为8x2-1
9Xi6X2-1
xi-0,x2-0
求解该模型得到
为=0.048
X2=0.095
V7
%+X20.048+0.095
Xi=VX1=70.048:
—0.336
x?
=V应-70.0950.664
即:
局中人I的最优混合策略是以0.336的概率出、策略,以0.664的概
率出勺策略'简记为X*=(0.336,0.664\Vg=7。
同样可以求出局中人U的最优混合策略。
建立的线性规划模型如下:
maxyiy2
5%9y2乞18xi6x2_1
yi-0,y?
-0
求解略。
上述例题中,V.0,若没有办法判断出V大于零,或者在一些问题中V本来就小于零或者等于零,此时,可以把A中的每一个元素都加上一个足够大的正数k使得所得的新赢得矩阵A•的每一个元素都大于零。
有定理保证这两个矩阵对策G」.S,S2,A1
G-SsS2,A]的最优混合策略是相同的。
而且有VG=VG