博弈论期末复习题Word文档下载推荐.docx
《博弈论期末复习题Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《博弈论期末复习题Word文档下载推荐.docx(21页珍藏版)》请在冰点文库上搜索。
jR;
(a,d)}
P=4-q1—q2,其中P为价格,两个厂商都以其产量为纯战略,问纯战略贝叶斯均
衡为何?
给定q2,厂商1的问题是
mfx些=(P-1)q1
=(4—q1-q2-1)q1
因q^=q2(c)。
厂商1不知道c,故目标函数为
3/2
maxt(4—5—q2(c)—1)q1dc
q7
(1)
r23/2
=max『qi-q1-q1〔q?
一阶条件:
3-2q1—Jq2(c)dc=0
"
313/2
得q1=7—7」q2(c)dc
221
厂商2的问题是:
max兀2=(P~c)q2
q2
=(4-q-q2-c)q2
=(4-c)q2-q1q2-q2
(4—C)
-q1-“2=0
q2(c)=4—C—q1
代入式
(1):
31
q1=—--
22
~2~22
3/24—c-5I-^dc3/2口1+片认
24出
34-61「jM(1厂248卜2丿12丿
3+4
4
代入式
(2):
3—c
q2(c)=—
若C=1,贝yqi=q2=1
3
若信息是完全的且c=1,则古诺博弈均衡为q^q^-<
1,兀4=兀2=
5
27"
25
这说明信息不完全带来的高效率。
2、完美信息动态博弈。
会用策略式表达、扩展式表达。
用方框找纳什均衡,用
树找子
博弈精炼均衡。
讲理由,看例题。
<
进入r进入XI>
tb\・eHa)
进入
A
不进入
-3,-3
1,0
0・1
0,0
0,1
0,0
该博弈中有三个纳什均衡:
不进入,(进入,
进入)
进入,(不进入,
不进入)
即参
前两个均衡的结果(进入,不进入),即A进入,B不进入;
第二个均衡结果是(不
进入,进入),即A不进入,B进入
如果理论得到这样的结果,无助于预测博弈参与人的行为。
此外,纳什均衡假定,每一个参与人选择的最优战略是在所有其他参与人的战略选择给定时的最优反应,
与人并不考虑自己的选择对其他人选择的影响,因而纳什均衡很难说是动态博弈的合理解。
子博弈精
必须在多个纳什均衡中剔除不合理的均衡解,即所谓“不可置信威胁”
前边得到的三个纳什均衡中,均衡①意味着当A不进入时,B选择进入;
而
当A选择进入时,B仍选择进入(B威胁无论如何都要进入市场)。
显然,当A选择进入时,B仍选择进入是不合理的,如果A进入市场,B选择“不
进入”比选择“进入”收益要更大,理性的B不会选择进入,而A知道B是理性的,
因此也不会把该战略视为B会选择的战略。
因此,
战略(进入,进入)是不可置信威胁。
1{不进入,(进入,进入)
2{进入,(不进入,进入)
{进入,(不进入,不进入)
当A选择不进入时,B仍选择进入(B威胁无论如何都不进入市场)。
显然,当A选择
不进入时,B仍选择不进入是不合理的,B的战略是不可置信的。
只有均衡②是合理的:
如果A进入,B不进入;
如果A不进入,B进入。
因
为A是先行动者,理性的A会选择“进入”(他知道B是理性的,B不会选择“进入”),而理性的B选择“不进入”。
观察博弈树上的三个均衡中,B的不可置信战略中的反应,在第二阶段B开
B的战略在所有子博弈中都是
始行动的两个子博弈中不是最优;
而合理的纳什均衡中,
最优的,与A的第一阶段可能选择的行动构成该子博弈的纳什均衡。
设u(mi)为接收者看见mi时
认为发送者是t1的后验概率。
当接收者看见,选a1的支付为
0.5x2+0.5x1=1.5
选a2的支付为0.5x8+0.5X7=7.5>
1.5
故选a2。
当接收者看见m2,选ai的支付为
u(m2)X1+(1-u(m2))X5=5-4u(m2)
选a2的支付为
u(m2)^7+(1-u(m2))X3=3+4u(m2)
h总会选m1。
是占优于选m1的,故此混同均衡hTm1,
再看混同均衡1Tm2,t2Tm2
此时u^j)=[O,1]为非均衡路径上的后验概率,
u(m2)=0.5
当接收者看见m2,选a1的支付为
0.5X1+0.5^5=3
0.5咒7+0.5^3=5>
故接收者必选a2。
当接收者看见m1时,选a1的支付为
u(m1)”2+(1-u(m1)1=1+u(m1)
u(m1)、8+(1-u(m1)7=7+u(m1)》1+u(m1)
故必选a2。
这样,无论发送者发出m1或m2信号,接收者总选a
二给定接收者总是选a2。
t1会选m1,t2会选m2。
=故tiTm2,t2Tm2不是混同均衡。
看分离均衡1Tm1,t2Tm2
u(m1)=1,u(m2)=0
接收者看见m1时,必选a2接收者看见m2时,必选a1
此时,t1选m1,t2选m2
=故tjTm1,t2Tm2是一个分离均衡。
最后看分离均衡1Tm2,t2Tm1
u(m10,u(m2)=1
接收者看见m1时,必选a2
接收者看见m2时,必选a2
=给定接收者总选a2
trTm1,t2Tm2
=故hTm2,t2Tm1不是分离均衡。
故只有一个纯战略子博弈精炼分离均衡
t,Tm1
t2Tm2
鹰-鸽(Hawk-Dove)博弈
(1)参与人:
争食的两只动物-动物1和动物2。
动物1和动物2的行动空间都是一样的,即:
Ai={鹰,鸽}i=1,2
支付矩阵如下:
1
动物23
寸
鹰’
鸽昇
动物2
辭
0,Or
4*1心
鸽口
1,4心
3,3心
(2)此博弈属于完全信息静态博弈,根据奇数定理知道共有三个纳什均衡,两个纯策略
纳什均衡和一个混合策略纳什均衡。
两个纯策略纳什均衡是:
(鹰,鸽)和(鸽,鹰)。
混合策略纳什均衡是:
动物1和动物2
分别以50%的概率随机地选择鹰(象鹰一样行动)或者鸽(象鸽一样行动)。
纯策略纳什均衡可以用划线法或箭头法求解。
混合策略纳什均衡则可根据无差异原则求
解概率分布,即:
首先,动物1应该以
q的概率选择鹰,以1-q的概率选择鸽,使得动物2在鹰或者鸽之
间无差异,那么可得
q*:
由4(1-q)=q+3(1-q)得q*=50%;
其次,动物2应该以
a的概率选择鹰,以1-a的概率选择鸽,使得动物1在鹰或者鸽之
a*:
由4(1-a)=a+3(1-a)得a*=50%。
(3)此博弈实际就是一个斗鸡博弈,在现实生活许多现象都与此类似,如市场进入、前
苏联与美国在世界各地争抢地盘等。
七、狩猎博弈
此博弈同样是一个完全信息静态博弈,参与人是两个猎人,他们的行动是选择猎鹿或者
猎兔。
500.50W
0,100^
兔』1
lOOitP
100.lOtP
根据划线或箭头法我们可以很容易地知道此博弈有两个纯策略纳什均衡,即:
(鹿,鹿)
和(兔,兔),也就是两个猎人同时猎鹿或同时猎兔都是纯策略纳什均衡。
由于存在两个纯策略纳什均衡,现实中究竟哪个均衡会出现就是一个问题,
这是多重纳
什均衡下的困境。
但是,比较两个纳什均衡,很容易发现两人都猎鹿帕累托优于两人都
猎兔,所以,对两个猎人而言,都猎鹿是一个“更好”的纳什均衡,
因此,在现实中两
个人都决定猎鹿的可能性要更大一些。
然而,正如卢梭所言,
如果一只野兔碰巧经过他
们中的一个人附近,那么也许这个人会去猎兔而使猎鹿失败,
因为两个人都猎兔也是
个纳什均衡,这就是人的自私性。
此外,在多个纳什均衡下,博弈之外的其他因素有助于我们判断哪个均衡会出现。
比如,
两个猎人是好朋友,经常合作,那么我们几乎可以100%的肯定他们都会同时选择猎鹿。
如果他们是仇敌,那么我们可以肯定他们不会合作猎鹿,因此他们都会选择各自猎兔。
案例性别战
来源:
考试大-考博考试
不完全信息夫妻博弈
混合策略均衡
给定妻子分别以q,1-q的概率选择时装、足球,
1.q+0.(1-q)=0.q+3.(1-q),解得妻子选择时装、足球的
概率分别为(3/4,1/4)
给定丈夫分别以p,1-P的概率选择时装、足球,则妻子选择时装、足球的期望收益相等,即2.P+0.(1-p)=0.p+1.(1-p),解得妻子选择时装、
衡。
该混合策略纳什均衡给妻子和丈夫各自带来的期望收益分别为:
q.p.2+q.(1-p).0+(1-q).p.0+(1-q).(1-p).1=2/3;
q.p.1+q.(1-p).0+(1-q).p.0+(1-q).(1-p).3=3/4
双方的期望收益均小于纯策略时的期望收益。
某些静态贝叶斯博弈的例子
1、市场进入博弈
一个完全垄断企业B正在垄断一个行业市场,另一个潜在的试图进入该行业的企
业A,称A为进入者,B为在位者。
A不知道B的成本特征,设B有两种可能的成本,
表6.1市场进入博弈
假定B知道进入者A
的成本为高成本,且与B为高成本时的成本相同。
假若信息
是完全的,则当B为高成本时,唯一的精炼纳什均衡为(进入,默认),另一纳什均衡
进入,斗争),即若A进入行业,具有低成本优势的B将通过降低价格将A逐出市场。
由于存在行业进入成本,所以A被逐出市场后将有净的10单位进入成本的损失。
当A不知道B的成本情况时,他的选择将依赖于他对B的成本类型的主观概率或
先验概率密度。
设A对B是高成本的先验概率判断为P,则A认为B为低成本的概率为1-P。
如果A进入,其期望支付为
P(40)+(1-P)(-10)
如果1不进入,其期望支付为
11
当且仅当P(40)+(1-P)(-10"
0或卩蔦时,A选择进入;
反之,当P<
E时,
A不进入。
于是,贝叶斯均衡为:
(不进入,*),PV1
其中*表示可以是斗争,也可以是默认。
2成本信息不对称的古诺博弈
例3.10给出的古诺博弈中,每个厂商的成本函数是共同知识。
这里,我们假设每
个厂商的成本函数是私人信息,具体规定如下:
两个企业生产相同产品在同一市场上进行竞争性销售,市场需求函数为Q=a-P,a》0,P为产品价格,Q为市场需求量。
假设a充分大时总有a-P>
0,企业i的成本函数为Cj=biqi,其中Ci为企业i的总成本,qi为其产量,bi为其平均成本,bi为常数且biA0,故bi也是边际成本。
bj是企业i的私人信息,企业j不知道bi但认为bj在[d,e]上呈均匀分布,dA0,e>
0,d<
e。
且进一步假定bi在[d,e]呈均匀分布是共同知识,i工j,i=j=1,2。
企业i的支付函数是其利润函数jij
^i=Pqi-G
=(a—Q)qi—bq
=qi5
=(a-qi-q2)qi-biqi
设静态贝叶斯均衡为^q*)^2,则由均衡战略的类型依存性有
q*^q^bi),i=1,2
于是
叫=(a-q;
(bi)-q;
(b2))q;
(bi)-biq*(b)
i(bj)
i的期望支付为
u=jP(bj|biBi(bj)dbj
Hj
显然P(bj|bi)=P(bj),由概率分布密度P(bj)的归一化条件
JP(bj)dbj=1
及bj在[d,e]上呈均匀分布假设,有
P(bj)Jdbj=1
或[e-d]P(bj)=1
即P(bj)=—7
e—d
〔「「1】
{(a-qi)(e-d)-Jqj(bj)dbj[q-bq:
(e-d)f
ILHj」J
cUi
&
li(e—d)
—(e—d)qi+(a—qi)(e—d)—Jqj(bj)dbj—b(e—d)
=0
(a-bi)(e-d)-gjqi=
2(e—d)
(6.5)
同样由对称性有
(a-bj)(e-d)-giqj=
(6.6)
在上式两端对bj进行积分
(6.7)
在式(6.5)两端对bi积分
2d2
aG-cB-e;
—gj
Jq=
(6.8)
将式(6.7)代入式(6.8)的右端,得
a-
(e-d)
(6.9)
代入式(6.5)得
(a-bi)(e-d)
「e—d)
2a—3bi+
2(e-d)
e+d
e+d
2a-3bj+——
同理有q,=—
6
2a-3bi
当bi>
b2时,qicq2;
***
均衡利润兀1=(P-bi)qi<
(P-b2)q2=兀2,即成本较高的一方利润较低,产量较低。
3.26相比较,进一
当e=d时,博弈退化成完全信息静态博弈的场合。
为了与例步设d=e=C,Q=匕2=c,贝U
**1
qi=q2=3(a-c)
这正好回到例3.26的结果。
d+e
若假设d<
C<
e,c=,bi=b2=c,则
**1qi=q2=—(a—c),这与完全信息博弈均衡相同。
d+e
若假设c<
d=b2=c,贝y
q1=q2:
>
—(a-c),此时每个厂商都误以为对方的成本较自己高的可能性大3
些,从而过于自信地扩大产量。
相反,若假设CAd~e,d=b2=c,则
q;
=q2<
1(a-c),此时每个厂商都误以为对方的成本较自己低的可能性大
些,从而过于谨慎地计划自己的产量。
寡头市场两个企业遵循古诺模型,a企业成本c1=20q1,b企业成本c2=60q2,市场需
1、求p=400-q。
(1)厂商1和厂商2的反应函数
(2)均衡价格和厂商1和厂商2的均衡产
量。
(3)厂商1和厂商2的利润
1).profit1=q1*[400-(q1+q2)]-20q1
profit2=q2*[400-(q1+q2)]-60q2
分别求偏导:
400-2q1-q2-20=0;
400-2q2-q1-60=0
反应函数:
q1=190-q2/2;
q2=170-q1/2
2)联立反应函数,解得q1=140q2=100
3)profit1=19600;
profit2=10000