博弈论习题及参考答案Word下载.docx

资源描述

博弈论习题及参考答案Word下载.docx

《博弈论习题及参考答案Word下载.docx》由会员分享，可在线阅读，更多相关《博弈论习题及参考答案Word下载.docx（19页珍藏版）》请在冰点文库上搜索。

博弈论习题及参考答案Word下载.docx

Ｄ.　策略与行动是两个不同的概念，策略是行动的规则,而不是行动本身。

13.　囚徒困境说明（）:

A.双方都独立依照自己的利益行事,则双方不能得到最好的结果；

Ｂ．　如果没有某种约束，局中人也可在（抵赖，抵赖）的基础上达到均衡；

C.双方都依照自己的利益行事，结果一方赢，一方输；

D、每个局中人在做决策时,不需考虑对手的反应

14.一个博弈中,直接决定局中人损益的因素是（）:

A.策略组合　　　　B.策略　

C．信息　　　Ｄ.行动

15．动态博弈参与者在关于博弈过程的信息方面是（　）　　　

A　不对称的　　　　Ｂ对称的　　

Ｃ不确定的　　　D无序的

1６.古诺模型体现了寡头企业的（　　）决策模型。

Ａ　成本　　　　　B　价格　　

C产量　D质量

17．伯特兰德模型体现了寡头企业（）决策模型。

A成本　　　　　B价格　　　

C　产量　　D质量

１8．用囚徒困境来说明两个寡头企业的情况，说明了:

（）

Ａ、每个企业在做决策时,不需考虑竞争对手的反应

B、一个企业制定的价格对其它企业没有影响

C、企业为了避免最差的结果,将不能得到更好的结果

D、一个企业制定的产量对其它企业的产量没有影响

１9.子博弈精炼纳什均衡（）:

A.是一个一般意义上的纳什均衡;

Ｂ.和纳什均衡没有什么关系；

C.要求某一策略组合在每一个子博弈上都构成一个纳什均衡;

Ｄ．　要求某一策略组合在原博弈上都构成一个纳什均衡。

20.　在一般产品销售市场上，以下哪种原因导致了逆向选择。

（　）

A产品质量的不确定性　B私人信息

C　公共信息　　　　Ｄ　产品价格

２1.完全信息动态博弈参与者的行动是（　　）　　　　

Ａ　无序的　　　　　B　有先后顺序的

Ｃ不确定的　　　　D因环境改变的

２2.市场交易中普遍存在的讨价还价属于哪种博弈。

Ａ　完全信息静态博弈　　　　　　B完全信息动态博弈　

C不完全信息静态博弈　　　　D不完全信息动态博弈

2３.下面哪种模型是一种动态的寡头市场博弈模型（）

A古诺模型　　ﻩB伯川德模型　　

C斯塔克尔伯格模型Ｄ田忌齐威王赛马

2４.博弈方根据一组选定的概率，在两种或两种以上可能行为中随机选择的策略为（）

A纯策略　　　B混合策略　　　

C激发策略　　　Ｄ一报还一报策略

25．影响重复博弈均衡结果的主要因素是（　）

A博弈重复的次数　　　　Ｂ信息的完备性

Ｃ支付的大小　DA和B

2６．在动态博弈战略行动中,只有当局中人从实施某一威胁所能获得的总收益（）不实施该威胁所获得的总收益时,该威胁才是可信的。

A大于　　　Ｂ等于　　

Ｃ　小于　　Ｄ以上都有可能

二、判断正误并简要说明理由

１.　纳什均衡一定是上策均衡，上策均衡一定是纳什均衡。

2．在一个博弈中博弈方可以有很多个。

3.在一个博弈中只可能存在一个纳什均衡。

4.因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。

5.　在一个博弈中如果存在多个纳什均衡则不存在上策均衡。

6．由于两个罪犯只打算犯罪一次,所以被捕后才出现了不合作的问题即囚徒困境。

但如果他们打算重复合伙多次,比如说2０次，那么对策论预测他们将采取彼此合作的态度，即谁都不招供。

７．　在博弈中纳什均衡是博弈双方能获得的最好结果。

8.在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。

９.　纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。

10.　囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。

11.斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润。

1２.在有限次重复博弈中，存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。

13．子博弈精炼纳什均衡不是一个纳什均衡。

14.零和博弈的无限次重复博弈中，可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡。

15．原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益：

采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果，符合所有局中人的利益,因此,不管是重复有限次还是无限次，不会和一次性博弈有区别。

1６．在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。

三、计算与分析题

１、Ａ、B两企业利用广告进行竞争。

若A、B两企业都做广告,在未来销售中，A企业可以获得2０万元利润，B企业可获得8万元利润;

若Ａ企业做广告，B企业不做广告，A企业可获得25万元利润,B企业可获得2万元利润;

若A企业不做广告，Ｂ企业做广告，A企业可获得10万元利润，B企业可获得12万元利润；

若A、B两企业都不做广告,A企业可获得３0万元利润,B企业可获得6万元利润。

（1）画出A、B两企业的损益矩阵。

（2）求纯策略纳什均衡。

2、可口可乐与百事可乐（参与者）的价格决策：

双方都可以保持价格不变或者提高价格（策略）;

博弈的目标和得失情况体现为利润的多少（收益）;

　利润的大小取决于双方的策略组合（收益函数）;

博弈有四种策略组合，其结局是:

（1）双方都不涨价，各得利润10单位;

（2）可口可乐不涨价,百事可乐涨价,可口可乐利润10０，百事可乐利润－30；

ﻫ（3）可口可乐涨价,百事可乐不涨价，可口可乐利润-２0，百事可乐利润３0；

ﻫ（４）双方都涨价，可口可乐利润1４0,百事可乐利润35；

画出两企业的损益矩阵求纳什均衡。

３、假定某博弈的报酬矩阵如下：

乙

左

右

甲

上

a,b

ｃ，ｄ

下

e,f

g，ｈ

（1）如果（上，左）是上策均衡,那么,a>

？

　ｂ>

　ｇ<

（２）如果（上,左）是纳什均衡,上述哪几个不等式必须满足？

４、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。

如果它们合作,各获得5000０0元的垄断利润，但不受限制的竞争会使每一方的利润降至６0000元。

如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利９０0000元。

（1）将这一市场用囚徒困境的博弈加以表示。

（２）解释为什么均衡结果可能是两家公司都选择竞争性策略。

5、博弈的收益矩阵如下表：

a，ｂ

ｃ,ｄ

e，ｆ

g,h

（1）如果（上,左）是占优策略均衡,则a、b、c、d、e、f、g、h之间必然满足哪些关系？

（尽量把所有必要的关系式都写出来）

（2）如果（上,左）是纳什均衡,则（１）中的关系式哪些必须满足?

　　（3）如果（上,左）是上策均衡，那么它是否必定是纳什均衡?

为什么?

（４）在什么情况下,纯策略纳什均衡不存在?

6、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽，另一头装有控制饲料供应的按钮。

按一下按钮就会有10个单位饲料进槽，但谁按谁就要付出2个单位的成本。

谁去按按纽则谁后到;

都去按则同时到。

若大猪先到，大猪吃到9个单位，小猪吃到一个单位；

若同时到,大猪吃７个单位,小猪吃3个单位;

若小猪先到，大猪吃六个单位,小猪吃4个单位。

求

（1）各种情况组合扣除成本后的支付矩阵

（2）求纳什均衡。

7、设啤酒市场上有两家厂商，各自选择是生产高价啤酒还是低价啤酒,相应的利润（单位：

万元）由下图的得益矩阵给出:

低价

高价

1０0,800

5０，50

-２0,-30

90０,6０0

（1）有哪些结果是纳什均衡？

（２）两厂商合作的结果是什么？

8、求出下列博弈的所有纯策略纳什均衡。

局中人2

丙

丁

局中人1

2,3

3,2

3,４

０，3

４,4

5，2

０,1

1,2

Ｃ

3,1

4,1

1,4

10，2

4，1

-1,2

10,1

9、求出下面博弈的纳什均衡（含纯策略和混合策略）。

Ｕ

5,0

0，8

2,6

４,５

１0、根据两人博弈的损益矩阵回答问题：

0，0

0,０

４,2

（1）写出两人各自的全部策略。

（2）找出该博弈的全部纯策略纳什均衡。

（3）求出该博弈的混合策略纳什均衡。

１1、某寡头垄断市场上有两个厂商，总成本均为自身产量的20倍，市场需求函

数为Q=200－P。

求:

（1）若两个厂商同时决定产量，产量分别是多少？

（2）若两个厂商达成协议垄断市场,共同安排产量，则各自的利润情况如何？

（3）用该案例解释囚徒困境。

1２、假设双头垄断企业的成本函数分别为:

，

市场需求曲线为

其中，

。

（1）求出古诺（Ｃｏｕrnot）均衡情况下的产量、价格和利润，求出各自的反应函数，并图示均衡点。

（2）求出斯塔克博格（Stackｅlｂeｒg）均衡情况下的产量、价格和利润。

（３）说明导致上述两种均衡结果差异的原因。

13.下面的得益矩阵两博弈方之间的一个静态博弈，该博弈有没有纯策略的纳什均衡，博弈的结果是什么?

１4.两个兄弟分一块冰激凌。

哥哥先提出一个分割比例，弟弟可以接受或拒绝,接受则按哥哥的提议分割,若拒绝就自己提出一个比例。

但这时候冰激凌已化得只剩1/2了,对弟弟提议的比例哥哥也可以接受或拒绝,若接受则按弟弟的建议分割,若拒绝冰激凌会全部化光。

因为兄弟之间不应该做损人不利己的是，因此我们假设接受和拒绝利益相同时兄弟俩都会接受。

求该博弈的子博弈完美纳什均衡。

１5.如果学生在考试之前全面复习,考好的概率为90％，如果学生只复习一部分重点，则有50%的概率考好。

全面复习花费的时间t1=100小时,重点复习之需要花费t2=20小时。

学生的效用函数为：

Ｕ=W－2e，其中W是考试成绩，有高低两种分数Wh和Ｗl,e为努力学习的时间。

问老师如何才能促使学生全面复习?

16.在下列监工与工人之间的博弈中，试用划线法分析该博弈有无纯策略纳什均衡;

如果没有，那么写出混合策略纳什均衡的结果。

监工

监督

不监督

工人

偷懒

1，－1

-1，2

不偷懒

-2，3

２，２

17.求解下列博弈的纳什均衡。

博弈方２

中

博弈方１

４，３

5，１

６，2

2，１

８,４

３，６

３，０

12,6

2，9

18.某人正在打一场官司,不请律师肯定会输,请律师后的结果与律师的努力程度有关。

假设当律师努力工作（100小时）时有5０%的概率能赢，律师不努力工作（10小时）则只有１5%的概率能赢。

如果诉讼获胜可得到250万元赔偿,失败则没有赔偿。

因为委托方无法监督律师的工作,因此双方约定根据结果付费，赢官司律师可获赔偿金额的１0%,失败则律师一分钱也得不到。

如果律师的效用函数为

，其中

是报酬，

是努力小时数，且律师有机会成本5万元。

求这个博弈的均衡。

四、论述题

1、解释“囚犯困境”，并举商业案例说明。

２、用“小偷与守卫的博弈”说明“激励（监管）悖论”。

《博弈论》习题参考答案

１~5　　B.B．C．Ｄ.A．　　　　6~10　C.　A.A.D.C．　

11~15.　　Ｂ.Ｃ.Ａ.A.C.16~２0C.Ｂ．C.Ｃ.Ｂ．

２1~26.　B．B.Ｃ.B.D.Ａ.

1、F　上策均衡是比纳什均衡更严格的均衡。

所以上策均衡一定是纳什均衡，而纳什均衡不一定是上策均衡,

2、T　博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈

3.F博弈双方偏好存在差异的条件下，一个博弈模型中可能存在多个纳什均衡,如性别战。

4.T　零和博弈指参与博弈各方在严格竞争下，一方收益等于另一方损失,博弈各方收益与损失之和恒为零，所以双方不存在合作可能性

5.T　上策均衡是通过严格下策消去法（重复剔除下策）所得到的占优策略，只能有一个纳什均衡

6．F　只要两囚犯只打算合作有限次,其最优策略均为招供。

比如最后一次合谋,两小偷被抓住了,因为将来没有合作机会了,最优策略均为招供。

回退到倒数第二次,既然已经知道下次不会合作，这次为什么要合作呢。

依此类推，对于有限次内的任何一次，两小偷均不可能合作。

7．F　纳什均衡是上策的集合，指在给定的别人策略情况下，博弈方总是选择利益相对较大的策略,并不保证结果是最好的。

８.F　　局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标

9.T　纳什均衡是上策的集合，指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益

10.F　局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标

11．T虽然斯塔格伯格模型各方利润总和小于古诺模型，但是领导者的利润比古诺模型时高

１2.．T无限次重复博弈没有结束重复的确定时间；

而在有限次重复博弈中,存在最后一次重复,并且正是有结束重复的确定时间，使重复博弈无法实现更高效率均衡。

1３.F子博弈精炼纳什均衡一定是一个纳什均衡。

１４.Ｆ零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。

15.T　原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,因此不管是重复有限次还是无限次，不会和一次性博弈有区别。

16.F　动态博弈是指各博弈方的选择和行动又先后次序的博弈。

动态博弈的信息可以是不对称的。

所以策略分为先发制人和。

斯塔克伯格博弈揭示“先发制人”更有利，而“后发制人”－-－-－后行动的博弈方可以先观察对方行为后再选择行为反而处于不利境地。

1、

（1）

做广告

不做广告

2０，８

25,2

１0，１２

30,６

（2）纯策略纳什均衡为（做广告，做广告），（不做广告，不做广告）。

2、

百事可乐

不涨价

涨价

可口可乐

10,1０

１00,-30

-２0,30

14０,３5

纳什均衡（不涨价，不涨价）,（涨价，涨价）。

从帕累托均衡角度,为（涨价，涨价）

3、

（1）如果（上,左）是上策均衡，那么，a＞eb>

d,ｇ＜c,ｆ>

（2）如果（上，左）是纳什均衡，ａ＞e　b>

ｄ,不等式必须满足

4、　

新华航空

合作

竞争

北方航空

50,50

0,９０

9０,0

６，６

5、略

6、

小猪

按

等

大猪

5，1

4，4

9，-1

0,0

纳什均衡为（按,等）。

7、略

8、纯策略纳什均衡（B,甲），（A,丙）

９、

５,0

0,8

２,6

4，５

（1）不存在纯策略纳什均衡

（2）设甲选择“U”的概率为P1,则选择“D”的概率为1-P１

乙选择“Ｌ”的概率为Ｐ２，则选择“R”的概率为１-P2

对甲而言，最佳策略是按一定的概率选“上”和“下”，使乙选择“左”和“右”的期望值相等

即P1*8+（1-P１）*0＝P1＊1+（1-Ｐ1）*5

　解得P１=5/1２

即（5/12,7/1２）按5/12概率选“上”、７/１2概率选“下”为甲的混合策略Ｎash均衡

对乙而言，最佳策略是按一定的概率选“左”和“右”,使乙选择“上”和“下”的期望值相等

即　P2*５+（1-P2）*0=P2*2＋（１-Ｐ２）＊4

　解得P２=４／７

即（4/7，3/7）按4/７概率选“左”、3／７概率选“右”为乙的混合策略Ｎaｓh均衡

1０、略。

1１、见笔记

12、见笔记。

１3．

首先，运用严格下策反复消去法的思想,不难发现在博弈方1的策略中，B是相对于Ｔ的严格下策。

把博弈方1的Ｂ策略消去后又可以发现,博弈方２的策略中C是相对于Ｒ的严格下策，从而也可以消去。

两个博弈方各消去一个策略后的博弈是如下的两人２×

２博弈,已经不存在任何严格下策。

再运用划线或箭头法,很容易发现这个2×

2博弈有两个纯策略纳什均衡（Ｍ，L）和（T，Ｒ）。

由于两个纯策略纳什均衡之间没有帕累托效率意义上的优劣关系，一次性静态博弈的结果不能肯定。

由于双方在该博弈中可能采取混合策略，因此实际上该博弈的结果可以是4个纯策略组合中的任何一个。

１4.　

假设哥的方案是S1：

1-S1，其中Ｓ１是自己的份额,弟的方案是S2：

1－S２，Ｓ２是哥的份额,那么可用如下的扩展形表示该博弈：

运用逆推归纳法先分析最后一阶段哥的选择。

由于只要接受的利益不少于不接受的利益哥就会接受,因此在这个阶段只要弟的方案满足S２/2≥0，也就是S2≥0，哥就会接受，否则不会接受。

由于冰激凌的份额不可能是负数,也就是说因为哥不接受弟的方案冰激凌会全部化掉，因此任何方案哥都会接受。

现在回到前一阶段弟的选择。

由于弟知道后一阶段哥的选择方法，因此知道如果不接受前一阶段哥提出的比例，自己可以取S2=0,独享此时还未化掉的1/2块冰激凌;

如果选择接受前一阶段哥的提议，那么自己将得到1－S1，显然只要１-S1≥1/2,即S1≤1／2,弟就会接受哥的提议。

再回到第一阶段哥的选择。

哥清楚后两个阶段双方的选择逻辑和结果，因此他在这一阶段选择S1=１/2,正是能够被弟接受的自己的最大限度份额，超过这个份额将什么都不能得到,因此Ｓ1=1/2是最佳选择。

综上,该博弈的子博弈完美纳什均衡是：

哥哥开始时就提议按（1/2,1/2）分割,弟弟接受。

15.　本题中老师的调控手段高分和低分的差距。

该博弈的扩展形如下:

学生选择全面复习的期望得益是U1=0.9（Ｗｈ-2００）＋　0.1（Wl-200）

重点复习的期望得益是U2=0.５（Wh-40）＋　0.５（Wl-４0）

只有当U1》U2时学生才会选择全面复习。

根据U1》U2我们可以算出Ｗh－Wl》４00。

这就是老师能有效全面复习需要满足的条件。

其实在奖学金与成绩挂钩时,Wh-Wl也可以理解成不同等奖学金的差额。

１6．　没有纯策略均衡,只有混合策略均衡（（0.25,0.７5），（0.5，０.5））

17．可以根据画线法求得有唯一纯策略均衡（上,左）

18．参见第15题

（1）假设条件举例:

两囚徒被指控是一宗罪案的同案犯。

他们被分别关在不同的牢房无法互通信息。

各囚徒都被要求坦白罪行。

如果两囚徒都坦白,各将被判入狱5年;

如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;

如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年。

（2）囚徒困境的策略矩阵表。

每个囚徒都有两种策略：

坦白或不坦白。

表中的数字分别代表囚徒甲和乙的得益。

囚徒乙

坦白

不坦白

囚徒甲

－5，-５

－1，－１0

-１０,-1

-２，-２

（３）分析:

通过划线法可知：

在囚徒困境这个模型中,纳什均衡就是双方都“坦白”。

给定甲坦白的情况下,乙的最优策略是坦白;

给定乙坦白的情况下,甲的最优策略也是坦白。

这里双方都坦白不仅是纳什均衡，而且是一个上策均衡，即不论对方如何选择，个人的最优选择是坦白。

其结果是双方都坦白。

（4）商业案例:

寡头垄断厂商经常发现它们自己处于一种囚徒的困境。

当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润。

但卡特尔协定不是一个纳什均衡，因为给定双方遵守协议的情况下,每个厂商都想增加生产，结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润。

2、用“小偷与守卫的博弈”说明“激励（监管）悖论”。

偷窃和防止偷窃是小偷和门卫之间进行博弈的一场游戏。

门卫可以不睡觉,或者睡觉。

小偷可以采取偷、不偷两种策略。

如果小偷知道门卫睡觉,他的最佳选择就是偷;

如果门卫不睡觉，他最好还是不偷。

对于门卫,如果他知道小偷

展开阅读全文