第二章完全信息静态博弈的基本理论祥解.docx

资源描述

第二章完全信息静态博弈的基本理论祥解.docx

《第二章完全信息静态博弈的基本理论祥解.docx》由会员分享，可在线阅读，更多相关《第二章完全信息静态博弈的基本理论祥解.docx（19页珍藏版）》请在冰点文库上搜索。

第二章完全信息静态博弈的基本理论祥解.docx

第二章完全信息静态博弈的基本理论祥解

第二章完全信息静态博弈的基本理论

0．完全信息（completeinformation）博弈与不完全信息（incompleteinformation）博弈

完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识；只要有一个参与人的支付函数不是该博弈的公共知识，就意味着该博弈是不完全信息博弈。

特别提示：

如果该博弈是完全信息博弈，这意味着参与人不仅知道自己是什么类型的人，也知道对手们是什么类型的人。

一．求解方法之一：

剔除严格劣策略

1.占优策略与劣策略。

严格占优策略与严格劣策略：

不管对手采取什么策略，如果参与人采取a策略所获得的支付严格大于b策略，则称a策略是相对于b策略的严格占优策略（strictlydominatingstrategy），b策略是相对于a策略的严格劣策略（strictlydominatedstrategy）。

弱占优策略与弱劣策略：

不管对手采取什么策略，如果参与人采取a策略所获得的支付不低于b策略，且至少有一种情况下的支付会严格大于b策略，则称b策略是相对于a策略的弱劣策略（weaklydominatedstrategy）；a策略则是相对于b策略的弱占优策略（weaklydominatingstrategy）。

占优策略就是我们平时所说的上策，劣策略就是我们平时所说的下策。

特别提示：

本文对占优策略的理解与其他教材不同，本文可以将以上述方式定义出来的占优策略称为局部占优策略；如果不管对手采取什么策略，如果参与人采取a策略所获得的支付严格大于其他所有策略，则称a策略是全局严格占优策略。

类似地，可以定义局部劣策略与全局劣策略。

理性的人在博弈时绝对不会选择严格劣策略。

通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。

2.案例

案例1

乙

坦白

不坦白

甲坦白

－6

－10

不坦白

－10

－1

案例2

乙

不作广告

作广告

甲不作广告

作广告

在上面的两个例子中，通过剔除严格劣策略，可以获得一个占优策略均衡（坦白，坦白），（作广告，作广告）。

3.请思考下面这个例子是否存在占优策略均衡？

甲在上与下之间作选择，乙在左中右之间作选择

乙

左中右

1，0

1，2

0，1

0，3

0，1

2，0

甲上

下

经过重复剔除严格劣策略，可以获得一个占优策略均衡（上，中），这就是求解方法之一——严格劣策略的迭代剔除方法。

思考：

占优策略均衡（上，中）是通过不断剔除严格劣策略而获得的，为了成功地进行剔除，需要什么样的前提条件？

由此可以理解公共知识的重要性。

4.思考：

下面这个博弈是否存在占优策略均衡？

假设甲乙两个参与人分别在上中下，左中右之间作选择：

乙

左中右

上

甲中

下

剔除严格劣策略并不适合于求解所有的博弈，许多博弈是不存在占优策略均衡的。

5．集体困境（dilemma）、合作与非合作博弈、占优策略均衡

（1）案例

案例1：

霍布斯博弈

假设鲁滨逊与星期五生活在一个自然状态之中。

为了生存，他们各自有两个选择：

自己生产财富或掠夺对方的财富。

博弈情形如下：

乙

生产

掠夺

甲生产

－2

掠夺

－2

－1

思考：

面对囚徒困境、广告博弈、霍布斯博弈，请思考如何解决社会困境？

（答案略；最低价格承诺实际上就是为解决寡头之间的串谋困境提供了有效的解决机制）

案例2：

1964年以前，美国香烟的电视广告非常普遍，1964年卫生总监的报告宣布以后，美国四大烟草公司经过协商与联邦政府达成协议，决定不再做电视广告，协议于1971年生效。

各大烟草公司的利润得以大幅增加。

（2）合作博弈与非合作博弈

A合作博弈：

参与人直接事先达成具有约束力的协议，以集体协商的方式选择策略，故又可称之为联盟博弈。

由此形成的策略选择与支付被称为博弈的合作解，通常以帕累托最优作为度量标准。

合作博弈其实就是指参与人在行动前能够实现进行沟通、交流，且沟通交流达成的协议是有约束力的。

B非合作博弈：

又称策略博弈，参与人以独立的方式选择策略。

由此形成的策略选择与支付被称为博弈的非合作解。

C一般所说的博弈论是指非合作博弈理论。

（3）集体困境与占优策略均衡

A集体困境的基本特征就是博弈的不合作解与合作解相悖。

B凡是存在集体困境问题的场合必定存在占优策略均衡，即集体困境问题是存在占优策略均衡的重要博弈类型。

C注意：

不要认为占优策略均衡都一定意味着集体处于困境之中。

以下面的政治博弈为例：

甲乙作为竞选的对手，分别有三种立场可以选择：

左中右；选民的分布是对称的；甲乙均追求选票最大化；具体的选票情况如下：

乙

5545

3070

5050

7525

5050

7030

5050

2575

4555

左中右

左

甲中

右

思考：

该博弈存在占优策略均衡吗？

该博弈存在集体困境吗？

从这个博弈可以看出，只有中间立场在政治上被充分表达，绝大多数的非中间立场的选民的立场被严重忽视。

（4）占优策略均衡在制度设计中有着广泛的应用价值。

二．求解方法之二：

最优反应法——符合理性人性质的方法，博弈论最重要的求解方法

1.最优反应策略：

给定其他所有参与人策略选择的情况下，能够给某参与人带来最大收益的策略，其思维过程为：

如果对手采用……，某参与人就应该采用……。

这是一种相对优势策略。

通过最优反应方法所获得的博弈解称之为纳什均衡。

2.如何寻找纳什均衡？

划线法（仅适合二人有限策略博弈）

案例1竞选博弈假设甲乙两个参与人分别在上中下，左中右之间作选择：

乙

左中右

上

甲中

下

思考（下，右）这个策略组合具有什么特点？

互相构成对对手策略选择的最优反应。

案例2选址博弈

甲乙两家百货公司考虑开店，可供选择的地址有四个：

市郊、市中心、城市东部、城市西部。

具体支付情况如下：

乙

市郊市中心城市东部城市西部

3040

5095

5595

55120

11540

100100

13085

12095

12545

9565

6040

115120

10550

7575

9595

3555

市郊

甲市中心

城市东部

城市西部

思考（市中心市中心）这个策略组合具有什么特点？

3.纳什均衡：

它是由全部参与人所选择的策略构成的这样一个组合，在这个组合中，每个参与人的策略都是针对其他参与人人策略选择的最优反应。

特别注意，均衡是针对策略组合的，而不是支付组合的，即在上面的博弈中，（下，右）才是均衡，（66）是这个博弈的均衡结果，不要把均衡与均衡结果混淆，这显然与微观经济学不同，在微观经济学中均衡是针对结果而言的。

4.关于纳什均衡的体会：

纳什均衡具有策略稳定性，在均衡状态之下没有人愿意单方面改变自己的策略选择，因此，纳什均衡具有自我实施特征。

特别说明：

策略稳定性不同于均衡稳定性。

5.纳什均衡与占优策略均衡

（1）占优策略均衡肯定也是纳什均衡，但是纳什均衡不一定是占优策略均衡。

（2）纳什均衡与占优策略均衡都是博弈的非合作解。

6.多重纳什均衡问题

（1）寻找下列博弈的纳什均衡

案例1节目选择博弈

甲乙两个电台各有三种节目形式可供选择，分别是摇滚乐、乡村音乐以及谈话节目

乙

摇滚乐乡村音乐谈话节目

3535

5040

8010

4050

2020

4010

1080

1040

摇滚乐

甲乡村音乐

谈话节目

案例2夫妻博弈

妻

足球

芭蕾

夫足球

芭蕾

－1

上述两个例子的共同特点就是存在多个纳什均衡，这是纳什均衡的最大缺陷，降低了纳什均衡解的预测能力，因为一旦参与人的预期不一致，就可能出现极为糟糕的结局。

（2）多重纳什均衡的精炼（refine）

所谓精炼就是通过附加另外的合理的标准，使得某些不合理的纳什均衡被剔除掉，以减少纳什均衡的个数，提高理论分析对现实的预测能力（因为纳什均衡只是涵盖了理性的一个方面：

最优反应）。

精炼方法之一：

寻找支付帕累托占优均衡

乙

推

不推

甲推

－10

不推

－10

通过比较发现，（推，推）在支付上帕累托优于（不推不推）

精炼方法之二：

寻找风险占优均衡

通过比较发现，在上面的博弈中，（不推，不推）在风险上优于（推推）

精炼方法之三：

寻找焦点（focus）或谢林点（schellingpoint）

所谓焦点就是指那些依据某种线索或信号（如：

历史、习俗、惯例、经验、自然或社会标志物）能够成为所有博弈参与人共识的纳什均衡。

特别说明：

一方面，习俗和惯例能够为多重纳什均衡提供解，另一方面，习俗和惯例的稳定性正在于它们是纳什均衡。

虽然依据某些线索或信号，某个纳什均衡更有可能发生，成为博弈的焦点，但是并不是所有存在多重纳什均衡的博弈都有焦点。

三．求解方法之三：

最大最小（maxmin）方法，一种非常保守稳健的方法

1.最大最小策略：

首先确定参与人在每一个策略下所能够获得的最小支付，在所有的最小支付中最大那个支付所对应的策略就是最大最小策略。

由所有参与人的最大最小策略所构成的策略组合就是博弈的最大最小解，

2.案例

案例1：

抢答博弈

乙

按

不按

甲按

－1

不按

－1

案例2：

开车博弈

乙

等待

前行

甲等待

前行

－50

3.最大最小解与纳什均衡的关系

（1）零和博弈与非零和博弈；常数和博弈与非常数和博弈

零和博弈：

在任何博弈策略组合下所有参与人的支付总和均为零。

非零和博弈：

在任何博弈策略组合下所有参与人的支付总和并不都是零。

常数和博弈：

在任何博弈策略组合下所有参与人的支付总和为一个常数，其实任何常数和博弈均可以转化为零和博弈。

非常数和博弈：

在任何博弈策略组合下所有参与人的支付总和不是一个常数。

（2）在常数和博弈中，最大最小解与纳什均衡解是一致的。

在非常数和博弈中，最大最小解与纳什均衡解可能不一致。

采用最大最小方法的逻辑在于无论我选择什么策略，对手的最佳反应是采取使我支付最低的策略，故这个方法特别适合于零和博弈。

特别注意：

最大最小方法并不适用于求解所有的零和博弈，如配硬币博弈就是一个例子。

案例：

配硬币博弈

乙

正面

反面

甲正面

－1

反面

－1

（3）当最大最小解与纳什均衡解不一致时，采用哪种方法更加合理？

一般来说，纳什均衡解更加合理，但是一旦存在多重纳什均衡且无法进行精炼，博弈存在极大的不确定性时，采用最大最小方法更加合理。

思考：

配硬币博弈是否存在纳什均衡？

乙

正面

反面

甲正面

－1

反面

－1

四．混合策略纳什均衡

1.在配硬币博弈以及儿童常玩的“石头、剪刀、布”一类的游戏中，按照我们前面给出的寻找纳什均衡的方法，不存在纳什均衡。

对这类游戏，人们的一个经验就是避免行为的规律性，随机地选择自己的策略，使得对手摸不着北，然后看能否凭运气击败对手，即使自己的策略选择具有不可预测性。

2.混合策略（mixedstrategy）与纯策略（purestrategy）

（1）混合策略：

参与人策略集上的概率分布，即参与人以随机方式选择策略。

假设参与人拥有两个策略，则混合策略可以写成（p,1-p）；假设参与人拥有三个策略，则混合策略可以写成（p,r,1-p-r）

（2）纯策略：

参与人以非随机的方式选择策略，其实，纯策略是一种特殊的混合策略。

纯策略其实就是指博弈矩阵旁边标示的策略，或者说参与人策略集中所包括的策略。

3．参与人的期望支付

（1）一旦参与人采取混合策略，参与人的支付就必须用期望支付来表示。

（2）一个实例：

计算甲乙参加配硬币博弈的期望支付

乙

正面

反面

甲正面

－1

反面

－1

假设甲选择正面的概率为p；假设乙选择正面的概率为q。

＝

＋

＝

（3）二人博弈中计算期望支付的一般公式

依据：

当对手正在进行随机选择时，他一定会选择这样的概率组合，使得我选择任意纯策略的期望收益均相等，从而使我无从下手，所以我也将进行随机选择，而且我选的概率组合也会使得对手无所适从。

于是所有参与人的混合策略就构成了一个纳什均衡。

4．混合策略纳什均衡

（1）混合策略纳什均衡是指这样一个策略组合，每个参与人的混合策略都是针对其他参与人所选择的混合策略的最优反应。

相应地，过去所说的纳什均衡就叫纯策略纳什均衡。

（2）如何计算混合策略纳什均衡？

案例1：

计算配硬币博弈的混合策略纳什均衡（答案略）

案例2：

计算夫妻博弈的混合策略纳什均衡，并且将混合策略均衡下参与人的支付与纯策略情况下的支付进行比较（答案略，注：

协调博弈下的混合策略纳什均衡是不稳定的，只要略为偏离该概率分布，参与人的最优反应策略就是纯策略）。

5.两个重要的结论：

纳什定理：

任何有限博弈均存在纳什均衡（博弈论最重要的结论之一）。

注：

有限博弈是指参与人的人数以及参与人的策略集均是有限的。

奇数定理：

博弈的纳什均衡一般是奇数个。

6.一个进一步的讨论问题：

我为什么要做随机选择？

这难道不是意味着我的放弃吗？

解释：

Harsanyi（1973）认为参与人混合策略的合理性在于当参与人i并不清楚参与人j究竟会选择哪个策略集中哪个纯策略，那么合理的假设也许是假设参与人j以随机的方式选择纯策略。

而参与人i并不清楚参与人j的实际选择，乃是因为参与人j拥有少量的私人信息（也可能是因为随机化（randomization））。

这个解释实际上是认为参与人j本身其实并没有玩混合策略，只是由于信息不对称的缘故，使得参与人i应该认为参与人j在玩混合策略。

五．求解纳什均衡的一般方法——反应函数法

1.博弈标准型表示的严格定义

n人博弈的标准型表示是，每个参与人的策略集

…

；每个参与人的支付函数（由可称效用函数）

…

；从而可以表示用G＝

…

；

…

。

其中，

可能是有限的，也可能是无限的，记

为

的一个具体策略；

的一般形式为：

…

。

练习：

请用上述一个定义表示囚徒困境，包括写出参与人的策略集以及支付函数。

2.案例：

古诺竞争模型

假设该市场上只有两家生产同一产品的企业1和2；市场均衡价格由下式决定：

，其中

，

、

分别代表企业1和2提供的产量；每家企业

的生产成本均为：

，且有

；两家企业同时选择自己的产量以最大化自己的利润。

问题：

两家寡头各自的最优产量应该是多少？

求解：

得一阶条件：

（1）

求解：

得一阶条件：

（2）

结合

（1）和

（2），解方程组有：

3.反应函数方法的一般做法

首先针对其他参与人的任意策略选择，找出能够使参与人

支付最大化的策略选择，即参与人

的反应函数（实际上就是参与人

的目标函数的一阶条件）；联立所有参与人的反应函数，解联立方程组，就可以求出该博弈的纳什均衡。

六．另一种纳什均衡的精炼方法：

颤抖手（trembling-hand）纳什均衡——1994年度诺贝尔经济学奖得主selten的贡献。

1.严格劣策略与弱劣策略的进一步比较

（1）案例：

案例1：

囚徒困境

乙

坦白沉默

－6；－6

0；－10

－10；0

－1；－1

坦白

甲

沉默

案例2：

竞赛项目选择博弈

乙

单杆双杆

7.6；7.6

8；8

7.6；8

7.4；8

单杆

甲

双杆

（3）一个非常重要的结论：

例子：

在选课博弈中，纳什均衡有哪些？

通过剔除弱劣策略所得到的结果是什么？

结论：

如果一个博弈存在纳什均衡，则通过反复剔除严格劣策略所得到的占优策略均衡与原博弈的纳什均衡相同，所以，通过反复剔除劣策略方法寻找均衡只能适用于严格劣策略。

反复剔除劣策略方法一般不适用于弱劣策略，因为无法保证剔除后所得到的均衡正好等于原博弈的纳什均衡。

能否有一种方法允许参与人剔除弱劣策略？

2.颤抖手均衡：

如果博弈中每个参与人都假定其他参与人会选择最优反应策略，但也有很小的概率犯错误，则每一位参与人都会选择期望支付最大的策略，由此获得的均衡称之为颤抖手均衡。

例子：

假设参与人在策略选择中有可能犯错误，但犯错误的概率比较小，而且这一事实是参与人博弈的公共知识。

例如，假设每个参与人有90％的可能性选择纳什均衡策略，但有10％的可能性不选择纳什均衡策略，计算甲乙选择不同竞赛项目的期望效用。

3.颤抖手均衡允许参与人选择弱优策略与最优反应策略，从而可以精炼纳什均衡。

实际上，颤抖手均衡属于对纳什均衡进行“确保安全检验”（thefail-safetest），为剔除弱劣策略提供了理由。

七．解决多重纳什均衡中协调问题的一种方法：

相关均衡（correlated）——诺贝尔经济学奖得主Aumann贡献（“公共知识”也是他的贡献）。

1.案例：

（源自Aumann）

乙

左右

5；1

0；0

4；4

1；5

上

甲

下

请求解该博弈所有的纳什均衡？

（上，左）、（下，右）以及每个参与人以相同概率选择各自的纯策略，各得期望支付2.5。

这是这个博弈的三个纳什均衡。

现在假设甲乙二人事先达成一个协议，甲乙猜拳，二人获胜的概率相同，如果甲赢，则甲选择上，乙选择左；如果乙赢，则甲选择下，乙选择右。

请计算在这个转化后的博弈中参与人的支付是多少？

甲乙二人有没有积极性违背这个实行约定的行动规则？

2．相关均衡是指参与人事先主动设计某种机制从而确定博弈结局的一种均衡选择，即通过参与人事先能够观测到的共同信号确定博弈的均衡结局。

3．对相关均衡的进一步体会

（1）相关均衡是通过改造原博弈形成新的均衡，即事先确定的博弈规则构成了一个纳什均衡。

（2）从前面的例子可以看出，相关均衡的结果具有公平性。

不对称纳什均衡来说，相关均衡的结果具有明显的优势，但是并不是说所有的相关均衡都具有公平性。

（3）相关均衡实际上就是参与人事先形成了一个联盟，以集体方式随机地选择策略，而且该联盟的集体策略是由每个人的最优反应策略构成的，即联盟的协定具有自我约束力。

（4）相关均衡是非合作博弈的一种新的解的形式，即相关均衡是非合作均衡。

相关均衡提高了联盟在非合作博弈中的地位。

在非合作博弈中，通常难以形成有约束力的联盟，但在存在多重纳什均衡的博弈中，联盟是有可能形成的，关键是联盟的协定要构成纳什均衡。

展开阅读全文

第二章 完全信息静态博弈的基本理论祥解.docx

第二章完全信息静态博弈的基本理论祥解.docx