博弈论知识点总结Word格式.docx

资源描述

博弈论知识点总结Word格式.docx

《博弈论知识点总结Word格式.docx》由会员分享，可在线阅读，更多相关《博弈论知识点总结Word格式.docx（35页珍藏版）》请在冰点文库上搜索。

博弈论知识点总结Word格式.docx

si（

s1,...,si,...,sn）上的效用函数Ui（s1,s2,⋯,sn）.

3、每位参与人定义在战略组合

扩展式博弈：

是博弈问题的一种规范性描述。

与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。

包含要素：

1、参与人集合{1,2,...,n}

类型完全信息静态博弈

2、参与人的行动顺序，即每个参与人在何时行动；

3、序列结构：

每个参与人行动时面临的决策问题，包括参与人行动时可供选择的行动方案、所了解的信息；

4、参与人的支付函数。

比较：

1、战略式博弈从本质上来讲是一种静态模型。

2、扩展式博弈从本质上来讲是一种动态模型。

5、博弈论分类：

按决策主体的行为相互作用时，当事人能否达成一个具有约束力的协议可分为：

1、合作博弈（强调团体理性、团体最优决策、效率）

2、非合作博弈（强调个人理性，个人最优决策）

按参与人行动先后顺序可分为：

1、静态博弈：

博弈中参与人同时行动，或者虽然不是同时行动，但是在行动前不知道其他参与人所选择的行动。

2、动态博弈：

参与人的行动有先后顺序，后行动者获得先行动者的行动信息。

按参与人对信息的掌握程度可分为：

1、完全信息：

每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的

了解，博弈开始时不存在不确定性因素。

2、不完全信息：

参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信

息，即存在着有关其他参与人的不确定性因素。

按决策主体对信息的掌握程度和行动的先后顺序，博弈可以分为：

完全信息静态博弈、

完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。

静态动态

完全信息完全信息静态博弈完全信息动态博弈

均衡：

纳什均衡均衡：

子博弈精炼纳什均衡

不完全信息不完全信息静态博弈不完全信息动态博弈

贝叶斯纳什均衡均衡：

精炼贝叶斯纳什均衡

6、根据所学这四种博弈的特点对这四种博弈做一个对比分析：

信息和行动特点

均衡

均衡类型

特别均衡

求解方法

学过的例子

性质

每个参与人对其

纳什均

纯战略纳

占优战略纳

箭头法

Hotelling价格竞

多重性和存

他所有参与人的

衡

什均衡

划线法

争

在性

特征、战略空间及

（PNE）

（DSE）

库诺特价格竞争

支付函数有精确

重复剔除的

不断剔除劣

一般一个博弈中

的了解，博弈开始

占有均衡

战略（弱劣

存在参与者有多

时不存在不确定

（IFDE）

战略的剔除

个行动时可以先

性因素，参与人同

顺序会影响

考虑能否剔除弱

时行动或者不是

均衡结果

战略简化博弈

同时行动但是后

混合战略

聚点均衡

支付最大化

社会福利博弈

行动者不知道行

纳什均衡

法

小偷－守卫博弈

动者的行动信息。

（MNE）

支付等值法

战略和行动相同。

完全信

在博弈开始之前

子博弈

息动态

参与人之间的信

精炼纳

博弈

息不存在不确定

什均衡

性，但是参与人行

动存在先后顺序。

在完全信息动态

博弈中，为了表示

息掌握关系，引入

了信息及的概念。

不完全

贝叶斯

信息静

态博弈

息存在不确定性，

但是参与人同时

行动或者不是同

时行动但是后行

动者不知道行动

者的行动信息。

不确定是参与人

的了性的不确定

性

子博弈精

有限次重复

与纳什均衡

连锁店悖论

炼纳什均

博弈均衡

的唯一性有

关

无限次重复

与贴现因子

囚徒困境（冷酷

有关

战略）

（无名氏定

无限期轮流讨价

理）

还价模型

一般博弈

逆向归纳法

斯坦科尔伯格寡

求解

头竞争

雇主与公会之间

的竞争

贝叶斯纳

对原混合战

性别战

（不完全信

略加入少许

息情况下纯

不确定性因

战略均衡的

素，求极限。

极限）

一般贝叶斯

Harsanyi转

机制设计

换

1、均衡结果是原博弈的

Nash均

衡；

2、同时在每一个

子博弈

上构成

1、均衡存在性

2、不确定性

体现为类型的不确定性

信息动

在博弈开始前参

精炼贝

信号传递

分离均衡

与人之间的信息

叶斯纳

存在不确定性，同

混同均衡

时参与人行动存

在先后顺序。

不完

准分离均衡

全信息动态博弈

过程不仅是参与

人选择行动的过

程，而且是参与人

不断修正信念的

过程。

根据所得信

信号传递博弈

不完全信息

息修正判断

不完全信息重复

动态博弈子

概率，根据

博弈与声誉

博弈精炼纳

收益最大化

Milgrom-Roberts

什均衡与海

决策

垄断限价模型

萨尼不完全

信息静态博

弈贝叶斯均

衡的结合。

二、四种博弈类型具体分述

1、完全信息静态博弈

1.1完全信息静态博弈特点：

每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解，博弈开始时不存在不确定性因素，参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。

1.2完全信静态博弈相关概念：

以新产品开发博弈举例说明：

参与人：

参与人1和2。

参与人的集合卡表示为：

Γ={1,2，⋯n}.表示所有参与人的集合，在新产品开发博弈中为：

Γ={1,2}

行动：

开发、不开发。

Ai表示参与人行动的集合。

新产品开发博弈中参与人的行动集合为A1=A2={a,b},其中a

为开发，b为不开发。

a={a1,a2⋯an}表示参与人的行动组合。

新产品开发博弈中为：

A={（a,a）,（a,b）,（b,a）,（b,b）}

战略：

参与人的行动规则。

在博弈中的战略可以定义为从观测集到行动集的映射关系，即：

Si:

Xi—Ai。

用Si={si}

表示参与人所有战略的集合。

在n人博弈中，用S=（s1,s2,s3⋯,sn）表示n个参与人的战略组合，它表示博弈中每个参与人采取战略si的一种博弈情形。

在完全信息静态博弈中，由于不存在决策时序上的差异，所有参与人在同一决策时点即

博弈开始的那一时刻决策，因此，所有参与人面临的决策情形都只有一种，所以，参与人的

战略集与行动集相同。

支付：

是指参与人在博弈中的所得。

一般情况下也是用效用函数来表示参与人在博弈中

的所得。

因此，参与人的支付就可表示为一种特定博弈情形下参与人得到的确定效用水平或

期望效用水平。

支付一般用ui（1,2,⋯,n）表示参与人i的支付（效用水平），支付组合u=（u1,u2,⋯un）

表示参与人在特定博弈情形下所得到的支付，其中为参与人i的支付。

因此，参与人

i=（i=1,2,⋯,n）的支付就可表示为：

ui=ui（si,s-i）.

信息：

是参与人所具有的有关博弈的所有知识，如有关其它参与人行动或战略的知识、有关参与人支付的知识等等。

在“新产品开发博弈”中，如果两个企业都知道市场需求，那

么这样的博弈情形就是我们前面所提到的完全信息假设；

如果两个企业中至少有一个不知道市场需求，那么这样的博弈情形就是我们前面所提到的不完全信息假设。

1.3纯战略纳什均衡

纯战略：

参与人在给定信息下只选择一种特定（或确定性）的战略

混合战略：

混合战略解释了一个参与人对其他参与人所采取的行动的不确定性，它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略。

纯战略纳什均衡中包括：

占有均衡、重复剔除劣战略均衡、一般纯战略纳什均衡等。

1、占优均衡

占优战略：

参与人的最优战略si*与其他参与人的选择

s-i无关。

无论其他参与人选择什

么战略，参与人的最优战略总是唯一的，这样的最优战略称之为“占优战略

”。

在n人博弈中，如果对于所有的其他参与人的选择

s-i，si*都是参与人

i的最优选择

ui（si*,si）ui（si,si）

则称si*为参与人的占优战略。

在n人博弈中，如果对所有参与人都存在占优战略

si*，则占优战略组合

si*=（s1*si2*,⋯,

sn*）称为占优战略均衡。

如果所有参与人都有占优战略存在，那么占优战略均衡就是唯一

的所有理性参与人可以预测到的博弈结果。

2、重复剔除劣战略

如果在一个博弈中，参与人不存在占优战略，但是参与人

i存在两个战略，其中一

ui（si

si）ui（si,si）

个战略叫另一个战略的所得效用要大，则理性的参与人绝对不会选择战略。

严格劣战略：

ui（si,si）ui（si,si）

u（si,si）ui（si,si）

弱劣战略：

若重复剔除过程一直可持续到只剩下唯一的战略组合，则该战略组合即为重复剔除的占优均衡，此时该博弈是重复剔除战略可解。

要点：

再重复剔除过程中，如果每次剔除的是严格劣战略，均衡结果与剔除顺序无关；

如果剔除的是弱劣战略，均衡结果可能与剔除顺序有关。

3、一般Nash均衡

Nash均衡是完全信息静态博弈的解的概念，

战略是不可剔除的，即不存在任何一个战略严格优于

在完全信息静态博弈中，

Nash均衡战略。

构成

Nash均衡的

求解纳什均衡的方法

划线法、箭头法。

划线法：

1、考察参与人

1的最优战略

2、用上述方法找出参与人2的最优战略

3、找出最优战略组合

箭头法：

1、对于每个战略组合，检查是否有参与人会偏离这个战略组合

2、直至找出没有参与人会偏离的战略组合

纯战略均衡反映函数：

各博弈方选择的纯策略对其他博弈方纯策略的反应。

1.4混合战略纳什均衡

在博弈

G{;

S1,...,Sn;

u1,...,un}

中，对任一参与人

i，设Si={Si

1,⋯,Si

k},

则参与人

i的一个混合战略为定义在战略集

上的一个概率分布

δi={δi1,⋯,δi

其中δij

（j=1,⋯,k）表示参与人i选择战略表示参与人i选择战略

的概率的概率，即δ

满足0≦δi

j≦1，其中概率之和为

1。

混合战略的支付为各种概率下收益的加权平均。

混合战略纳什均衡：

在博弈G{

;

S1,...,Sn;

u1,...,un}中，混合战略组合δi={δ1*,⋯,

δn*}为一个Nash

均衡。

当且仅当

i,有vi（i*,*

i）vi（i,*i）

。

混合战略Nash均衡的求解：

支付最大化法；

支付等值法；

混合战略均衡反映函数：

在混合策略的范畴内，博弈方的决策是选择概率分布，因此，

反应

函数就是一方对另一方选择的概率分布的反应。

聚点均衡：

在现实生活中，参与人可能使用某些被博弈模型抽象掉的信息来达到一个

“聚点”

这些信息可能与社会文化习惯、参与人过去博弈的历史有关。

不同均衡概念之间的关系：

占优均衡<

重复剔除劣战略均衡

纯战略纳什均衡<

混合战略纳什均衡

1.5纳什均衡的多重性与存在性

存在性：

每个有限战略式博弈（参与人与相应的战略集均为有限）

必存在纳什均衡，这个均

衡可能是纯战略纳什均衡，也可能是混合战略纳什均衡。

多重性：

一个博弈可能有多个均衡，

博弈论并没有一个一般的理论证明，

哪一个纳什均衡结

果一定能出现。

2、完全信息动态博弈

2.1完全信息动态博弈特点：

在博弈开始之前参与人之间的信息不存在不确定性，但是参

与人行动存在先后顺序。

在完全信息动态博弈中，为了表示参与人之间的信息掌握关系，引入了信息及的概念。

2.2完全信息动态博弈有关概念：

信息集：

信息集Ii是参与人i决策结的一个集合，它满足以下两个条件：

1、Ii中的每个决策结都是参与人i的决策结；

2、当博弈到达Ii时，参与人i知道自己处在该信息集中的某个决策结，但不知道是哪

一个。

在博弈树中，属于同一信息集的决策结一般用虚线连接起来。

结：

包括决策结和终点结两类。

决策结是参与人采取行动的点时点，终点结是博弈行动路

径的终点。

一个信息集可能只包含一个决策结，也可能包含多个决策结。

如果只包含一个决策结

的信息集就是但单结信息集。

如果博弈中所有信息集都是单结的则成为完美信息博弈。

子博弈：

是原博弈的一部分，它始于原博弈中一个单结信息集中的决策结x，并由决策结

x及其后续结共同组成。

1、子博弈可以作为一个独立的博弈进行分析，并且与原博弈具有相同的信息结构；

2、原博弈可以作为自身的一个子博弈；

2.3不完全信息静态博弈均衡——子博弈精炼Nash均衡：

解决Nash均衡多重性问题的一种主要方法就是精炼的方法，即在Nash均衡的基础上，

通过定义更加合理的博弈解并剔除不合理的均衡。

子博弈精炼纳什均衡的引入就是将那些包含不可置信威胁战略的纳什均衡从均衡中剔

除，从而给出动态博弈结果的一个合理预测。

即子博弈精炼纳什均衡要求均衡战略的行为规

则在每个信息集上都是最优的。

扩展式博弈的战略组合

足以下条件：

1、是原博弈的Nash均衡

（s1*,...,sn*），是一个子博弈精炼

Nash均衡，当且仅当满

2、在每一个子博弈上构成Nash均衡

一个战略组合是子博弈精炼Nash均衡当且仅当它对所有的子博弈（包括原博弈）构成

Nash均衡，同时也意味着原博弈的Nash均衡并不一定是子博弈精炼Nash均衡，除非它还

对所有子博弈构成Nash均衡。

2.4不完全信息静态博弈均衡求解——逆推归纳法

逆推归纳法是最常用的求解子博弈精炼Nash均衡的方法，其步骤为：

其中Γ（xi）代表博弈中由最底层到博弈起点的顺序，以Γ（x3）为最底层，则有：

1、找出博弈的所有子博弈；

2、按照博弈进程的“反方向”逐一求解各个子博弈，即最先求解最底层的子博弈，再求解

上一层的子博弈，......，直至原博弈。

由于逆推归纳法对各个子博弈逐一进行求解，因此，逆推归纳法所得到的解在各子博弈

上构成Nash均衡,即意味着逆推归纳法所得的解为子博弈精炼纳什均衡

2.5完全信息动态博弈中承诺行动的均衡结果分析：

承诺行动：

就是在博弈开始之前参与人采取某种改变自己支付或战略空间的行动，该行动使

原本不可信的威胁变得可信。

但是参与人的承诺行动是有成本的，否则这种承诺就不可信。

例子:

要挟诉讼

要挟诉讼就是指那种原告几乎不可能胜诉而其惟一的目的是希望通过私了而得到一笔

赔偿的诉讼。

该博弈的结果为原告选择不指控，

博弈结束。

博弈的结果似乎与人们观测到的

现实并不相符，因为现实中人们常常看到各种“要挟”发生。

在上述模型中，

“要挟”之所

以没有成功，关键在于原告将会起诉的威胁并不可信。

要是威胁变得可信，就必须采取承诺行动

（沉没成本）。

这样参与人的威胁就会变得可

信，从而使其他博弈参与人改变策略。

2.6

重复博弈议题：

1、将来可信的威胁或承诺如何影响到当前的行动

2、在一次博弈中无法实现的均衡，在重复博弈中能否实现

有限次重复博弈：

对于给定的阶段博弈

，令（）表示

重复进行T次的有限重复博弈，

并且在下一次博弈开始前，所有以前博弈的进程都可被观测到。

有限次重复博弈均衡结论：

如果阶段博弈G有唯一的Nash均衡，则对任意有限的

T，重复博弈G（T）有唯一的子

博弈精炼解，即G的Nash均衡结果在每一个阶段重复进行。

而且在有限次重复博弈中，

如果在单阶段博弈中均衡解不只有一个，

则对将来行动所作

的可信威胁或承诺可以影响到当前的行动。

无限次重复博弈：

给定一阶段博弈

G，令G（∞,

δ）表示相应的无限重复博弈，其中G

将无限次的重复进行，且参与人的贴现率为

对每个t，之前t-1

次阶段博弈的结果

在t阶段开始进行前都可以被观测到，每个参与人在

G（∞,δ）中的收益都是该参与人

在无限次的阶段博弈中所得收益的现值。

无限次重复博弈的解——无名氏定理：

令G为一个n人阶段博弈，令（e1,e2,⋯,en）为G的一个Nash均衡下的收益，且

用（x1,x2,⋯,xn）表示G的其它任何可行收益，

表示可行收益的集合。

若存在

ei,对i,xi

则存在贴现率δ，使无限重复博弈

G（∞,

δ）存在一个子博弈精炼

Nash均衡，其平均

收益可达到（x1,x2,⋯,xn）。

无名氏定理的解释：

在无限次重复博弈中，如果参与人具有足够的耐心（只要

满足

一定的条件），那么任何满足个人理性的可行收益向量都可以通过一个特定的子博弈精炼Nash均衡得到。

影响重复博弈结果的因素：

影响重复博弈结果的是重复的次数和信息的完备性。

2.7子博弈精炼Nash均衡与Nash均衡的区别：

由于子博弈精炼Nash均衡在任一决策结上都能给出最优决策，这也使得子博弈精炼纳

什均衡不仅在均衡路径（即均衡战略组合所对应的路径）上给出参与人的最优选择，而且在非

均衡路径（即除均衡路径以外的其它路径）上也能给出参与人的最优选择。

即子博弈精炼Nash均衡不会含有参与人在博弈进程中不合理的、不可置信的行动。

3、不完全信息静态博弈

3．1不完全信息静态博弈特点：

在博弈开

展开阅读全文