囚徒困境研究专题.docx

上传人:b****2 文档编号:2310033 上传时间:2023-05-03 格式:DOCX 页数:16 大小:62.94KB
下载 相关 举报
囚徒困境研究专题.docx_第1页
第1页 / 共16页
囚徒困境研究专题.docx_第2页
第2页 / 共16页
囚徒困境研究专题.docx_第3页
第3页 / 共16页
囚徒困境研究专题.docx_第4页
第4页 / 共16页
囚徒困境研究专题.docx_第5页
第5页 / 共16页
囚徒困境研究专题.docx_第6页
第6页 / 共16页
囚徒困境研究专题.docx_第7页
第7页 / 共16页
囚徒困境研究专题.docx_第8页
第8页 / 共16页
囚徒困境研究专题.docx_第9页
第9页 / 共16页
囚徒困境研究专题.docx_第10页
第10页 / 共16页
囚徒困境研究专题.docx_第11页
第11页 / 共16页
囚徒困境研究专题.docx_第12页
第12页 / 共16页
囚徒困境研究专题.docx_第13页
第13页 / 共16页
囚徒困境研究专题.docx_第14页
第14页 / 共16页
囚徒困境研究专题.docx_第15页
第15页 / 共16页
囚徒困境研究专题.docx_第16页
第16页 / 共16页
亲,该文档总共16页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

囚徒困境研究专题.docx

《囚徒困境研究专题.docx》由会员分享,可在线阅读,更多相关《囚徒困境研究专题.docx(16页珍藏版)》请在冰点文库上搜索。

囚徒困境研究专题.docx

囚徒困境研究专题

囚徒困境研究专题

第五章囚徒困境研究专题

一、囚徒困境为什么被关注?

囚徒困境是指如下的博弈

不合作

合作

不合作

2*,2*

1,4

合作

4,1

3,3

之所以囚徒困境被广泛的关注,不仅仅在于它由强大的解释力,如它可以解释企业竞争,应试教育困境,集体劳动悲剧等等,更重要的在于人们从中看到一个深刻的问题:

个体理性与集体理性的冲突。

哈丁的公共地悲剧(1968)

如何破解?

重复进行!

什么是重复博弈?

重复博弈指的是参与人之间进行多次相同的博弈,每个人所得收益为每次博弈的收益之和。

注意:

(1)这里的收益之和应该考虑贴现率。

(2)重复博弈分为有限次重复和无限次重复

有限次重复囚徒困境博弈的特征:

(1)完全但不完美信息,

(2)重复。

有限次重复囚徒困境的解,每步都“不合作”为纳什均衡。

二、无限次重复囚徒困境中的策略

两个参与人无限次地重复囚徒困境,每个人的收益为每次博弈所获收益之和。

在这样的博弈中因无最后一步,我们无法通过逆向归纳法来求解它。

无限次重复囚徒困境博弈及其各种策略分析:

触发策略:

参与人开始采取合作行动,若发现对方在某步采取“背叛”行动,参与人以后都采取背叛行动。

“永远合作”:

在每个囚徒困境博弈中均采取“合作”策略二无论对方采取什么策略。

一旦采取这个策略,对方的最优策略是每步均采取“背叛”策略。

在重复囚徒困境博弈中人们通过策略的变化或偏离进行学习的。

一旦人们的合作行动的偏离——无论这样的偏离是有意还是无

n与m取值为0到无穷大。

一个成功的策略含有:

“友善”:

第一步“合作”。

“报复”:

面对他人的“背叛”要有惩罚。

“宽容”:

若他人认识到错误、从“背叛”到“合作”,参与人要给他人机会。

这里的“报复”与“宽容”反映的是对他人的策略变化要有相应的变化,不同的人“报复”与“宽容”的程度能够不同。

能否通过先“背叛”而获得高分?

一旦背叛会面临对方的惩罚,因此能否得高分取决于他人的策略。

需要实验研究。

计算机模拟。

这里的策略分析针对的是固定的两个人之间进行固定重复囚徒困境博弈。

第一,如果两个人进行多个囚徒困境博弈,如何进行这样的博弈?

第二,如果参与人可更换?

如何进行?

三、两个参与人之间进行多个囚徒困境博弈。

我们考虑两个人甲和乙进行两个重复性的囚徒困境博弈,这两个囚徒困境博弈的进行存在先后。

怎样的策略才能获得最大的收益?

假定甲乙进行两个“不同的”重复的囚徒困境博弈A和B。

要说明的是,囚徒困境是一类博弈的模型,这里甲乙所进行的所谓不同的囚徒困境博弈,指的是两个这样的博弈。

此时存在很多策略,这里列出四种:

第一,“极度冷酷策略”。

在A囚徒困境博弈的某个阶段,甲采取“合作”策略,而乙采取了“不合作”策略,甲的收益降低,而乙的收益增加。

甲观察到了乙的不合作策略,甲如何行动呢?

甲可采取“冷酷策略”,即在与乙的该博弈中甲永远采取“不合作”策略。

甲也可采取“一报还一报”策略,即在下一步甲也将采取“不合作”,在以后的博弈阶段中,甲采取何种行动,取决于乙是否改正……

然而,对于甲,这是可能的,当乙采取了“不合作”策略,甲在该博弈的余下的阶段中,将永远采取“不合作”行动,并且在与乙的“其他的囚徒困境重复博弈”中也将采取“不合作”行动。

甲此时的这种策略是极端的“冷酷”,他对乙的态度是极度的不宽容。

某个参与人与他人进行多个重复囚徒困境博弈中,因对方在某个博弈的某个阶段采取了“不合作”,他在与对方的该博弈中将永远采取“不合作”,并且在与该对方的其他囚徒困境博弈中也毫无例外地采取“不合作”。

我们将这样的策略称为“极度冷酷策略”。

极度冷酷策略是极度不宽容的。

极度冷酷策略,是冷酷策略的拓展。

第二,“一码归一码策略”。

在某个博弈的某个阶段中,乙采取“不合作”,或者由上一阶段的“不合作”转变为“合作”,此时,甲或者采取“一报还一报策略”或者“冷酷策略”,但无论是那种策略,此时乙的行动,不影响甲在与乙的其他的重复的囚徒困境博弈中的策略选择。

也就是说,在与乙的其他的重复性的囚徒困境博弈中,甲的行动,依赖于乙在该博弈中的行动以及自己的策略(“一报还一报策略”或“冷酷策略”)。

此时,甲的策略可称为“一码归一码策略”。

一码归一码策略是宽容中性的。

第三,“主博弈策略”。

博弈参与人在所有的博弈中的行动选择都根据与对方的某一特定的博弈中的策略选择而进行。

如,A博弈是主博弈,甲在A囚徒困境博弈中采取的是“冷酷策略”,一旦乙采取了“不合作”,那么甲在与乙的其他所有博弈中都将采取“不合作”,这个策略的冷酷度比极度冷酷策略要低,因为乙在其他博弈中的“不合作”不必然触发甲在主博弈A中的不合作策略;若甲在A博弈中采取的是“一报还一报策略”,甲在其他博弈中的行动依赖于乙在A博弈中的行动。

主博弈策略是一个比较差的策略,因为若你一旦采取该策略,对方在除了主博弈之外的博弈中均会采取“不合作”,主博弈之外的博弈中你的收益都将很低。

主博弈策略不如一码归一码策略,但是尽管如此,该策略简单,而一码归一码策略相对复杂,现实中的人们往往使用主博弈策略。

主博弈策略也是宽容中性的。

第四,统计策略。

若在所有博弈中对方过去“合作”次数低于某个比例,某个参与人在以后的博弈中一律采取“不合作”策略;或者若在所有博弈中对方过去采取的总的“合作”次数高于某个比例,他将一律采取“合作”策略。

这样的策略可称为“统计策略”。

统计策略是否宽容依赖于参与人对对方的“合作”或“不合作”的比例要求。

这四种策略中除了一码归一码策略外,参与人均因对方在某个博弈中的“不合作”或“合作”行动而影响另外博弈中的行动选择。

结论1:

重复的囚徒困境博弈中,最优策略是一码归一码策略。

证明:

某个参与人甲若不使用一码归一码策略,那么必定存在某个博弈的某个阶段,甲的行动选择依赖于其他博弈,而不依赖于对方即乙在该博弈中的行动选择。

理性的乙知道这些,他在该博弈中的该阶段将采取“不合作”,此时,乙的收益增加,而甲的收益降低。

因此,甲的策略应当是根据该博弈而不是其他博弈。

在所有的博弈中甲均应采取不依赖于其他博弈的行动而行动。

因此,最优策略是一码归一码策略

在每个博弈中分别采取一报还一报策略是一码归一码策略的特例。

结论2:

在重复的囚徒困境博弈中,若一报还一报策略是最优的策略安排,那么在多个重复的囚徒困境博弈中,每个博弈均采取一报还一报策略是最优的。

证明:

在确定的有n个囚徒困境博弈中,参与人的收益为这n个博弈中的收益之和,若在每个重复性的囚徒困境博弈中一报还一报策略收益最大,那么在总的博弈中该参与人的总收益最大。

这个结论不是说,在与固定的博弈参与人进行多个重复性的囚徒困境博弈中,参与人在每个博弈中均采取一报还一报策略是最优的,而是说,若在每个博弈中一报还一报策略是最优策略,所有博弈中该策略之采取也是最优策略。

因为,博弈论专家只是用计算机进行比赛,一报还一报策略是胜出策略,然而它是否是最优策略并没有得到证明。

是否存在其他的比一报还一报策略还好的策略,人们不得而知。

这是本人分析出的理论上的结论。

在现实中人们并不一定能够做到这一点。

现实中人们往往是如何进行这样的博弈呢?

在现实中的博弈参与人,无论是个人,还是组织(如国家),因某种原因而交恶,即在某个博弈中(不一定是囚徒困境博弈)双方永远处于斗争或不合作的状态,这种状态影响到其他领域里的博弈策略。

在其他领域里他们也采取不合作策略。

例如,两国政治上的不合作致使经济上两国也采取不合作,或者经济上的不合作导致政治上的不合作。

这其实不是一个最优选择。

四、可更换参与人的囚徒困境博弈分析

进行囚徒困境的两个参与人是确定的:

参与人不可选择对手进行囚徒困境博弈,更不可中途中止该博弈而与其他人重新进行该博弈

若参与人能够更换与之博弈的参与人,即存在多个备选的囚徒困境博弈参与人,情况将如何?

这是可能的:

你与他人的博弈中突然主动使用“不合作”即背叛,你的收益将得到提高,并且你终止了与对手的博弈,而选择新的博弈参与人与其博弈,对方的“报复行动”将无法使用,即他人无法对你的不合作行为进行惩罚。

此时我们说,你使用了“永久性背叛”策略。

在与新的博弈参与人的博弈中,你如法炮制。

因你的这种策略是新的对手所不知道的,与新的对手进行博弈时,你的每次收益都会很高……在一个规模较大的群体中,并且这个群体中的绝对多数人都会采取合作策略,或在第一步都会采取合作策略,你采取这样的策略能够获得高收益,因为你能够从背叛中收益并不被惩罚。

在多个备选参与人进行博弈中,某个参与人何时选择“永久性背叛”为“耐心程度”:

耐心程度最低的人,在与他人进行重复的博弈中第一次就采取“不合作”;具有一定耐心程度的人会在一定步骤之后采取“不合作”;具有最大耐心程度的人永远不采取“不合作”。

在多个备选参与人进行博弈时,某个参与人何时选择“永久性背叛”策略即他的耐心程度高低取决于:

与他进行这样博弈的备选人群数量与信息沟通程度。

若备选人群数量大,并且之间的信息沟通少,他的耐心度低;其中极端情况是,人群数量无限大,或者人群数量尽管不是无限大,但足够大,并且这些人群之间没有信息沟通。

此时,即使他每次均采取不合作,都存在下一个与之博弈并采取合作的“傻瓜”。

若备选人群的人数少,或者备选人群之间的信息沟通程度高,他的耐心度将是高的。

一个极端情况,与之博弈的只有一个博弈参与人,他要顾及到若他采取“不合作”,他将面临对方的不合作行动的惩罚;若他采取“永久性背叛”,对方也将采取永久性背叛。

这便是阿克斯罗德所研究的情况,阿克斯罗德的结论是适用的。

若与之博弈的参与人即使数量比较大,若他们之间的信息沟通充分,该博弈参与人也不敢采取永久性背叛策略,因为此时若他采取永久性背叛策略,并与新的参与人进行博弈,新的参与人知道他国去的“不光彩”行为,该新的对手在第一回合的博弈中会以“不合作”而对之,即新的博弈参与人将延续原来的参与人与之进行博弈。

因此,在信息充分扩散的情况下,博弈参与人不会随意更换博弈参与人的。

 

4.囚徒困境与文明

作为人类群体是如何走出囚徒困境的?

文明体现在群体理性。

文明新理解:

文明是对不断产生的集体行动悲剧与克服。

上面我们说过,在囚徒困境中若存在一个“集体”,囚徒困境便能够消解,但实际上是不存在一个像我们每个人那样的个体。

然而,社会在面临囚徒困境时会朝向形成“集体”的方向努力,逐渐形成一个“类参与人”的集体,以克服个体理性的局限。

我们往往说,人类的理性是有限的,这指的是我们每个人的理性能力是有限的,这种有限性往往指的是计算能力的有限。

然而,上述囚徒困境博弈中,博弈论专家发现,群体陷入困境中,而原因不在于个理性的有限性所造成,即不是理性不足造成,而是理性本身造成的。

有人可能认为,这似乎只是一个模型,因而所谓理性的困境只是理论家的纯粹杜撰。

但这样的困境我们随时可见。

企业为了打跨其他同行企业,每个企业竞相降价、倾销,结果是自相残杀;每个国家都无节制地向空气中排放温室气体,以至于温室效应越来越严重;冷战时期美苏两霸的军备竞赛使人类走到危险的边缘……

这些事例都是自利的理性造成的群体困境,在这些事例面前,你还认为,理性的局限是理论家编制出来的耸人听闻的观点吗?

你是否已经开始对理性本身进行反思呢?

我们发现,理性并没有那么完美,然而,如果理性不能成为人类发展的保证,人类物种何以如此繁荣?

经过漫长的岁月,人类与动物相比,已经具有了绝对的竞争优势,成为主宰地球的主人。

这一切被认为是人类的理性之功。

但我们发现,理性存在缺陷。

因此,人类走到今天,成为地球上的主宰,必定存在对理性缺陷的“补救措施”!

那么,这个补救的措施是什么呢?

我们说的理性表现为参与人为自己的目标所进行推理或计算。

这里的理性是个体的。

因此,对个体理性的缺陷的补救措施,我们不能从个体那里去找,而只能在个体之外的地方去找!

这个措施在哪里呢?

我们说存在于群体之中。

具体地说,它就是存在于群体中的对个体行动进行规范的道德和法律。

人人都清楚,若对偷窃没有任何约束措施的话,偷窃获取生存物品比通过劳动来得容易;假若人人都偷窃的话,社会将无可偷窃的物品,因为没有人愿意生产。

这样的社会当然不能够维持下去。

偷窃是暗中进行的,任何体弱的人都能够从事,抢夺则是强大者对弱小者所实施的货物转移行为。

假若没有对抢夺进行惩戒,强大者将实施抢劫,弱小者将锻炼自己的体能或制造武器以弥补体能的不足,准备实施抢夺。

在没有对“偷窃”和“抢夺”进行约束的情况下,“偷窃”和“抢夺”都是占优行动,没有人愿意耕种,没有人愿意放牧……人们不愿意耕种和放牧而愿意偷窃和抢夺,其结果是每个人的生存状态都很糟糕。

这便是一个“社会困境”。

“偷窃”和“抢夺”是发生于社会之中的困境,没有他人便没有偷窃和抢夺:

偷窃和抢夺是理性计算后的选择。

理性产生的问题要让理性本身来解决,当然这不是让某个人的理性来解决,而让群体的理性来解决。

今天,我们认为抢夺和偷窃是不道德的,这样的观念是我们这个社会向前发展所不可缺少的。

我们想象不出存在这样的社会,在这个社会之中人们没有这样的观念;因为一个社会若没有这样的观念,它很快就会消亡。

然而这样的观念不是人类天生就有的,这样的观念是伴随社会的建立而产生的。

婴儿看到食物自然地会去取,当他饿了,他会毫不犹豫地从其他婴儿那里进行抢夺。

人类之初如同婴孩。

婴孩是没有道德观念的,道德观念是从父母、社会中学习得来。

人类呢?

似乎是,人类的道德观念是从人心中逐渐“生长”出来的,但这种生长过程只有在社会之中才有可能,因为道德观念是群体概念,在一个人的世界里永远不可能产生道德观念。

有了认为“偷窃”和“抢夺”行为是不道德的这样的观念,并不代表这样的社会困境将永远不发生。

抢夺和偷窃随着时代的变化其形式也随之改变,因而抢夺和偷窃几乎存在于任何一个时代。

比如,四百年前由葡萄牙、西班牙开始的所谓地理大发现,其实是一个西欧对全世界所进行的抢夺行为。

计算机发展起来后,不征得他人同意也不支付他人费用就使用他人的劳动成果——软件,便是偷窃行为。

因此,偷窃和抢夺在不同时代有不同的表现形式。

文明便是想方设法克服这些偷窃和抢夺行为。

然而,不是说社会困境都可归结为偷窃和抢夺,存在不同类型的社会困境。

如:

公共地悲剧便是这样的一个群体困境——群体对一个无权属的公共资源的过度获取。

吐痰、乱丢垃圾等也是这样的群体困境——群体将“成本”加到公共领域从而强行加于每个人。

当然你也可以认为这是广义的偷窃或抢夺行为。

若我们观察社会的发展过程,社会对所产生的社会困境有一个独特的机制。

这个机制是:

“社会困境”的产生——社会困境的认识——形成针对性的道德规范或/和形成法律——控制或解决社会困境——产生新的社会困境……

不同自然和社会环境条件下,群体困境能够是不同的,当某个具体的群体困境在某个群体中产生后,并且群体中的人认识到群体行动的困境,相应的道德观念便产生了,一旦它成为公共的道德观念,它便成为该群体的行为约束力量。

然而,这样的力量往往是弱小的,效率低下的。

相应的法律以及相应的执行机构便是解决群体困境的强有力的方法。

法律是强制性的行动规范,若不遵守,违反者便面临相应机构的惩罚。

一个群体能够通过对困境的认识形成克服困境的有效方法,使群体维持下去。

然而,这些方法只对群体成员有效。

对敌人,我们还要遵守“不偷盗”、“不杀戮”、“不抢劫”等道德训诫吗?

当然不需要。

在群体内部的那些道德训诫和法律均失去效力了。

群体间的行动困境便产生了,群体间的困境同样能够在群体间的更大的群体得到克服。

因此,人具有理性,但人的理性的伟大不在于个人的理性而且在于群体理性。

五、俄狄浦斯悲剧的消解

群体理性同样体现在“父辈”与“子辈”的博弈之中。

父辈与子辈是怎样的一个关系呢?

若资源是有限的,获取资源的参与人的增加将使原来的参与人的收益下降。

因此,在资源有限的情况下,人们的理性行为表现为:

一方面试图使现有的竞争对手退出争夺现有资源的行列,另外一方面试图将潜在的竞争对手消灭在萌芽状态。

对于人类而言,上代是后代的竞争对手吗?

在某些情况下是的。

上代消耗多了不可再生资源,留给后代就少了;父辈老了,他们不能耕种,但他们还在消耗后代的资源……

后代是上代在资源上的竞争对手吗?

在某些情况下,后代确实是上代的竞争对手,但是“潜在的”竞争对手。

皇位只有一个。

皇子们觊觎父亲的皇位,对身体强壮的父亲充满敌意,弑父篡位在历史中屡见不鲜。

皇帝时刻提防着逐渐长大成人的皇子们,历史上皇帝杀掉跃跃欲试的儿子也不在少数。

皇帝不仅拥有控制一切财富的权力,而且拥有女性资源的权力;皇子之间的倾轧以及作为皇帝的父亲与皇子之间的猜忌均是为了这个权力而来。

古希腊戏剧中俄狄浦斯的“弑父娶母”悲剧所反映的未必是真实的事情,但反映了人类“父辈”与“子辈”之间的冲突性的常和博弈:

父亲拥有一切资源,逐渐长大的儿子们试图争夺这个资源。

然而,若父辈与子辈之间的关系是这样的冲突性关系,那么强有力的父亲将会将儿子们杀死在襁褓中,以消灭潜在的竞争对手;若儿子们逃过父亲杀戮,他们将向父亲开战。

但事实上没有发生这样的杀戮:

无论是杀子还是弑父都是鲜见的现象。

俄狄浦斯的悲剧是“偶然”发生的。

弗洛伊德所认为,人类拥有俄狄浦斯情结,儿童长大过程是一个对父亲权威进行挑战的过程,这包括拥有母亲。

我想这不仅体现在个别的儿童成长过程中,更体现在“父辈”和“子辈”的两代人的无意识的博弈之中。

之所以没有发生弑父或杀子现象,是因为“爱”,包括父对子的爱,也包括子对父的爱。

爱是自然的造化,它是生物的本能。

不仅人类有爱,动物也有爱。

人们常说“虎毒不食子”就反映了动物对子女的爱,是“爱”克服了父子之间以及儿子们之间的冲突。

对于人类而言,还有动物所没有的“德”。

德是对行动的规范或规定,它生成于有理性的人群之中。

儒家学说强调晚辈对长辈的“孝”,即以礼侍奉长辈;忤逆是一大罪;同时每个人对祖宗、家族的一大孝道是:

繁衍下一代,所谓“不孝有三,无后为大”说的是最大的不孝是没有后代。

这种孝的规定限制了晚辈与长辈之间可能的冲突性的关系。

爱是自然所赐予人的本能,德则是社会中逐渐形成的,它们共同形成使父子合作的力量,这种力量当然是有限的。

当一个常和博弈格局出现在父子的面前时,爱和德行都将失去力量,儿子们之间会剑拔弩张,儿子和父亲之间也会反目成仇。

爱和德能够阻止没有出现的或可能的冲突,而不能阻止眼前的或现实的冲突。

爱和德所掩盖的是人类赤裸裸的本能。

父辈对儿子们的压迫以及长大后的儿子们对父亲的剥削和放逐。

父亲和儿子的这种冲突潜藏在我们的无意识之中。

社会的发展是建立在对父辈们的不断掠夺之上的。

掌握权力的父亲们制定政策最大化自己未来的利益,儿子们是“受保护”的角色;而一旦儿子们长大后,便用修改父亲们所制定的政策或制定新的政策(如通货膨胀)掠夺逐渐退出历史舞台的父辈们的利益。

六、“集体恶习”的破除

某种行为是某个较大群体中的所有成员或大多数成员所经常采取的行为,我们称该行为为集体性行为。

如祭拜祖先是中国人的集体性行为,春节回家也是中国人集体性的行为。

行动与行为存在区别。

行动是理性的,并且主体往往经过深思熟虑后采取的。

行为可能的理性的,也可能是非理性。

有些行为是下意识的。

若某个群体长期形成的构成其“习惯”的某个集体性的行为,对群体的生存没有益处而只有害处,并且群体中的成员认识到它的危害,但不能克服或改正的这些行为,此时我们称这种行为是该群体的“集体恶习”。

某种集体恶习是群体中所有人或多数人采取某种恶习所形成的。

我们周边经常见到的这样的集体恶习有:

随地吐痰,随意闯红灯,不守信用,等等。

集体恶习是特殊的囚徒困境。

对于一个群体中的人们,每个人有两种行动:

合作,和不合作。

或者更一般地说,A行动,~A行动,他们构成人们在某种情景下的完备行动,群体中的人在这两个行动中选择一个。

所有人都选择“合作”,我们称之为“共同合作”,若所有人都选择“不合作”,我们称为“共同不合作”,若有人选择“不合作”、有人选择“合作”,我们称为“混同行动”。

当一群人进行囚徒困境博弈时,对每个人而言,最优的选择是无论他人选择什么,他的选择是“不合作”。

纳什均衡是每一个人都选择背叛,即“共同不合作”是博弈结果。

我们看到,无论是“共同合作”的人群和“混同行动”的人群,这样的群体的博弈结果是不稳定的,即很快都达到“共同不合作”。

对于这个群体,“共同合作”时每个人的收益都好于“共同不合作”。

在“混同行动”中,群体成员的“平均收益”介于“共同合作”和“共同不合作”时每个人的平均收益之间,而偏离值取决于选择共同合作和共同不合作的人数比率。

“共同合作”的博弈结果尽管对群体的每个人其结果都好于“共同不合作”,但这样一个状态是难以实现的。

这是群体进行囚徒困境博弈的结果。

若一个群体进行这样的博弈,所有人选择“不合作”的结果是糟糕的结果(当然不是“恶果”),并且群体中的所有人意识到“不合作”的糟糕结果,但该群体长期不能克服这个困境。

“共同不合作”成为群体的一个行动习惯,我们称这样的囚徒困境为“集体恶习”。

当然,我们不排除一个囚徒困境博弈中存在采取“合作”行动的少数人。

因此,我们放松一下条件:

一个群体存在集体恶习,是指在某个囚徒困境博弈中群体大多数人或有高比例的人采取不合作行动。

我们用“集体不合作”代替“共同不合作”。

即集体恶习来自于群体成员长期形成的“集体不合作”。

上文中我表明,群体存在一个克服囚徒困境的机制,即群体对囚徒困境的认识之后所产生的道德认知,每个人根据这个道德认知约束自己的行为、评价他人的行为,即德行是克服囚徒困境之力。

同样,德行是克服集体恶习的方法。

集体恶习是群体的不文明。

群体对该恶习有一个认识过程。

一旦群体认识到,该恶习对群体有害,群体便形成了道德评价。

这样的道德评价便构成一个对集体恶习进行克服的力量。

然而,德行之力是有限的。

发生集体恶习现象即表明此时德行之力失效:

群体中的每个人都认为“不合作”是不道德的,但每个人都在采取“不合作”,其内心的的道德感不足以规范其行为。

之所以如此每个人或大多数人认识到该行为是一个恶习,但不能改正,是因为自己从该行为中能够获得“轻微的好处”。

集体恶习之存在而没有被立即改正,我想,是因为这样的恶习尽管影响群体的生存状态,但没有危及群体的生存。

群体还没有感觉到它是一个严重的群体困境。

一旦集体恶习严重威胁到群体的生存时,群体就会产生克服的措施。

集体恶习终究能够被群体所克服,但这是一个长期的过程。

酒驾(张明保)。

七、对话以解决“我们的”问题

个体理性困境的克服取决于能否有重复博弈的可能,而克服困境的方法因囚徒困境参与人的“规模”的不同而不同。

上文已经说明若囚徒困境的参与人规模最小——只有两个人,这两个人能够在重复性博弈中实现合作(若无重复博弈的可能,囚徒困境博弈难以解开)。

若参与人的规模较大,一个约束参与人的道德和法律能够在参与人的群体中“自然地”产生,一般地说,道德和法律都是群体为了克服群体困境而主动产生的。

但当进行囚徒困境博弈的参与人群体的规模超过两个人但“不很大”,这样的群体如何解决呢?

我们说,该群体能够通过“对话”来实现,群体通过对话达到的是“交互理性”。

当困境出现在某个群体面前时,群体的成员认识到该困境为群体所面临的一个“疑难”,这是困境被克服的前提。

一旦困境被认识到,它就不必然成为悲剧。

当然,困境要被消除,光有认识还是不够的,还必须有足够的时间让群体去思考、探索解决之道。

困境中的参与人认识到困境之后,通过“对话”、寻求建立约束各自行动的规范从而走出囚徒困境,从而实现群体理性。

若一个囚徒困境的参与人众多,参与人进行协商的难度较大,成本太高,协商是难以进行的。

当参与人数有限的时候,该方法是一个可行的方法。

如目前各个国家面临气候变暖的问题,这是由各个国家长期地、无节制地向大气中排放温室气体造成的,这是一个个体理性造成的囚徒困境。

有识之士认识到这个问题,并且认为这是它是

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2