博弈论百度百科.docx

上传人:b****5 文档编号:14431913 上传时间:2023-06-23 格式:DOCX 页数:23 大小:46.74KB
下载 相关 举报
博弈论百度百科.docx_第1页
第1页 / 共23页
博弈论百度百科.docx_第2页
第2页 / 共23页
博弈论百度百科.docx_第3页
第3页 / 共23页
博弈论百度百科.docx_第4页
第4页 / 共23页
博弈论百度百科.docx_第5页
第5页 / 共23页
博弈论百度百科.docx_第6页
第6页 / 共23页
博弈论百度百科.docx_第7页
第7页 / 共23页
博弈论百度百科.docx_第8页
第8页 / 共23页
博弈论百度百科.docx_第9页
第9页 / 共23页
博弈论百度百科.docx_第10页
第10页 / 共23页
博弈论百度百科.docx_第11页
第11页 / 共23页
博弈论百度百科.docx_第12页
第12页 / 共23页
博弈论百度百科.docx_第13页
第13页 / 共23页
博弈论百度百科.docx_第14页
第14页 / 共23页
博弈论百度百科.docx_第15页
第15页 / 共23页
博弈论百度百科.docx_第16页
第16页 / 共23页
博弈论百度百科.docx_第17页
第17页 / 共23页
博弈论百度百科.docx_第18页
第18页 / 共23页
博弈论百度百科.docx_第19页
第19页 / 共23页
博弈论百度百科.docx_第20页
第20页 / 共23页
亲,该文档总共23页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

博弈论百度百科.docx

《博弈论百度百科.docx》由会员分享,可在线阅读,更多相关《博弈论百度百科.docx(23页珍藏版)》请在冰点文库上搜索。

博弈论百度百科.docx

博弈论XX百科

博弈论

  

约翰·冯·诺依曼

博弈论的概念

  博弈论又被称为对策论(GameTheory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。

在《博弈圣经》中写到:

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。

按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的RobertAumann教授的说法,博弈论就是研究互动决策的理论。

所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。

  博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。

此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。

  按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。

不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiralgametheory)也日益兴起。

博弈论的发展

  博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的的学科。

博弈论的基本概念

  博弈要素:

  1.决策人:

在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。

(博弈圣经)

  2.对抗者:

在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。

他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。

(博弈圣经)

  3.生物亲序:

所有生物在恶劣、未知的环境中都有寻找规律和有序的本能。

在博弈中指参与者有从混乱的环境中等待、寻找有序的亲近行为。

(博弈圣经)

  4.局中人(players):

在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。

只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。

  5.策略(strategiges):

一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。

如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。

  6.得失(payoffs):

一局博弈结局时的结果称为得失。

每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。

所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。

  7.次序(orders):

各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。

  8.博弈涉及到均衡:

均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。

在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。

所谓纳什均衡,它是一稳定的博弈结果。

  纳什均衡(NashEquilibrium):

在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

也就是说,此时如果他改变策略他的支付将会降低。

在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。

所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。

这一结果对局中人B亦是如此。

  这样,“均衡偶”的明确定义为:

一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:

偶对(a,b*)≤偶对(a*,b*)≤偶对(a*,b)。

  对于非零和博弈也有如下定义:

一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:

对局中人A的偶对(a,b*)≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。

  有了上述定义,就立即得到纳什定理:

  任何具有有限纯策略的二人博弈至少有一个均衡偶。

这一均衡偶就称为纳什均衡点。

  纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。

通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。

  纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。

  但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。

  塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:

子博弈完全均衡和颤抖的手完美均衡。

博弈的类型

  

(1)合作博弈——研究人们达成合作时如何分配合作得到的收益,即收益分配问题。

  

(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。

  (3)完全信息不完全信息博弈:

参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。

  (4)静态博弈和动态博弈

  静态博弈:

指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。

  动态博弈:

指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。

  财产分配问题和夏普里值(Shapleyvalue)

  考虑这样一个合作博弈:

a、b、c、投票决定如何分配100万,他们分别拥有50%、40%、10%的权力,规则规定,当超过50%的票认可了某种方案时才能通过。

那么如何分配才是合理的呢?

按票力分配,a50万、b40万、c10万c向a提出:

a70万、b0、c30万b向a提出:

a80万、b20万、c0……

  权力指数:

每个决策者在决策时的权力体现在他在形成的获胜联盟中的“关键加入者”的个数,这个“关键加入者”的个数就被称为权利指数。

  夏普里值:

在各种可能的联盟次序下,参与者对联盟的边际贡献之和除以各种可能的联盟组合。

  次序abcacbbacbcacabcba

  关键加入者acacab

  由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6

  所以a,b,c应分别获得100万的2/3,1/6,1/6。

博弈论的意义

  弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样,都是从复杂的现象中抽象出基本的元素,对这些元素构成的数学模型进行分析,而后逐步引入对其形势产影响的其他因素,从而分析其结果。

  基于不同抽象水平,形成三种博弈表述方式,标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。

因此,它被称为“社会科学的数学”从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而实际上正深入到经济学、政治学、社会学等等,被各门社会科学所应用。

  博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博弈论是个非常重要的理论概念。

  什么是博弈论?

古语有云,世事如棋。

生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。

博弈论是研究棋手们“出棋”着数中理性化、逻辑化的部分,并将其系统化为一门科学。

换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。

事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。

数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。

这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:

若假设双方都精确地记得自己和对手的每一步棋且都是最“理性”的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…

  面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?

现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。

对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。

在这里抽象化后的博弈问题是,已知参与者集合(两方),策略集合(所有棋着),和盈利集合(赢子输子),能否且如何找到一个理论上的“解”或“平衡”,也就是对参与双方来说都最“合理”、最优的具体策略?

怎样才是“合理”?

应用传统决定论中的“最小最大”准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对于每一个二人零和博弈,都能够找到一个“最小最大解”。

通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。

当然,其隐含的意义在于,这套最优策略并不依赖于对手在博弈中的操作。

用通俗的话说,这个著名的最小最大定理所体现的基本“理性”思想是“抱最好的希望,做最坏的打算”。

  博弈论--这是一个热得烫手的概念。

它不仅仅存在于数学的运筹学中,也正在经济学中占据越来越重要的地位(近几年诺贝尔经济学奖就频频授予博弈论研究者),但如果你认为博弈论的应用领域仅限于此的话,那你就大错了。

实际上,博弈论甚至在我们的工作和生活中无处不在!

在工作中,你在和上司博弈,也在和下属博弈,你也同样会跟其他相关部门人员博弈;而要开展业务,你更是在和你的客户以及竞争对手博弈。

在生活中,博弈仍然无处不在。

博弈论代表着一种全新的分析方法和全新的思想。

  诺贝尔经济学奖获得者包罗·萨缪尔逊如是说:

  要想在现代社会做个有价值的人,你就必须对博弈论有个大致的了解。

  也可以这样说,要相赢得生意,不可不学博弈论;要想赢得生活,同样不可不学博弈论。

  博弈论很深奥吗?

通过本教材你将发现深奥的博弈论原来也可以这么生动、通俗和易懂。

大量的案例、平实的语言,将帮助你轻松掌握博弈论这个今天最时髦的工具。

  《博弈圣经》中也说到:

21世纪,应站在博弈论的前沿。

尽管博弈经济学家很少,但其获诺贝尔奖的比例最高。

最能震动人类情感的是博弈,对未来最有影响力的还是博弈。

评论一个人和一个国家的穷富,就看他分享博弈正理的多少。

  可见博弈之重要。

  经济学中的“智猪博弈”(Pigs’payoffs)

  这个例子讲的是:

猪圈里有两头猪,一头大猪,一头小猪。

猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。

如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。

当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

  那么,两只猪各会采取什么策略?

答案是:

小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

  原因何在?

因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。

对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。

反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

  “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。

规则的核心指标是:

每次落下的食物数量和踏板与投食口之间的距离。

  如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?

试试看。

  改变方案一:

减量方案。

投食仅原来的一半分量。

结果是小猪大猪都不去踩踏板了。

小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。

谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

  如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。

  改变方案二:

增量方案。

投食为原来的一倍分量。

结果是小猪、大猪都会去踩踏板。

谁想吃,谁就会去踩踏板。

反正对方不会一次把食物吃完。

小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。

  对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。

  改变方案三:

减量加移位方案。

投食仅原来的一半分量,但同时将投食口移到踏板附近。

结果呢,小猪和大猪都在拼命地抢着踩踏板。

等待者不得食,而多劳者多得。

每次的收获刚好消费完。

  对于游戏设计者,这是一个最好的方案。

成本不高,但收获最大。

  原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。

但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。

为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。

而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。

  比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。

这相当于“智猪博弈”增量方案所描述的情形。

但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。

最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。

  许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。

股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。

因此,对于制订各种经济管理的游戏规则的人,必须深谙“智猪博弈”指标改变的个中道理。

纳什博弈论的原理与应用

  1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。

他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。

从而揭示了博弈均衡与经济均衡的内在联系。

纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。

然而,纳什天才的发现却遭到冯·诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。

但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。

要不是30多年的严重精神病折磨,恐怕他早已站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。

  纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。

然而,他的天才发现———非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的。

  1948年纳什到普林斯顿大学读数学系的博士。

那一年他还不到20岁。

当时普林斯顿可谓人杰地灵,大师如云。

爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。

博弈论主要是由冯·诺依曼(1903—1957)创所立的。

他是一位出生于匈牙利的天才的数学家。

他不仅创立了经济博弈论,而且提出了计算机的基本原理。

早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(OskarMorgenstern),并与其合作才使博弈论进入经济学的广阔领域。

  1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。

尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。

例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。

冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。

合作型博弈在20世纪50年代达到了巅峰期。

然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。

正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!

纳什不是一个按部就班的学生,他经常旷课。

据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。

斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。

于是,又走人了。

然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。

纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。

1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。

殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!

这一年的10月,他骤感才思潮涌,梦笔生花。

其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。

纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。

1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。

说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”(minimaxsolution)推到非合作博弈领域,找到了普遍化的方法和均衡点。

盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。

盖尔建议他马上整理出来发表,以免被别人捷足先登。

纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。

结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。

纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。

这一点也是值得我们深思的。

国内提一个教授,要求在“核心的刊物”上发表多少篇文章。

按照这个标准可能纳什还不一定够资格。

  1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。

  纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。

20岁出头已成为闻名世界的数学家。

特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。

他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。

后续的研究者对博弈论的贡献,都是建立在这一概念之上的。

由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。

囚徒困境博弈

  在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoners’dilemma)博弈模型。

该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。

假设有两个小偷A和B联合犯事、私入民宅被警察抓住。

警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:

如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。

如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

表2.2给出了这个博弈的支付矩阵。

  表2.2囚徒困境博弈[Prisoner'sdilemma]

  

A╲B

坦白

抵赖

坦白

-8,-8

0,-10

抵赖

-10,0

-1,-1

  我们来看看这个博弈可预测的均衡是什么。

对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。

显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。

但是,倘若他们都选择“抵赖”,每人只被判刑1年。

在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。

不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。

  要了解纳什的贡献,首先要知道什么是非合作博弈问题。

现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。

  博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。

好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。

其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。

博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。

所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。

话说有一天

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 经管营销 > 公共行政管理

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2