友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!
纳什均衡与博弈论-第6部分
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部! 如果本书没有阅读完,想下次继续接着阅读,可使用上方 "收藏到我的浏览器" 功能 和 "加入书签" 功能!
致输得更多,这样一来,你就应当尽量最小化对手的收益(和你的损失)。问题是,采取什么样的策略可以达到这样的效果呢?是不是每次都应该坚守这种策略呢?
事实证明,在有些博弈中,你的确可能找得到一种纯策略,在这种策略下,不论对手采取什么行动,它都能使你的收益最大化(或损失最小化)。显然,你将使用这个策略,并且如果游戏重复,你将每次重复使用相同的策略。但是有时,受游戏规则的影响,你的最佳选择与对手的选择有关,而你又可能不知道对手的选择,这正是博弈论所感兴趣的。
首先,我们来看一个简单的例子。假设鲍勃欠爱丽丝10美元,他提议玩个游戏,如果他赢了,他欠的债将被减免(在现实社会中,爱丽丝会要求鲍勃花费多于10美元的代价去郊游野餐来抵消)。但是我们的目的是阐述博弈论思想,假设爱丽丝同意了这笔交易。
鲍勃建议游戏这么玩:他和爱丽丝在图书馆见面,如果他先到,就付爱丽丝4美元,如果爱丽丝先到,就付爱丽丝6美元,如果两人同时到,鲍勃付5美元(正如我之前说过的,爱丽丝肯定会让他再加大数目的)。
现在,假设两人住在一起,或者至少是邻居。两人都有两种策略到达图书馆:走路或者乘公共汽车(假设两人都很穷,都没有车,这也是鲍勃会为这10美元折腾的原因)。两人都知道公共汽车会比走路快。因而,这场游戏很简单了,两人都会选择坐公共汽车,这样两人最后同时到达,鲍勃给爱丽丝5美元。下面讲的就是博弈论中的收益矩阵,告诉人们如何选取策略。下表中的数字代表左边一栏中的局中人(爱丽丝)的收益。
注:在零和博弈中,收益矩阵中的数字代表矩阵左方的局中人(本例中的爱丽丝)的收益(因为是零和博弈,当然也就代表了矩阵上方的局中人鲍勃的损失了)。如果是负数,说明矩阵上方的局中人获得收益(也就意味着爱丽丝的损失)。在非零和博弈中,每一个矩阵单元包含两个数字,分别对应每个局中人(如果局中人更多,那么矩阵将很难写出)。
显然,爱丽丝必须选择乘公共汽车,因为无论鲍勃如何选择,这至少等同于,甚至高于走路的收益。而鲍勃也会选择乘车,因为不管爱丽丝怎么做,这都会使他的损失最小。选择走路最多有可能出现一样的结果,但也有可能更糟。
当然,这个例子太简单了,完全用不着博弈论。下面来看一个来自真实的世界战争的例子——博弈论教材的经典案例之一。
在第二次世界大战中,乔治·肯尼将军得知日军将向新几内亚岛派遣一支补给护航舰队。盟军自然想炸沉这支舰队。但这支舰队可能有两条可行路线——一条到达新不列颠的北边,一条到达南边。
每条路线都需要3天的行程,所以,原则上说,盟军有3天的袭击敌军的时间。但是,天气影响不可排除。据天气预报,如果走北边路线,会有1天的阴雨天气,使袭击时间最多为2天;而南边路线一直是晴天,为3天时间的轰炸提供清晰的能见度。肯尼将军必须做出选择,是将侦察飞行队派往北边还是南边。如果选择南边,而敌军舰队却走北边的话,他就少了1天的袭击时间(而可行的袭击时间也仅有2天)。如果侦察队去了北边,在敌军舰队走南边的情况下仍然还有2天的袭击时间。
经过分析,得出收益矩阵。如下表,表中数字代表盟军的收益,即袭击的天数。
如果只是从盟军的角度来看这个矩阵,并不能一眼看出采取了什么策略。但是从日军的角度出发,很容易得出走北边路线是唯一有意义的方案。如果日军舰队选择南边路线,至少要受到两天的袭击,甚至三天;但是如果选择北边,则最多受到两天袭击(有可能只有一天),这样和选择南边一样或者更好,而不会更差。肯尼将军因此可以肯定日军会让护送舰队走北线,这样一来,盟军当然只能派侦察飞行队也走北线了(事实上,日军最后的确走了北线,在盟军的炮轰下损失惨重)。
当然,合适的策略并不总是显而易见的。我们重新回到爱丽丝和鲍勃的例子,看看如果爱丽丝拒绝玩鲍勃的这个愚蠢的游戏,会发生什么。在知道如果玩鲍勃的游戏则无论如何也拿不回她的10美元时,爱丽丝会提出另一种玩法,这可让鲍勃费尽脑筋想策略了。
在爱丽丝的游戏里,他们连续在一个月里每个工作日去图书馆一次。如果两人都是乘车去的,那么鲍勃付爱丽丝3美元;两人都走路去,则付4美元。鲍勃乘车而爱丽丝走路去,因而爱丽丝后到,鲍勃付5美元;鲍勃走路而爱丽丝乘车,因而爱丽丝先到的话,鲍勃付6美元。是不是被搞糊涂了?不要紧,鲍勃也被搞糊涂了。看看下面的收益矩阵吧:
鲍勃很快就意识到,这个游戏可不简单。如果他乘车去,则只需要付3美元,但是爱丽丝意识到这点后,就会走路去,这样鲍勃就得付5美元了。这样一来,鲍勃可能会决定走路去,因为这样一来,就有可能只付4美元了。可是爱丽丝也会算到这一点,这样她就会乘车,这样的话鲍勃可就得付6美元了。鲍勃和爱丽丝都不知道对方会怎么走,因而也就没有明显的“最佳”战略了。
不过,要记住这点,爱丽丝有要求这个游戏要重复的进行,总共20次,但并没有哪条规则说你必须每次都采取同样的策略(这就是纯策略了——永远不会改变的策略)。相反的,爱丽丝会意识到她应当采取混合策略,也就是说她会有时乘车,有时走路,这样就能让鲍勃猜不透了。当然鲍勃也会这样做,采取混合策略,让爱丽丝来猜他。
这其实就是冯·诺依曼天才见解的本质核心内容。在二人零和博弈中,你总是能找得到一种最佳策略,而在很多情况下,最佳策略即混合策略。
在这个特定的例子里,很容易得出爱丽丝和鲍勃的各自的最佳策略。记住,混合策略是一系列纯策略的混合,每一个纯策略被采用的百分比是特定的(或者说,有一个特定的概率)。因此鲍勃想要计算出选择走路和乘车的策略的比例,图书馆的一本古老的有关博弈论的书帮了他的忙。按照书中的理论,他会将爱丽丝选择走路时他采取每种策略的收益(也就是矩阵的第一行)和爱丽丝乘车时的收益(也就是第二行)进行比较,也就是从第一行中减去第二行(结果是…2和2,不过这里的负号无关紧要)。这两个数字决定了鲍勃选择两种策略的比例——2∶2,或者说50∶50(要注意了,这里第二列的数决定采取第一种策略的比例值,第一列的数决定第二种策略的比例值,只是在这个特殊的例子中两个数值是相同)。对于爱丽丝,就要用第一列减去第二列,得到…3和1(这里负号没有影响),因此她应该采取第二种策略(走路)是第一种策略(乘车)的3倍。
结果即为:爱丽丝应当在1/4的时间里乘车,另外的3/4的时间里走路,而鲍勃则应当1/2时间走路,1/2时间乘车。两人还应当利用一些合适的随机选择的方法来决定什么时候乘车,什么时候走路。鲍勃可以用抛硬币的方法来决定,而爱丽丝则可以用随机数表选择,或者是用游戏转轮,转盘上有3/4的区域对应走路,而1/4区域对应坐车。一旦其中任何一个人经常走路(或者乘车),那么另一方就可以做出更为有利的策略了。
记住,一定要让对方猜不透你的想法。正因为如此,在打扑克牌中,博弈论被浓缩为一定要故弄玄虚。如果你一有好牌就得意洋洋,坏牌就不吭声,对手就能很容易判断出你的牌了。
真正的扑克牌游戏是相当复杂的,无法用简单的博弈理论来分析。但是如果只考虑两个人玩一副牌的情况,如只有鲍勃和爱丽丝。并规定黑牌比红牌大。发牌之前,每人下底注5元,这样一局赌注总额就有10元了。爱丽丝先玩,她可以弃牌或者再加注3元,如果弃牌,两个人都将手中牌翻开,谁有黑牌谁赢(如果两人都有黑牌,或者都只有红牌,则两人平分赌注)。
如果爱丽丝再加注3元,鲍勃可以选择也加注3元跟注叫牌(赌注就有16元了)或者弃牌。如果他弃牌,则爱丽丝获得13元,如果他叫牌,则两人亮牌,看谁赢得那16元。
这样的话,如果爱丽丝手中是红牌,那她只能轮空,指望鲍勃同样也是红牌。但是如果她下注,鲍勃可能会认为她有黑牌。如果他刚好是红牌,就会弃牌,这样爱丽丝就会用一张红牌赢了鲍勃。所以说虚张声势有时会转败为胜。但是,也有可能是鲍勃知道爱丽丝是在虚张声势[毕竟她不是伍尔坎(Vulcan)],这样他就会继续跟注了。
这样,问题就变成了爱丽丝该以多大的频率来虚张声势,而鲍勃又该以多大频率在她虚张声势时加注?也许天才的冯·诺依曼可以心算出这些结果,但是我想绝大多数人还是需要借助于博弈论的。
上面所举的这类博弈中,收益矩阵说明了两个局中人都有4种策略可选。爱丽丝可以永远地轮空,或永远下注,在红牌的时候轮空,黑牌的时候下注,或在黑牌的时候也轮空,红牌的时候也下注。鲍勃也可以这么做,永远弃牌,或永远跟注,或在红牌的时候弃牌,黑牌的时候跟注,或黑牌的时候弃牌,红牌的时候跟注。通过计算收益矩阵,可以知道爱丽丝应该在3/5的时间内下注,不论这时拿到的是什么牌,在另外的2/5的时间里,只有在拿到黑牌时才下注。相反的,鲍勃不管拿到什么牌,应该在爱丽丝下注的2/5的时间中跟注;在另外的3/5的时间里,就应该看牌行事了:红牌弃牌,黑牌跟注(顺便提一下,从博弈论的理论可以看出,这场博弈是不公的,如果爱丽丝总是先玩的话,她将得到特别的眷顾,运用博弈矩阵里所示的混合策略玩的话,能保证平均每把赢30美分)。
利用随机方法,从多种纯策略中进行选择并组成混合策略的思想正是冯·诺依曼证明最小最大化原理中的本质核心内容。通过选择正确的混合策略,在对手也精通博弈论的情况下,能够保证你获得可能获得的最大收益。如果对手不懂博弈论,那你可能会收益更大。
第七节 不仅仅是游戏
博弈论并不仅仅针对扑克牌或象棋游戏,甚至不仅仅关于经济学。它讨论的是做决策性的决定——不论是在经济中还是现实生活中的任何其他领域。任何人与人之间为了追求某种目标而相互竞争并交互作用的场合都是博弈论的用武之地,它可以清楚地描述使用各种不同策略所预期达到的结果。一旦你明确想要得到的结果,博弈论就可以计算出最合理的策略来实现它。如果你也赞同下面这个观点,即一群相互影响的人都在寻找他们的最佳策略,以获取自己心中渴望的东西,那么认为博弈论潜在地与指导人类行为的自然法则这个现代的观点相关就不难接受了。
冯·诺依曼和摩根斯特恩在书中并没有提及“自然法则”,但的确暗示了博弈论是对社会组织中的“社会秩序”或“行为标准”的描述。并且,他们还花重墨讲述了“社会现象理论”如何需要一种像博弈论中的数学一样,不同于物理学中所使用的数学方法。他们写道:“博弈策略中的数学理论的确很有说服力,因为它的概念与社会组织的概念存在着相通相似”。
不过,在最初阶段,博弈论只是被局限于处理真实世界中策略问题的一种工具。在现实生活中,你可以找到二人零和博弈的例子,但是这种例子要么简单得根本不需要动用博弈论,要么就是太复杂,博弈论根本无法考虑周全。
当然,指望一本书能够提出一个全新领域并解决这个领域内的所有问题,有些不现实。所以,在将博弈论应用于比二人零和博弈更复杂的情况时,冯·诺依曼和摩根斯特恩并不完全成功也就情有可原了。不过,没过不久,博弈论的力量就得到了实质性的加强,而这一切,要归功于约翰·纳什(John Forbes Nash)所带来的美丽的数学。
第三章 纳什均衡——博弈论的基础
纳什的非合作博弈理论被公认为20世纪人类最杰出的智力成果之一,其意义可与生物学界的DNA双螺旋结构的发现相媲美。
——经济学家罗杰·迈尔森
正如推荐信所言,无需冗繁的形容,只需简短的一句话:“此人是天才。”
这正是卡内基工学院的达芬(R。L。Duffin)教授对普林斯顿大学教员介绍纳什时的评价,年仅20岁的纳什于1948年以研究生的身份进入了该校。不到两年的时间,达芬教授的评价得到了证实。纳什的“美丽心灵”掀起了一场智力革命,并最终推动博弈论从一种时尚转变为整个社会科学的基础。
就在纳什来到普林斯顿的不久之前,冯·诺伊曼和摩根斯特恩以《博弈论与经济行为》一书开拓了新的数学领域,这是经济学界的路易斯安那购买条约,而纳什则扮演了路易斯和克拉克的角色。
事实上,纳什比路易斯和克拉克更少涉足政治。精神疾病剥夺了他的理性,而数学却昭示了他理性的精华。尽管如此,在其漫长的科研生涯别离之前,纳什成功地引导博弈论走向数学均衡的命运。虽然最初并不受欢迎,但是纳什的方法最终获得了大部分理论经济学家的认同,并使他摘取了1994年的诺贝尔经济学奖的桂冠。那个时候,博弈论已经应用于进化生物学并且在政治科学、心理学和社会科学中占了一席之地。在纳什诺贝尔奖光环的影响下,博弈论渗透到人类学、神经科学,甚至物理学之中。毫无疑问,纳什的数学方法使博弈论在科学世界中的广泛应用成为可能。
“纳什带领社会科学走向了一个新的世界,使对各种情况下的冲突和合作的研究有了统一的分析方法。”芝加哥大学的经济学教授罗杰·迈尔森(Roger Myerson)这样写道,“纳什确立的非合作博弈理论已经发展成了一种有效衡量动机的算法,它能够帮助我们更好地了解无论在任何社会、政治或是经济背景下的冲突和合作问题的实质。”
因此可以毫不过分地这样说,事实上,纳什的数学方法提供了建立当代“自然法则”的基础。当然一切并非如此简单。从创立之初,在其整个发展过程中博弈论都备受争议。如今它仍为一些人所信奉,而为另一些人所轻视。一些人宣称他们找到了驳倒博弈论的实验证据;另一些人则提出他们的实验结果发展了博弈论,并对其做出了修正。无论如何,博弈论已在如此众多的科学领域中扮演着重要的角色,它再也不会像最初创立时那样被人们所忽视。
第一节 初创时的冷遇
当冯·诺伊曼和摩根斯特恩将博弈论作为数学方法引进经济学时,激起了不小的风波。然而,大多数经济学家却并不为所动。20世纪60年代中期,经济学届的泰斗保罗·塞缪尔森(Paul Samuelson)大加赞赏冯·诺伊曼和摩根斯特恩的著作在其他领域的洞识和影响力。塞缪尔森写道,“这本书达成了除了它的初衷——对经济学理论进行变革之外的一切目标”。
对于《博弈论与经济行为》一书,经济学家们并非充耳不闻。在它出版后的几年时间里,社会学和经济学的杂志对其进行了广泛的
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!