友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!
河图小说网 返回本书目录 加入书签 我的书架 我的书签 TXT全本下载 『收藏到我的浏览器』

纳什均衡与博弈论-第25部分

快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部! 如果本书没有阅读完,想下次继续接着阅读,可使用上方 "收藏到我的浏览器" 功能 和 "加入书签" 功能!

现“自然法典”。

  现代对“自然法典”的追求始于牛顿原理出现之后的世纪,那本书将运动和重力的法则作为物理世界的理性基础。哲学家和政治经济学家比如大卫·休谟和亚当·斯密从牛顿式物理中寻找一门人类行为的科学,梦想能像描述星球一样准确地描述人类行为。这个梦想穿越了19世纪来到20世纪,从阿道夫·凯特勒(Adolphe Quetelet)用数字描述社会的心愿到西格蒙特·弗洛伊德对大脑特定物质基础的探索。然而,在这个过程中,作为这个梦想的基石的物理模型自己发生了变革,从牛顿的严格决定论转变到麦克斯韦的统计描述——和凯特勒及其同事所用来量化社会的统计相同。到了20世纪末,寻找“自然法典”的物理学家们想要用统计将社会科学和自然世界统一起来。因为毕竟物理——你可以去问任何一个物理学家——是万物的科学。

  第一节 物理学和万物

  然而,历史上物理学家关于万物的观点却有点狭隘。在过去的3个世纪中,大部分时候物理学将自己定位于主要和物质以及引导它运动的力有关;最终,对于运动中的物质的研究混合了能量和它的转换。在刚刚过去的世纪中,爱因斯坦将宇宙时间和空间加入到这个混合中。他甚至通过合并物质和能量以及空间和时间来简化现实世界的成分。于是在20世纪的物理学家眼中,“万物”包含了物质、能量和时空。

  到20世纪末,很多物理学家开始意识到有一个成分被遗失了。数字计算机隐喻性的力量让聪明的观察者认识到,信息是连接外部世界和它的科学描述的纽带。从热力学第二定律到古怪的量子力学到黑洞内部的黑暗环境,物理学家发现在编码和量化对自然的认识时,信息是一个必不可少的成分。

  信息打开了物理学家通往其他存在的眼睛。信息包围了生物。生物包括人。人创造了一个新的现实世界需要物理学来思考——巨大的由经济、社会和文化系统以及制度组成的网络。因此物理学家开始将他们最喜欢的通用工具——统计物理学——应用到从股票市场到流感疫情的各种事物上。这些都在艾萨克·阿西莫夫虚拟的数学家哈里·谢顿(Hari Seldon)身上体现出来,他将统计物理学原理用于预测将来。在 21世纪的黎明到来之际,现实世界中的物理学家试着去做几乎和谢顿做过的一模一样的事情,使用统计物理学来建立社会的数学模型,以对将来做出预测。

  从最初开始,博弈论就表达了相似的雄心。冯·诺依曼和摩根斯特恩关注经济,但很明显将经济视作一般社会科学的一个(虽然是主要的一个)范例。他们相信他们的博弈论是用数学方法表述集体行为的第一步,实际上是一部“自然法典”(他们用的词是“行为准则”或“社会秩序”)。

  很多年以后,约翰·纳什迈出了走向社会数学的第二步,他将纳什均衡引入到博弈论的观点中。如果在一场博弈中所有竞争者都追逐个人利益——试图最大化他们的期待收益——那样将总是存在一些策略组合使每个人都能得到最好的收益(假设每个人都尽力)。在任何博弈中都存在的纳什均衡提示人们社会是稳定的——人们没有动机去改变,因为如果其他人都保持不变的策略,改变只会降低自己的收益。

  在冯·诺依曼和纳什的数学中,最本质的特征是需要“混合策略”来获取最大收益。很少情况下单个“纯粹的”策略会一直是你最好的选择。你的最好策略通常是来自很多可能的选择,其中每个选择有特定的概率。

  在博弈论以及它在现实生活和社会的应用中,这种混合策略是个不断重复的主题。进化的过程中,自然使用了混合策略,产生了包含很多物种的复杂生态系统。人类使用混合策略,包括合作者、竞争者和惩罚者。地球的居民代表了文化的混合策略,从小气独居的秘鲁马奇根加人(Machiguenga)到慷慨群居的肯尼亚奥玛人(Orma)。甚至在物理学领域内,量子力学展示了世界本身是一个亚原子水平的混合策略,博弈论学家也许可以利用这种特点来解决令人困扰的两难问题。

  这样一种有着特定概率的选择的混合,在数学上被称为概率分布。而概率分布,碰巧也正是统计物理学所涉及的。阿西莫夫心理学史的基础是将概率法则应用于大样本人类个体来预测集体行为,正如统计物理学家计算大量分子的概率分布来预测一种气体的性质或者化学反应的过程。正如物质和能量,或者时空。博弈论和物理学是一枚硬币的两面。如佩·班娜塔(Pat Benatar)会说的,它们同归同属。这是一个简洁、紧密的配合,很奇怪为什么博弈论学家和物理学家们在这么长时间之后才认识到这种潜在的关系。

  第二节 天生的分离

  当然,博弈论是在物理学的土壤中孕育出来的,因为冯·诺依曼和摩根斯特恩使用的推理都基于统计物理学。冯·诺依曼提到当描述经济系统中大量群体交互时统计是有用的。纳什推导纳什均衡时提到了反应分子的统计交互。毕竟,纳什在转攻数学专业之前在卡耐基工学院学习化学工程和化学,而他在普林斯顿的博士论文使用了“质量作用”的化学概念来解释纳什均衡。质量作用指的是反应中的所有化学物质决定了反应的平衡条件,一种分子能量统计物理学所描述的过程。将物理学中的平衡概念借用到化学中的分子系统,纳什衍生出一个类比的概念,即由人组成的社会系统的均衡。纳什的数学是关于人的,但它基于分子,而且这种数学将博弈论和社会科学与物理学统一了起来。物理…社会相联系的种子在纳什的美好心灵中播种开来。

  这颗种子以不可思议的方式萌芽并成长,结出了成倍的果实,促进了很多科学领域的进步,从经济学、心理学和社会学到进化生物学、人类学和神经科学。博弈论提供了一种通用的数学语言来联合这些科学,它们代表了拼图的各个块,拼在一起得到了生命、思维和文化——人类集体行为的总和。博弈论的数学也可以被转换成物理学的数学的事实表明了它是揭开万物真正原理的密钥,统一物理学和生活的科学。

  毕竟物理和生命的系统都寻求稳态,或者说均衡。如果你想要预测一种化学反应的进程或人类的行为,未来会如何演化,你必须知道如何计算均衡。博弈论展示了为什么达到一个均衡点需要混合策略——以及对混合策略的需要如何驱动复杂性的创造。换言之,进化。博弈论描述了进化的过程,这种过程产生出不同物种的组合、不同类型的人的组合、不同策略的混合、不同环境下出现的不同文化的组合。

  博弈论描述了产生复杂网络的进化过程。选择混合策略的大脑是神经细胞的网络;展示出多元文化的社会是大脑的网络。把它们放在一起,你得到一个用来量化自然(真正包含了万物)的框架,一个将生活和社会科学的博弈论和描述物质世界的物理学融于一体的框架。

  不论如何,博弈论并不像理论物理学家长时间孜孜以寻的“万能理论”那样流行。对“万能理论”的追求只是在寻求描述所有自然界基本粒子和力的平衡,描述建造大楼的砖瓦的数学。一旦你知道了原子如何组合在一起,这个观点成立了,你就不需要去考虑其他事物。然而博弈论正好是关于其他事物的。它是关于将自己建立在宇宙的物理基础上的生命的领域。它是关于人们如何从丛林中孕育出文明,关于行为的准则、社会秩序的建立和由此产生的“自然法典”的。

  第三节 危险

  寻找“自然法典”总是要冒一种危险——那就是它会被当作一种教条式的决定论来看待人类行为,否定了人类精神的自由。一些人非常反对这种教条式的东西。二十世纪七十年代,在社会生物学的名义下,“自然法典”存在于人类基因中的观点得到了发展,反响有些讽刺,让人们看到智慧如何常常被谩骂打败。社会生物学的聪慧的后代,进化心理学,提出了一个更精密的用进化来解释人类行为的网络,但是它内在的假设认为大脑网络会使用纯粹的策略,这和现代神经生物学和行为人类学的研究发现并不一致。

  另一方面,博弈论在遗传力量的倡导者和人类自由的捍卫者之间提供了一种可能的和解。博弈论追求另一种不同的通往“自然法典”的道路。它承认进化的力量——实际上,它有助于解释进化产生生命复杂性的能力。但博弈论也解释了为什么对人类天性植根于生物学的信仰,虽然一般意义上是正确的,但并不是事情的全部。博弈论提出的不是人类社会行为的一般基因决定论,而是需要,如纳什数学所展示的,一种混合的策略。它要求人们从很多可能的行为中做出选择。

  我想博弈论潜在的科学力量是巨大的,因为它在理论上是如此的包容——不狭隘或偏颇,而是可以容纳很多看似矛盾的观点。这就是为什么它可以提供一个框架来解释世界上所有的多样性——个体行为和个性的混合体,多元的人类文化,永不完结的生命物种列表。博弈论包容了自私和同情、竞争和合作、战争和和平的共存。博弈论解释了基因和环境、遗传和文化间的相互影响。博弈论通过调解进化改变和稳态之间的紧张关系来连接简单和复杂。博弈论将单个个体的选择和人类社会集体行为相联系。博弈论在心灵的科学和那些没有思想的物质的科学之间搭建了桥梁。

  博弈论把这些都放到了一起。它提供了一剂数学处方来使得看起来无法理清一团混乱的世界变得有意义,提供了一个确实的信号表明“自然法典”对于科学家来说并非一个毫无意义不可企及的目标。不管其他人是否看好最后的成功,毫无疑问,科学家们在追逐那个目标。

  “我们想要了解人类本性,”来自普林斯顿的神经科学家和哲学家约瑟华·格林纳(Joshua Greene)说,“我想,这是根本的目标。”

  到成功也许还有很长一段路要走。但是在阿西莫夫的心理史学的想象中,存在着一个不容置疑的真理——这个世界所有的复杂网络,个人的和社会的,以各种方式交互来产生一个独一无二的未来。从人类到城市,从公司到政府,所有这些社会元素最终必须契合。人们看似疯狂的行为背后必定存在着一种规律,博弈论的成功表明了这是一种科学可以发现的规律。

  “想法是最终能真正拥有对宇宙的完整理解,从最基本的物理元素、化学、生物化学、神经生物学,到个体人类行为,到宏观经济行为——完全一体的整合,”格林纳说,“尽管,不在我的有生之年。”

  附 录 纳什均衡计算

  考虑一下第二章中提到的简单博弈,爱丽丝和鲍勃竞争来看看鲍勃该还给爱丽丝多少债。这是一个零和博弈;爱丽丝得到的正是鲍勃所失去的,反之亦然。在这个博弈矩阵里,收益是鲍勃付给爱丽丝的总和,因此鲍勃在每种条件下得到的“收益”是所显示的数字的负值。

  想要计算纳什均衡,你必须找到一种对每个玩家来说,当其他人也选择最佳混合策略时,他的期望收益最高的混合策略。在这个例子中,爱丽丝选择巴士的概率是p,步行的概率为1-p(因为概率加起来必须等于1)。鲍勃选择巴士的概率为q,而步行的概率为1-q。

  爱丽丝可以计算她选择巴士或步行的“期望收益”,方法如下。她选择巴士的期望收益是以下的总和:

  当鲍勃选择巴士时她选择巴士的收益,乘以鲍勃会选择巴士的概率,或表示为3×q

  加上

  当鲍勃选择步行时她选择巴士的收益,乘以鲍勃选择步行的概率,或表示为6×(1-q)

  她选择步行的期望收益是以下的总和:

  当鲍勃选择巴士时她选择步行的收益,乘以鲍勃会选择巴士的概率,或表示为5×q

  加上

  当鲍勃选择步行时她选择步行的收益,乘以鲍勃选择步行的概率,或表示为4×(1-q)

  加起来,

  爱丽丝选择巴士的期望收益=3q+6(1-q)

  爱丽丝选择步行的期望收益=5q+4(1-q)

  用相似的推理来计算鲍勃的期望收益可以得到:

  鲍勃选择巴士的期望收益=…3p+[…5(1-p)]

  鲍勃选择步行的期望收益=…6p+[…4(1-p)]

  现在,爱丽丝在这个游戏中的总期望收益是她选择巴士的概率乘以她选择巴士的期望收益,加上她选择步行的概率乘以她选择步行的期望收益。对鲍勃来说也是相似的。要达到纳什均衡,他们做两种选择的概率必须使得对这两个概率的任何改变都无法带来更多收益。换句话说,对每种选择的期望收益(巴士或步行)必须是相等的(如果对一种选择的期望收益比另一种大,那么多做这种选择就会更好一些,那样,就增加了做这种选择的概率)。

  对鲍勃来说,他不该改变策略如果

  …3p+[…5(1-p)]=…6p+[…4(1-p)]

  运用一些基础的代数运算,方程可以被表示为:

  …3p-5+5p=…6p-4+4p

  或者

  2p=1-2p

  所以

  4p=1

  p的解,表示爱丽丝选择巴士的最优概率是

  p=1/4

  因此爱丽丝应该在1/4的情况中选择巴士,3/4选择步行。

  现在,爱丽丝不会想要改变策略,当

  3q+6(1-q)=5q+4(1-q)

  解出q,得到鲍勃选择巴士的最优概率:

  因此鲍勃应该在一半的时间里选择巴士,一半选择步行。

  现在让我们假定爱丽丝和鲍勃决定玩鹰鸽游戏,收益结构会变得更复杂一些,因为一个人赢得的并不一定等于另一人失去的。在这个博弈矩阵中,方格里的第一个数字给出爱丽丝的收益,第二个数字给出鲍勃的收益。

  爱丽丝玩鹰的概率是p,玩鸽的概率为1-p;鲍勃玩鹰的概率是q,而玩鸽的概率是1-q。爱丽丝玩鹰的期待收益是…2q+2(1-q);她玩鸽的期待收益是0q+1(1-q)。鲍勃玩鹰的期待收益是…2p+2(1-p);他玩鸽的期待收益是0p+1(1-p)。

  鲍勃不会想要改变策略,当

  因此,爱丽丝玩鹰的概率p,是1/3。

  爱丽丝不会想要改变策略如果

  因此鲍勃玩鹰的概率q,也是1/3。因此在这种收益结构下的纳什均衡是在1/3的情况下玩鹰,2/3的情况下玩鸽。

   ……… 【松鼠爱吃肉】整理

  
返回目录 上一页 回到顶部 0 0
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!