第9章蜈蚣博弈，想到百步之后_拿来就用的博弈论_其他小说

    逻辑和直觉的悖论

    蜈蚣博弈是由罗森塞尔（Rosenthal）提出的。它是这样一个博弈：两个参与者A、B轮流进行策略选择，可供选择的策略有“合作”和“背叛”（“不合作”）两种。假定A先选，然后是B，接着是A，如此交替进行。A、B之间的博弈次数为有限次，比如100次。假定这个博弈各自的支付给定如下：

    合作合作合作合作……合作合作

    ABAB……AB（100，100）

    合作合作合作合作……合作背叛

    ABAB……AB（98，101）

    这个博弈因形状像一只蜈蚣，而被命名成蜈蚣博弈。

    现在的问题是：A、B是如何进行策略选择的？

    这个博弈的奇特之处是：当A决策时，他考虑博弈的最后一步即第100步；B在“合作”和“背叛”之间做出选择时，因“合作”给B带来100的收益，而“不合作”带来101的收益，根据理性人的假定，B会选择“背叛”。但是，要经过第99步才到第100步，在99步，A考虑到B在100步时会选择“背叛”--此时A的收益是98，小于B合作时的100，那么在第99步时，他的最优策略是“背叛”--因为“背叛”的收益99大于“合作”的收益98……如此推论下去，最后的结论是：在第一步A将选择“不合作”，此时各自的收益为1，远远小于大家都采取“合作”策略时的收益：A：100，B：100-99。

    不难看出，在该博弈的推理过程中，运用的是逆推归纳法。从逻辑推理来看，逆推归纳法是严密的，但结论是违反直觉的。直觉告诉我们，一开始就停止的策略A、B均只能获取1，而采取合作性策略有可能均获取100，当然A一开始采取合作性策略有可能获得0，但1或者0与100相比实在是太小了。直觉告诉我们采取“合作”策略是好的。而从逻辑的角度看，A一开始应选择“不合作”的策略。是逆推归纳法错了，还是直觉错了？人们在博弈中的真实行动“偏离”了运用逆推归纳法关于博弈的理论预测，造成两者间的矛盾和不一致，这就是蜈蚣博弈的悖论。

    对蜈蚣博弈进行实验的结果也表明，在绝大多数任意选择的博弈方之间进行该博弈，一般都不会出现逆推归纳法预测的博弈方。A在一开始就选择结束博弈时双方收益为1的结果。蜈蚣悖论对逆推归纳法的有效性提出了严重的质疑

    ：逆推归纳法是否失效了？

    对于蜈蚣悖论，许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验（目前通过实验验证集体的交互行为已成时尚。正如博弈论专家英国的宾莫所言，诺贝尔奖也无疑在考虑这方面的先驱者），实验发现，不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略，从而走向合作。这种做法违反倒推法，但实际上双方这样做，要好于一开始A就采取不合作的策略。

    倒推法似乎是不正确的。对此，许多学者进行了研究，结果认为双方开始时将选择合作性策略，虽然这违反博弈中的倒推分析方法的逻辑，但的确要好于最初就选择背叛所带来的收益。只不过理性的人会出于自身利益的考虑，在某一步选择背叛，即虽然最初选择了合作，但这种合作却不可能坚持到底。倒推法肯定在某一步要起作用。只要倒推法在起作用，合作便不能进行下去。

    这个悖论在现实中的对应情形是，参与者不会在开始时确定他的策略为“不合作”，但他难以确定在何处采取“不合作”策略。

    在蜈蚣博弈中，根据逆推归纳法，博弈方在一开始就应该选择结束博弈，即博弈双方的得益均为1。这是不符合双方的长远利益的。逆推归纳法的路径与博弈方的长远利益相悖，因而博弈方不会按逆推归纳法的逻辑推理去决策。在该博弈中，如果博弈的双方彼此信任、默契，彼此相信对方是理性的，彼此相信对方会追求自身的长远利益与整体利益，那么双方选择合作策略的可能性会更大。而且在现实生活中，如果博弈双方相互信任、从长远利益与整体利益出发去进行策略选择，结果往往是双赢。

    下面我们来举一个生活中的恋爱故事来说明这个博弈：

    爱情就其本质来说是一种交往，人交往的目的在于个人效用最大化，不管这个效用是金钱，还是愉快的感觉、幸福的感觉。只要追求个人效用，就必定存在利益博弈，因而，我们的爱情交往是一个典型的双人动态博弈过程。爱情博弈不等同于其他动态博弈的一个重要点是：爱情的效用随着交往程度的加深和时间推移有上升趋势。

    假定茱丽叶（女）和罗密欧（男）是这个蜈蚣博弈的主角，这个博弈中他们每人都有两个战略选择，一是继续，一是甩。他们的博弈展开式如下：

    在上图中，博弈从左到右进行，横向连杆代表继续交往战略，向下的连杆代表甩掉她（他）战略。每个人下面对应的括号代表相应的人甩了对方，爱

    情结束后，各自的爱情效用收益，括号内左边的数字代表茱丽叶的收益，右边代表罗密欧的收益。可以看到，罗密欧和茱丽叶甩战略对应的括号数字每个都不同，这是因为爱情效用在不断增加，这里假设爱情每继续一次总效用增加1，如第一个括号中总效用为1＋1＝2，第二个括号则为0＋3＝3，只是由于选择甩战略的人不同，而在两人之间进行分配。由于男女生理结构和现实因素不同，茱丽叶甩战略只能使效用在两人之间平分，即两败俱伤，罗密欧选择甩战略则能占到3个便宜。显然，甩战略对于被甩的一方来说是一种欺骗行为。

    请看，首先，交往初期茱丽叶如果甩了罗密欧，则两人各得1的收益，茱丽叶如果选择继续，则轮到罗密欧选择，罗密欧如果选择甩了茱丽叶，则茱丽叶属受骗，收益为0，罗密欧占了便宜收益为3，这样完成一个阶段的博弈。可以看到每一轮交往之后，双方了解程度加深，两人爱情总效用在不断增长。这样一直博弈下去，直到最后两人都得到10的收益，为圆满爱情结局--总体效益最大。遗憾的是这个圆满结局很难达到！

    大家注意，当罗密欧到达甩了茱丽叶可得收益是10的时候，他很难有动力继续交往下去，继续下去不但收益不会增长，而且有被茱丽叶甩掉反而减少收益的风险。茱丽叶则更不利，因为她从来就没有占先的机会，她无论哪次选择甩罗密欧，两者都是两败俱伤，而且还有可能被罗密欧欺骗减少收益的危险。在爱情过程中，女人总体来讲处于不利地位。因此，每一次交往，无论罗密欧还是茱丽叶都有选择甩来中止爱情的动机，更详细的数学可以证明，如果他们是极端个人主义的话，爱情圆满的结局不可能达到。个人效益最大与总体效益最大之间有矛盾。

    怎样才能达到圆满结局呢？有三个因素决定：一是罗密欧和茱丽叶之间的爱情信念，即追求两个人的爱情效用最大，而不是单方面的，相信坚持下去会有好的结果；二是选择充分信任对方的行为，不要摆明了猜忌对方；三是最终结局的可能性，在博弈论中这个叫贴现因子，也就是未来的收益对于现在的收益来讲，哪个更大，比如对罗密欧来讲，最终结局的收益10肯定不会等于当前甩了茱丽叶得到的10，哪个更大，罗密欧就选择哪个。两人对于爱情未来的观念和信念真的很重要。

    通过这个恋爱的分析可以发现，遵循于逻辑倒推的蜈蚣博弈在某些条件下，不一定会成立，并且有很大的局限性。倒推法的成立是需要一定条件的，不适于分析所有动态博弈。不过，只

    要条件容许，被分析的问题符合客观成立的要求，倒推法绝对是一种分析动态博弈的有效方法，我们可以通过这种方法来改善我们的生活，解决遇到的难题，甚至是帮助自己走向成功。

    哈佛大学教授曼昆对大学生提出5条建议：①学点经济学，知道经济规律，把握自己人生；②学点统计学，统计是现实中最经常用到的技能；③学点金融学，要有人生风险的概念；④学点心理学，认清人类理性的暇疵；⑤相信直觉，忽视你认为应该忽视的忠告。

    倒推法的智慧

    不管叫它“倒推法”还是“逆推法”，说的都是同一样事物。下面以市场进入博弈为例，来看如何运用逆推归纳法。

    假定有甲、乙两个企业，甲企业一直独占某城市的市场，每年的垄断利润是10亿元。乙企业为了进入这个市场，需要4亿元的投资。当乙企业准备进入的时候，甲企业必须决策：或者“容忍”进入，就是收缩产量维持高价，利润降为5亿元，这时乙企业的利润也是5亿元，减去投资费用，实得1亿元；或者展开商战“对抗”，就是加大产量，降低价格，力图把进入者挤出去，这时甲企业的利润降到2亿元，乙企业得到2亿元还抵不过投资的4亿元，亏损2亿元。对于甲而言，一旦乙进入，利润会受损很多，乙最好不要进入。因此，甲向乙发出威胁：如果你进入，我将打击。

    但是这个博弈的最终结果是，乙选择“进入”，甲选择“容忍”。为什么呢？在这个博弈中甲的威胁是不可信的。

    乙是这样推理的：假定我（乙）进入，甲如果“打击”，它的得益为2；“容忍”的得益为5。甲是理性人，它将选“容忍”的策略。既然我预测到甲将“容忍”，我在“进入”和“不进入”间进行选择时，“进入”的得益为1，“不进入”的得益为0，作为理性人我将选择“进入”。当乙选择“进入”策略时，

    甲的推理是：如果采取“打击”，我的得益为2；“容忍”的得益为5，选择“容忍”是理性的策略选择。

    通过以上分析，可以看出逆推归纳法的逻辑基础是这样的：动态博弈中先行为的理性的博弈方，在前阶段选择行为时必然会考虑后行为博弈方在后面阶段将会怎样选择行为，只有在博弈的最后一个阶段选择的、不再有后续阶段牵制的博弈方，才能直接做出明确选择。而当后面博弈方的选择确定以后，前一阶段博弈方的行为也就容易确定了。

    由于逆推归纳法确定的各个博弈方在各阶段的选择，都是建立在后续阶段各个

    博弈方理性选择的基础上的，因此排除了不可信的威胁或承诺的可能性，因此它得出的结论是比较可靠的，确定的各个博弈方的策略组合是有稳定性的。

    但是不可否认，逆推归纳法在逻辑上是严密的，然而它存在着“困境”；蜈蚣悖论恰好反映了这种“困境”。许多学者试图克服这些理论困难。不过这已经不在我们的考虑范围之内了，我们关注的是逆推法怎样可以为我所用。

    微软有一道特别著名的面试题，说的是有5个海盗抢得100枚金币后，讨论如何进行公正分配。他们商定的分配原则是：

    （1）抽签确定各人的分配顺序号码（1，2，3，4，5）；

    （2）由抽到1号签的海盗提出分配方案，然后5人进行表决，如果方案得到超过半数的人同意，就按照他的方案进行分配，否则就将1号扔进大海喂鲨鱼；

    （3）如果1号被扔进大海，则由2号提出分配方案，然后由剩余的4人进行表决，当且仅当超过半数的人同意时，才会按照他的提案进行分配，否则2号也将被扔入大海；

    （4）依此类推。

    这里假设每一个海盗都是绝顶聪明而理性，他们都能够进行严密的逻辑推理，并能很理智地判断自身的得失，即能够在保住性命的前提下得到最多的金币。同时还假设每一轮表决后的结果都能顺利得到执行，那么抽到1号的海盗应该提出怎样的分配方案才能使自己既不被扔进海里，又可以得到更多的金币呢？

    请问，如果你是最先分金币的A，怎么样分才能既保住自己的性命，又得到最多的金币？

    此题是蜈蚣博弈范畴内的推导。由于从第一个强盗（强盗A）开始推导产生的各种分支可能情况过于复杂，因此，应从后面开始向前倒推，从而得出结果。

    此题公认的标准答案是：1号海盗分给3号1枚金币，4号或5号2枚金币，自己则独得97枚金币，即分配方案为（97，0，1，2，0）或（97，0，1，0，2）。现在来看如下各人的理性分析：

    首先从5号海盗开始，因为他是最安全的，没有被扔下大海的风险，因此他的策略也最为简单，即最好前面的人全都死光光，那么他就可以独得这100枚金币了。

    接下来看4号，他的生存机会完全取决于前面还有人存活着，因为如果1号到3号的海盗全都喂了鲨鱼，那么在只剩4号与5号的情况下，不管4号提出怎样的分配方案，5号一定都会投反对票来让4号去喂鲨鱼，以独吞

    全部的金币。哪怕4号为了保命而讨好5号，提出（0，100）这样的方案让5号独占金币，但是5号还有可能觉得留着4号有危险，而投票反对以让其喂鲨鱼。因此理性的4号是不应该冒这样的风险，把存活的希望寄托在5号的随机选择上的，他唯有支持3号才能绝对保证自身的性命。

    再来看3号，他经过上述的逻辑推理之后，就会提出（100，0，0）这样的分配方案，因为他知道4号哪怕一无所获，也还是会无条件的支持他而投赞成票的，那么再加上自己的1票就可以使他稳获这100金币了。

    但是，2号也经过推理得知了3号的分配方案，那么他就会提出（98，0，1，1）的方案。因为这个方案相对于3号的分配方案，4号和5号至少可以获得1枚金币，理性的4号和5号自然会觉得此方案对他们来说更有利而支持2号，不希望2号出局而由3号来进行分配。这样，2号就可以高高兴兴地拿走98枚金币了。

    不幸的是，1号海盗更不是省油的灯，经过一番推理之后也洞悉了2号的分配方案。他将采取的策略是放弃2号，而给3号1枚金币，同时给4号或5号2枚金币，即提出（97，0，1，2，0）或（97，0，1，0，2）的分配方案。由于1号的分配方案对于3号与4号或5号来说，相比2号的方案可以获得更多的利益，那么他们将会投票支持1号，再加上1号自身的1票，97枚金币就可轻松落入1号的腰包了。

    这道题给我们的最大的启示就是，当你面对一个棘手的问题时，可以考虑通过倒推的方式去解决它。从结果出发，一步一步从后向前倒推，你会清晰地找到问题解决的关键所在。

    如果你对你的生命经常在问“为什么会这样”“为什么会那样”的时候，你不妨试着问一下自己，你是否“清清楚楚”地知道你自己要的是什么？人常常想的事情很多，做的事情很少。你是否想过，5年后你将怎样生活？5年后你的家人又将怎样生活？如果连自己要的是什么都不知道的话，那么命运又如何帮你安排呢？

    不要忘记你的目标

    倒推法的好处是，你目前所做的所有事情，都是为了实现你的目标，不会轻易偏离航向。人生中，有时候你未必采用逆推法，但是切记不要让你的小船迷失了航向，那样你永远都走不到你想要去的地方。

    在这个世界上有一件事是绝对不能忘记的，那就是你的人生目标。如果你忘记其他事情，只有人生目标没有忘记，你就不用担心；反之，如果你记

    得、参与并完成其他事情，却忘记人生目标，那你就等于什么也没有做。这就好像国王派遣你到一个国家去完成一件特殊的工作。你去了，也做了100件其他的事，但如果没有完成你的任务，你就是什么事都没有做。每个人来到世间都有一件特定的事要完成，那就是他的人生目标。如果他没有达到人生目标，就等于什么事都没有做。

    在非洲的马拉河，河谷两岸青草嫩肥，草丛中一群群羚羊在那儿美美地觅食。一只狼隐藏在远远的草丛中，竖起耳朵四面旋转。它觉察到了羚羊群的存在。然后悄悄地接近羊群。

    越来越近，越来越近，羚羊也有所察觉，开始四散逃跑。豺狼像百米运动员般瞬时爆发，如箭一样冲向羚羊群。它的眼睛紧紧盯住一只未成年的羚羊，直向它追去。

    在追与逃的过程中，狼超过了一头又一头站在旁边观望的羚羊，但它没有掉头改追这些更近的猎物，而是锲而不舍地直朝着那头未成年的羚羊狂追猛赶。

    羚羊累了，狼也累了，在这场较量中最后比的是速度和耐力。终于，狼的前爪搭上了羚羊的后背，羚羊成了狼的嘴中物。

    也许你会很疑惑，在追击过程中狼为什么不改追那些离自己更近的羚羊呢？这正是许多人所欠缺的，他们总是在左顾右盼，游移不定。要么没有任何目标，要么有了目标却无法坚守目标。而这种现象普遍存在于动物世界中，也许是一种代代相传的本能。

    专注，已经成为一个人是否能成功的决定性因素。心无旁骛，锁定目标，是人类需要从狼身上学习的一个重要的素质。

    狼在捕食猎物时，从来都是集中全部精力。它们的眼睛始终都不曾离开它们所猎取的目标，时刻观察着猎物。对于不在它们猎取范围内的，绝不多看一眼。

    对于大部分人来说，如果一入社会就专心于某事，不让它消耗在一些毫无意义的事情上，那么就有成功的希望。但是，很多人却不能如此，在实现目标的过程中，一开始还行，慢慢就偏离了。这主要是私心杂念太多，不能把全部精力都集中在一件事上。

    明智的人最懂得把全部的精力集中在一件事上，唯有如此方能实现目标；明智的人也善于依靠不屈不挠的意志、百折不回的决心以及持之以恒的忍耐力，努力在人们的生存竞争中去获得胜利。

    那些富有经验的园丁常常把树木上许多能开花结实的枝条剪去，一般人往往觉得很可惜。但是，园丁们知道，为了使树木能更快地茁壮成长，为了让以后的果实结得更饱满，

    就必须忍痛将这些旁枝剪去。否则，若要保留这些枝条，那么将来的总收成肯定要减少无数倍。

    那些有经验的花匠也习惯把许多快要绽开的花蕾剪去，这是为什么呢？这些花蕾不是同样可以开出美丽的花朵吗？花匠们知道，剪去其中的大部分花蕾后，可以使所有的养分都集中在其余的少数花蕾上。等到这少数花蕾绽开时，一定可以成为那种罕见、珍贵、硕大无比的奇葩。

    做事就像培植花木一样，青年男女们与其把所有的精力消耗在许多毫无意义的事情上，还不如看准一项适合自己的重要事业，集中所有精力，埋头苦干，全力以赴，肯定可以取得杰出的成绩。

    如果你想成为一个众人叹服的领袖，成为一个才识过人、无人可及的人物，就一定要排除大脑中许多杂乱无绪的念头。如果你想在一个重要的方面取得伟大的成就，那么就要大胆地举起剪刀，把所有微不足道的、平凡无奇的、毫无把握的愿望完全“剪去”，在一件重要的事情面前，即便是那些已有眉目的事情，也必须忍痛“剪掉”。

    世界上无数的失败者之所以没有成功，主要不是因为他们才干不够，而是因为他们不能集中精力，不能全力以赴地去做适当的工作，他们把自己的大好精力东浪费一点、西消耗一些，而他们自己竟然还从未觉悟到这一问题：如果把心中的那些杂念一一剪掉，使生命力中的所有养料都集中到一个方面，那么他们将来一定会惊讶--自己的事业上竟然能够结出那么美丽丰硕的果实！

    拥有一种专门的技能要比有十种心思来得有价值，有专门技能的人随时随地都在这方面下苦功求进步，时时刻刻都在设法弥补自己的缺陷和弱点，总是要想到把事情做得尽善尽美。而有十种心思的人就和他不一样，他可能会忙不过来，要顾及这一点又要顾及那一个，由于精力和心思分散，事事只能做到“尚可”为止，结果当然是一事无成。

    有志者，事竟成。志，就是目标。目标是生活的灯塔，如果失去了它，就会迷失前进的方向。确立目标，是一个能让我们以繁忙来代替对现实的不满和抱怨的好方法。目标对于人生，正像空气对于生命一样。没有空气，生命就不能够存在；没有目标，等待人生的只有失败与徘徊。

    条条大道通罗马

    到达成功的路有很多，完成任务也有很多方法。如果发现正在走的路、正在用的方法不适合自己，就要敢于放弃，善于寻找，最后你总会找到最适合自己的方法。

    问题的关键在于，你不要陷入自己

    的惯性思维，永远只用一种眼光看问题。要学会变通，只要完成任务就好。举个最简单的例子，你满大街地找洗手间，这时候看到一家麦当劳或者肯德基，你是选择进去还是继续焦急地寻找？

    据世界科学协会对500例重大科学贡献的调查证明，许多科学奇迹早就存在于世。艰难的是，我们固有的看法必须打破。我们的目光，是否能跟随我们的想法转移。

    换个想法，便能换来一切。在你试图改变自己想法的同时，你的视角也开始变化；移向自己从不注意的世界。你真的会有新的发现。你的想法有了不同，一切也就随之有了不同。

    大英图书馆老馆年久失修，于是在新的地方建了一个新的图书馆。新馆建成后，要把老馆的书搬到新址去。这本来是一个搬家公司的活儿，没什么好策划的，把书装上车，拉走，摆放到新馆即可。问题是按预算需要350万英镑，图书馆里没有这么多钱。眼看着雨季就到了，不马上搬家，这损失就大了。怎么办？馆长想了很多方案，但一筹莫展。

    正当馆长苦恼的时候，一个馆员问馆长苦恼什么？馆长把情况向这个馆员介绍了一下。几天之后，馆员找到馆长，告诉馆长他有一个解决方案，不过仍然需要150万英镑。馆长十分高兴，因为图书馆有这么多钱。

    “快说出来！”馆长很着急。

    馆员说：“好主意也是商品，我有一个条件。”

    “什么条件？”馆长更着急了。

    “如果把150万全花净了，那权当我给图书馆作贡献了，如果有剩余，图书馆要把剩余的钱给我。”

    “那有什么问题？350万我都认可了，150万以内剩余的钱给你，我马上就能做主！”馆长很坚定地说。

    “那咱们签订个合同？”馆员意识到发财的机会来了。

    合同签订了，不久实施了馆员的新搬家方案。150万英镑连零头都没用完，就把图书馆给搬了。

    原来，图书馆在报纸上刊登了一条惊人的消息：“从即日起，大英图书馆免费、无限量向市民借阅图书，条件是：书从老馆借出，还到新馆去。”

    既然最终的目的是让书躺到新馆里，那么从这个结果出发，任何可以实现这个目标的方法都可以用，不是吗？而且效果会更好。我们的职业生涯也是如此：

    有一个英国青年非常热爱诗歌，他发了疯似的拼命写诗，发誓要成为一名最伟大的诗人，可是多年过去了，他呕心沥血写出了大量诗作，却仍然默默无

第9章 蜈蚣博弈，想到百步之后

第9章蜈蚣博弈，想到百步之后