2015年10月18日 星期日 国内统一刊号:CN51—0098     中国•企业家日报

好的纳什均衡和坏的纳什均衡

来源:企业家日报 作者:

  ■ 张维迎 北京大学国家发展研究院教授

  

  (上接10月11日04版)

  这个成本多大?在这里要看人的脸皮薄厚,如果这个人的脸皮很薄,意味着a或b很大,这样的话,别人瞪你一眼你就很痛苦,一晚上睡不着觉。但如果你这个人脸皮厚的话,那你可能不在乎这个东西,这就意味着a或b很低,社会规范对你起不到惩罚作用。

  一个社会规范要发挥激励机制的功能,它一定要使得这个惩罚像刚才讲的法律一样,达到一定的程度。当然,对每个人来说,a和b的大小,依赖于社会规范得到普遍遵守程度。如果这种规范大家都违反的话,就没人觉得是一种惩罚了,如果所有人都违反规范的话,意味着每个人脸皮都会变厚。

  以腐败为例,如果这个社会只有少数腐败分子的话,一个腐败分子被揭露出来,他就抬不起头来,即使不用使用法律对他惩罚,他的同事,他的朋友,都看不起他,他就不敢怎么腐败。但是如果这个社会腐败普遍,任何一个腐败官员被揭露出来以后,都不觉得有什么,不会受到声誉上道德上的谴责。

  本来一个人干了坏事,有两个东西惩罚他,一个是法律,另一个是社会声誉。现在在中国情况下,因为腐败太普遍了,所以声誉机制不太起到约束作用,只能靠法律,这就是为什么监管就变得越来越难的原因。好多腐败官员被审判的时候都是一脸无辜的样子,好多观众也觉得他怎么这么倒霉。我没时间分析更深的东西,我只是说,在这里边a或者b究竟多大,它有一个均衡,这个均衡依赖于遵守或违反法律和社会规范的普遍性。

  像我们国家社会问题就非常严重,不仅是腐败问题。比如我们的大学生的推荐信经常造假,我们中国人真的不觉得这是一个问题了,而且觉得很正当。找一个有影响力的老师给你写推荐信,即便这老师不了解你,但这孩子出国,写一个推荐信也不麻烦,自己写好,老师签字就行了,大家觉得这是很自然的事。

  同样的事情如果在国外,会被认为是非常丢人的事,不诚实是最丢人的。但在中国,因为大家普遍说谎,没人认为说谎是不诚实的,所以我们造假东西就会这么多,这意味着我们社会规范破坏到如此程度,不大可能是一个合作型社会。

  人类走出囚徒困境,或者从不合作走向合作最重要机制,也许就是博弈论研究的重复博弈导致的声誉机制,时间关系不能细讲。简单说,一个社会人们越是有积极性从事重复博弈,人们就越愿意合作。你骗一次人家,得到一次好处,但损害了未来声誉,大家以后不跟你合作,你就没有机会得到合作的好处了,你会觉得骗人划不来。反过来说,一个社会中大家只注重眼前利益,没有重复博弈、长期博弈的可能性,这个社会一定坑蒙拐骗横行。

  一个社会是不是有重复博弈的可能性,很大程度上取决于产权制度,在有明确的私有产权界定的情况下,我们从事的就是长期博弈。最简单的例子就是挖矿,如果这个矿的产权是清楚的永久的,你自己不挖还可以卖给别人,这个时候你开矿就会非常注意安全。为什么?出现安全事故损害的是自己。如果这个矿是集体的,国家的,今天让挖,明天可能就不让挖了,能挖的时间你一定会疯狂采挖,掠夺性开采,你也不会买那么多安全设备,事故就会不断发生。

  这是非常重要的一点,传统经济学的价格理论只能解释市场是一只看不见的手,它没法解释我这里讲的市场是一双隐型的眼睛,你干了好事,市场能记得住,你干了坏事,市场也能记得住,你不要以为你骗了人家就真的会获得便宜,你早晚会得到报应,所谓天网恢恢疏而不漏,这就是市场。市场不仅是看不见的手,也是隐型的眼睛,这个理论对我们理解中国社会是非常非常重要的。

  好多人误解了市场,只从价格理论角度理解市场,没有按照我刚才讲的从博弈这样的角度理解市场,就说所有的坑蒙拐骗问题,最后唯一的解决方式是由政府来管制,政府就成立了各种审批机构,监管机构。你看我们有食品医药局,工商局,安检局,等等。但这种机构越多,骗子反倒越多,因为这种机构本身消灭了社会声誉机制,一个社会没有人在乎自己声誉的时候,你靠政府监管是没办法解决问题的。

  图五:作为协调预期的社会规范或法律

  制度的第二个作用,是协调机制。协调机制我也用一个简单的博弈来讲(图五)。假如我们有一个门,比较小的一个门,一次只能进一个人。现在有两个人同时到了门口,那现在就有一个问题,如果两个人都急着往进走,谁都进不来,如果两个人都谦让的话,也是谁都进不来,最好是一个先走,一个后走。

  图五中,我们假定如果两个人同时抢着进门,撞在一起,每个人亏了1;如果两个人都谦让,延误了进门,也亏了1;但是如果第一个人先走,第二个人让一下后走,第一个人到了2,第二个人得到1,反过来如果第二个人先走,第一个人先走,第一个人得到1,第二个人得到2。

  我们再想象,如果你碰到一个人,你预期这个人会先走的话,你的最优选择是什么?后走,你让他一下。反过来说,你预期他后走,你的最优选择是什么?先走。一个人先走,另一个人后走,无论哪一个人先走,哪一个人后走,都是纳什均衡,在这个博弈当中,有两个纳什均衡。

  我们人类博弈的最大难题不是有没有纳什均衡,而是有太多纳什均衡,现在我们就面临两个纳什均衡,那怎么办?怎么协调?谁先走,谁后走,我们就得有一个规则。

  最典型的例子,如果一个老人和一个年轻人都到了门口,一般让谁先走?老人先走。一个年轻人和一个小孩在门口,谁先走?小孩先走。我们中国人讲一句话叫“尊老爱幼”,这句话就是游戏规则,就是一种文化,一个制度,有了这个游戏规则我们就知道,当一个老龄人和年轻人遇到一起,我们知道怎么处事。我们还有“尊师重教”,老师和学生到门口,老师先走!

  这就是游戏规则。有了这些游戏规则以后,我们就可以避免冲突。没有这样的游戏规则,没有这样的文化或习惯的话,可能两个人都谦让,也可能两个人都抢着走,对谁都不好。同样类似的例子还有交通规则,我们在路上开车,靠左行还是靠右行?如果预计错了,你以为别人靠左你也靠左,而他以为你认为他靠右,结果两个人撞在一块,所以我们需要协调,制度就起这样的协调作用。

  我们用纳什均衡来解释制度,使我们对文化或制度的认识发生了非常重要的变化。一个企业文化,一个国家文化的实质是什么?就是帮助人们协调出特定的纳什均衡。如果我们心照不宣,我知道你会怎样行动,不需要到了门口还商量谁先走,这会提高很多效率,因为商量会耽误事。有了这样的规则,老年人一般不用谦让,他知道年轻人会尊重他,他应该先走,年轻人一般也不会抢。这就让我们从完全不一样的视角发现,我们的文化实质上做了一个游戏规则来协调人的行为。

  一个企业或者一个机构里边,如果没有好的文化,没有形成统一的预期,是非常危险的。好比一个老板,嘴上说我们要重视客户利益,结果一个销售人员卖东西的时候发现这个东西有残次,没有卖给客户,回去后老板反而批评他,推销员说这个产品质量有问题,老板说你管他呢,客户不知道,你卖出去就是了。

  这意味着什么?没有企业文化!老板嘴上说要重视客户利益,但实际他的行为不是这样。员工知道老板是这样的话,员工也一定会能把客户能骗一次就骗一次,因为他骗完客户之后有奖金,老老实实拿回去没有奖金。反过来说,如果不合格的产品拿回来了,老板表扬这个员工,那么员工就知道我应该怎么行为。我们说两个企业合并,文化不一样会出现冲突,就类似说一个企业是规定靠左行,另一个企业靠右行,就发生了冲突。

  国家之间也是这样,游戏规则不一样,就会发生冲突。这就是为什么人类需要一些普遍的、大家共同接受的游戏规则。无论是中国还是美国之间,还是中国跟欧洲、印度、越南之间,如果我们想在一个平台上博弈的话,我们必须有一些协调我们行动的规则,即所谓共同的普遍接受的价值观,就是共同遵守的游戏规则。

  如果我们不承认这一点,那意味着什么?意味着就像开车一样,别人靠左行,我们非要靠右行,冲突就不可避免。反过来也可以这样说,如果我们不接受一些共同的游戏规则,意味着什么?意味着人类的冲突只能用拳头,用武力来解决。

  当然我们中国人说,武力足够强大的话,霸道一些也行。所以越是武力不够强大的国家,越需要游戏规则的保护。反倒是武力足够强大的国家,就像社会当中一样,可以霸道一些,可以不守规矩。越弱势的人,越弱势的民族,越需要争取一个普遍规则的保护。

  这是我讲的法律和社会规范的第二个作用,协调作用,协调出一个纳什均衡。在这个作用当中,我们也可以发现,好多法律能做的事,其实社会规范都可以做。现在我们有一个趋势,就是把太多的事务用法律解决,这不是一个好现象,法律能解决的问题有限,这么多事要借助成文法解决不是好现象。人类的社会规范,道德规范给了我们一定的灵活性,人类要面临好多复杂的情况,但法律是僵硬的规则。

  这里我要提醒一点,我们好多人以为法治社会就是由国家制定法律并严格执行法律,做到任何情况下“有法可依,违法必究“。那不叫法治社会。法治是大家认可的游戏规则,所有人都遵守游戏规则,无论这种游戏规则是政府制定的还是民间自发形成的。你不要以为只有政府制定的法才叫法,法治的法包括所有的游戏规则。

  

  4、社会规则的基本功能:承诺与信号

  

  社会规则的第三个基本功能就是承诺作用,这里特别讲一下法律的承诺作用。什么叫承诺作用?承诺就是你要付出成本,在这种成本的制约下,你事后不会采取机会主义行为。

  举个例子,你去买房,说这个房子我看上了,我要买,但我今天没带钱,你给我留着。人家敢不敢给你留?不敢,因为人家给你留下,第二天不你不来了怎么办?你放两万块钱押金,人家就敢给你留,因为不去这两万块钱就拿不回来,这就是承诺。

  承诺改变你事后的最优选择,没有这种承诺情况下,违约是最优的,有了承诺后违约就不是最优的了,这就是承诺的作用。就像合同,我们签一个合同就是做一个承诺,只要签字了,违反这个合同,你就要负担这个合同规定的赔偿。

  刑事犯罪为什么要政府来公诉,而不是按民法来?民法和刑法不一样,民法就是民不告官不纠,你是当事人,你受害了,你可以起诉他,你不起诉就没人管。但是触及刑法了,即便受害人不起诉,政府也必须起诉。

  为什么刑法要这样呢?它使得当事人之间没有商量余地。假如一个富人杀了一个穷人,富人有钱,穷人家属想要钱,很可能由富人提出一个补偿办法,给你一千万。穷人一想人反正死了,有一千万,家庭可以生活得更好,这事就私了吧。但这样的话,就没有办法有效遏制严重的犯罪行为。有了刑法之后,你不能私了,不是给一千万就可以免除责任的,你杀人就得偿命,这就是一种承诺。

  下面我要稍微给大家解释一下,民主和法治从这个角度理解,就是政府对公众做出的承诺。先简单讲一下法治,西方的概念就是有限政府,什么意思呢?如果政府是一个权力不受限制的政府,政府说话,老百姓是不相信的,结果反倒对政府不好。无论任何制度下,老百姓和政府之间是有一个博弈的,你也可以限制老百姓某种选择,但是你不可能消灭老百姓的自然选择权。即便计划经济下,我也可以偷懒,你没有办法。

  在这里,我们分析一下政府和老百姓之间的博弈。政府力量的强大程度,依赖于政府是不是得到老百姓信任,越得到老百姓信任就越强大,越得不到老百姓信任就越弱。17世纪英国政府变成世界上最强的政府,与两个事有关,一个就是大宪章。今年是大宪章800周年,1215年,英王约翰被迫与一些大贵族签了一个协议,这个协议的核心就是限制国王征税的权力。另一个是光荣革命把政府的权力从国王转向议会,政府权力变小了,但从某种意义上,政府也变得强大了。

  在英国光荣革命之前,英国国债只有200万英镑,没有人敢借钱给政府,因为借钱以后他说不还就不还了。光荣革命后,谁都敢借钱给政府,因为你不还钱,就把你赶下去。结果政府能借到的钱的数量大大增加,十年间从200万增加到1700万左右,还在不断增加,这就使得英国政府有巨大的财力在英法战争中占据优势,最后确立了世界霸主地位。

  这个例子说明了什么?表面上看,法治是限制政府权力,但实际上会让政府更强大;非法治下,名义上政府无所不能,什么权力都有,但实际上由于老百姓不相信它,本质上是脆弱的。

  民主也一样。我们中国古代就有民本思想,像孟子讲的民为贵君为轻,政府就是为人民服务的。但为什么长期以来,我们没有办法让政府为人民服务呢?因为我们只是嘴上说说而已,没有制度保证,它不服务你也没有办法制裁它。从今天来看,我们需要进行的好多制度变革,就是使政府口头的承诺变成实际承诺,违反这种承诺,你要付出代价,这样人民才会相信你。

  制度的第四个功能就是信号传递。碰到一个陌生人,你要不要跟他合作?你可能不敢跟他合作,因为你不相信他。一个人是不是合作,依赖于对未来的耐心。一个人越重视未来,你越可以相信他,他不重视未来,你就没法相信他。我们怎么知道一个人重视还是不重视未来呢?我们可以观察好多信号,那个人知道我们观察,他就可能会有意传递一个信号。

  比如送礼,就可以解释为他为了传递愿意跟你合作的信号。他花这么大的代价,给你买一个礼品,就是传递一个重视你的信号。我们好多社会规范也有这个功能。从这个角度来看,有一些社会规范不一定是好的,比如文化大革命,很多人为了当红卫兵,为了表达对毛主席的忠诚,就告发父母,打他老师,这个对社会就很不好。我们今天有没有类似不好的社会规范?也可能有。所以说不是所有的社会规范都是好的。有些不好的,我们就要去改变。

  我还想到一个问题,我们常说,中国人最爱面子,好像西方人不爱面子,我一直对这个有所怀疑。西方人有时候比中国人更爱面子。什么例子可以看出来呢?比如说中国人不搞决斗,西方人长期有决斗,就是为了一个面子的事,或者说尊严。决斗到近代才废除,法律禁止以后,实际上好多人还在决斗。英国首相有决斗致死的,美国总统有决斗致残的。像熊彼特,这么著名的经济学家也跟别人决斗过。

  决斗可能是为了鸡毛蒜皮的事。两个男人为一个女人争风吃醋,就要冒着生命危险决斗。西方人不爱面子吗?他们比我们还爱面子。中国人还经常讲“好死不如赖活着”,一到生命的事,还是让一步算了,好多看法不一定对。当然,决斗就是很坏的社会规范,所以被废除了。

  还有一类社会规范,比如说过去的羞辱性惩罚。怎么羞辱呢?你犯罪以后,刻字或游街,这种羞辱最后是不利于人改造的,不利于人类合作,所以西方早就废了,我们直到现在都没有完全废除。我前不久还看到一个地方开什么公判大会,公判大会就是羞辱性惩罚。这些东西都值得我们思考,所以有些社会规范不一定是好的,有些当时是好的,但随着社会的发展,也可能变坏,这就需要我们去改变它。

  我前边给大家简单介绍了从纳什均衡或博弈论的角度看,社会制度或游戏规则起的几个作用。分析这些可以看出,有演化博弈理论帮助,我们的分析会更好一些。比如人民公社为什么会使人与人之间变得越来越互不信任,农民变得越来越懒?传统中国的农村,什么样的人能够致富?勤劳的人可以。勤劳致富是中国人的传统,人民公社化之后,勤劳就不可能致富了,所以大家变得懒惰了,但这是一个演化的过程。

  在我小的时候,老农民还是比较勤劳的,年轻农民就耍奸。为什么?老农民在个体户或49年之前养成的工作习惯不是一下子能改变的,他种地还比较认真,年轻人就不会,他父母也不会教他认真。当我长大的时候,我准备上大学的时候,就是70年代末期,老农民已经变懒了。为什么?一个是原来的老农民有一部分死了,还有一部分随着时间推移,他看别人都耍奸,他也慢慢学着耍奸了。

  所以这个制度就会这么去演进。改革开放后,农村实行包产到户,农民很快就变得勤快了。但有些东西很难快速转变,过去致富除了勤劳,还有诚实。做人要诚实,我们父母从小就这样教我们,这点现在没有,很难恢复,还得多少年,我不知道。这些东西我们都可以应用刚才讲的纳什均衡或者动态演化博弈等理论来分析。

  

  5、博弈论的不足与未来

  

  讲完这些之后,我最后给大家讲点博弈论不足的地方。博弈论最大的不足就是好多的假设,跟我们实际生活不一定相符,最大的一点还是理性人。博弈论和过去的经济学一样,假设人是理性的,我们知道,这么多年来好多人包括经济学自己对理性论都提出过批评,这些批评可以归结为三个方面。

  一是有限理性。人是想理性,但是你能力有限,记忆有限,加工能力有限,所以你现在做的不一定是对自己最好的。第二是有限毅力,最简单例子就是抽烟,你知道抽烟对你有害,但你还是戒不了烟,这就是有限毅力。第三类叫有限自利,人并不是像经济学家讲都是自利的,还有利他主义。

  这三种批评,都有一定道理,但我觉得都没有讲到关键点上,经济学的理性人假设是一种工具,不是经济学家就真的相信人就这么理性,包括刚才说到的股票市场,我们身上也有好多动物精神,我们贪婪,这个东西我们免不了。

  真正的批评在什么地方?经济学中理性的假设的缺陷并不是刚才讲的这些,而在于经济学的理性是工具理性。工具理性假设指什么?每个人的偏好是规定的,你总是找一个最好的方式满足你的偏好,这就是我们讲的效用最大化。其实我们看,真正的人最重要的理性是什么?不是工具理性,而是价值理性,也可以叫目标理性,就是你应该追求什么,不应该追求什么,而不是我要追求的都是规定好的,只来研究用什么样的方式去满足。

  这是人与人最重要的差别,我们的计算能力是有限的,一个人最需要考虑的是什么东西是值得我追求的,什么东西不值得我追求。在工具理性里,理性在制定目标方面是没有作用的,理性是欲望和情感的奴隶,这是休谟讲的。而在价值理性或目标理性中,理性帮助人们选择目标,所以理性是欲望的主人,这是康德讲的。

  作为经济学家,我越来越认识到其实我们人类最重要是有价值理性、目标理性。我们在生活中说这个人犯傻,不是从工具理性角度,而是从价值理性角度来讲。我们经常会聪明反被聪明误,包括我们对金钱,我们对权力的过分贪婪,本质上都是不理性的。

  这些人与人之间的差别,我认为不是简单自利还是利他能解释的,而在于我们真正的理性程度。一个人看得越长远,意味着他越理性。一个小偷,一个强盗和一个伟大的企业家,如比尔盖茨、乔布斯或马化腾的差别在什么地方?不是说一个自利,一个不自利,而是一个理性,一个不理性。你当强盗,抢人家,这是很不理性的。这是我觉得最重要的一个问题。

  我希望未来博弈论研究的重点,能够往这方面转,我们要重新对理性人本身,理性的含义做出一个界定来。在中国古代,荀子说:“君子乐得其道,小人乐得其欲。以道制欲,则乐而不乱;以欲忘道,则惑而不乐。”真正的君子一定要以道制欲,在他看来,道义,公平公正最重要。小人呢,则满足他短暂的生理的物质的欲望。

  如果我们经济学能在这方面做一些突破,我想再回过头来看,博弈论的很多方法还得有一些改变。如果不从这方面突破的话,经济学包括博弈论面临的好多批评就可能还继续存在,这也是我自己努力思考的一个问题。

  总结一下我刚才这一个多小时跟大家讲的东西。由于纳什提出的纳什均概念,创造了一门新的学科,就是非合作博弈理论。非合作博弈论使经济学发生了革命性转变——从传统的资源配置理论转变成了人类合作或者说制度激励机制理论。纳什均衡可以使我们很好地研究制度,研究过去我们讲的人与制度之间,好人重要还是好制度重要,可以使我们研究制度演进。

  这对我们国家来讲更为重要,我们国家目前有太多坏的纳什均衡,坏的纳什均衡不是说中国人不聪明,而是太聪明,但是结果是什么?对所有人都不利,包括政府官员,那么多的政府官员因贪污而落马。我在《博弈与社会》这本书专门有对政府腐败的分析,大家有兴趣看一下。

  腐败有可能是传统意义上的理性选择,那就是工具理性的选择,腐败为什么这么严重?就是你的游戏规则有问题,这种游戏规则导致纳什均衡一定是腐败均衡。我们怎么改变呢?一个办法就是削减政府权力,如果实行了法治,实行了言论自由,新闻自由,那可能不腐败就变成一个均衡。

  现在,我们的反腐败措施在一定程度上可以遏制一下腐败行为,但没有改变均衡本身,只是在某一定短期情况下使腐败不是最优的,但不等于以后仍然不是最优的,我只是从个人理性的角度来讲。

  最后就是我个人的感受,我希望我们学经济的人都思考这个问题,经济学家应开始注意研究价值理性,研究很多非物质的东西对我们的影响,经济学家过去太执着于研究财富,GDP这些物质的东西,影响人的行为好像都是物质的,其实好多不是,用博弈论我们完全可以研究这些东西。

  过去批评经济学家的人都说经济学家太注重研究物质,这有些道理。以色列曾发生过这样一个故事,一家幼儿园规定五点放学,家长应该五点去接孩子,但是有些家长总是去得很晚,家长去得晚的话,幼儿园老师就得等着,不能把孩子一个人扔在那。后来为了解决这个问题,就出了一个新的规定,如果你来晚了超过15分钟,家长要付一笔钱,来的越晚交的越多。传统经济学预测,这样的话家长就不会来晚了。结果恰恰相反,实行新的制度以后,更多家长来得晚了,而且来得更晚。

  有人批评经济学家,你看你们经济学的预测是错的。错在哪里?错就错在如果你简单从过去的价格理论理解,你只能从物质层面解释说他害怕罚款。其实人有好多心理成本,过去没有这个制度的情况下,我去晚了会觉得很对不起老师,我要道歉,现在有了制度以后,我去晚了给钱就得了,理直气壮。我有更重要的事,干嘛为了这点钱赶这十几分钟呢。

  所以,如果我们只注重从物质利益角度去理解行为,似乎跟经济学过去理解完全矛盾,但是我们如果把非物质的,特别是心理的成本加进去的话,那就完全可以解释这种现象。

  这样的事情还有很多,包括在公司里边加班给不给钱,有些人可能加班给钱他就不加班了,加班不给钱他反倒加班,为什么呢?因为不给钱以后,他加班以后有荣誉感,老板会表扬他,心理感觉好。你给钱的话,你这加班不是为了钱吗?我们知道凡是能够用钱买到的东西,都不是最珍贵的东西。我作为经济学家讲这句话,你们可能觉得奇怪,但这是实实在在的。

  市场经济最大好处,就是把过去珍贵的东西变得不珍贵了,所以每人都用得起,造福于好多人。过去你出差,要从当地买一些土特产带回来给朋友,那很珍贵,现在不珍贵了,因为那地方的礼品北京都可以买着,所以没什么意义了。但是我们仍然保留了一些用钱买不到的东西。我举这个例子是说我们好多思路还要拓展,但我仍然认为博弈论为我们经济学,乃至整个社会科学提供了一种新的方法。

  我在19年前出版的那本《博弈论与信息经济学》,是想把博弈论引到中国经济学界,这本书到现在仍然是被引用最多的经济学书籍,这说明我们中国的经济学家,经济学研究生都开始应用博弈论的方法分析经济学问题。前年出的这本《博弈与社会》,其实是想把博弈论引入整个社会科学,所以这本书有大量的非经济学例子,包括刚才讲的社会习惯、文化,包括大学、政府的运行机制等等。我希望通过这本书,让更多人学会用博弈论的方法分析社会问题。今天晚上我的讲座也是这样的目的。(完)