知己知彼,百战不殆。
——孙子
一般都知道博弈论是冯·诺依曼所创,其实最早的博弈论是孙子和老子的思想。孙子和老子的博弈原则即使在今天仍然是极其高明的,但从理论构造上说还不是成熟的博弈论。顾名思义,博弈论就是游戏理论,但这一点有些似是而非,它虽然与游戏概念有关,但实质上并不是关于游戏的理论,而是关于冲突和合作的理论。比较准确地说,“游戏”只是一个隐喻,它指的是人类社会就像是个游戏,人们为各自的利益而竞争、比赛甚至战争。维特根斯坦也试图以“游戏”为模式去理解人类行为,不过,维特根斯坦研究的是规则问题,而诺依曼研究的是策略问题。我们这里要讨论的是作为策略问题的博弈论,也就是关于人类冲突的一般理论。
博弈需要知己知彼
博弈论通常借用经济学对人的一般理解,同样假定:(1)博弈中的人是自私的,永远追求自己的利益最大化;(2)人们总是以理性的策略去争取自己的利益;(3)人们互相不信任。可以看出,这几个假定并非人类面目的完全写真,所以经常遭到批评,不过,这些假设仍然是最成功的假设,它们虽然不是全真的,但也是似真的。就是说,对于解释大多数人在大多数情况下的行为是有效的。因此,在找到更好的假定之前,人们还是承认这一解释模式。
与人们的利益追求相比,资源永远有限,这是个事实,所以,冲突就成为人类的最大问题。从理论上看,解决冲突的最合理方案是公正分配,即使得人们恰如其分地得其应得,这是几乎所有哲学理论共同承认的理想。但是,公正虽然是最合理的,却不是最可能的。人性贪得无厌,斤斤计较,寸土不让,但其实又互相制约,互相限制,无人能够随心所欲。每个人的争利行为都是一个策略,每个人的策略都构成对他人策略的制约,每个人都必须应对他人的策略,于是形成了人们之间的策略互动互制。博弈论试图揭示互动互制的策略规律,当然,这种规律不像自然规律那样是普遍必然的,只是最有可能的,这已经足够有用了。
诺依曼发现的一个定理称为“最大最小规则”,如果从相反方向去看则是“最小最大规则”,它们在本质上是等价的,是双方对等的策略。假定博弈双方不想拼个你死我活,或者谁都没有把握完全吃掉对方,但也谁都不愿意吃亏,都愿意在能够避免最坏情况的条件下进行合作,那么,满足最大最小规则的利益分配就是最符合逻辑的,这一规则的基本精神就是确保自己得到一个最不坏的结果。“分蛋糕”是一个经典例子:两个小孩分一个蛋糕,谁都想尽量多吃,但这不现实,因为谁都决不让对方多吃,唯一公平的方法是,一个人切蛋糕,另一个人先挑选。由于可以预见先挑的人必定挑大块的,因此切蛋糕的人的最好选择,也就是最不坏的选择,就是把蛋糕切成一样大。值得注意的是,这个结果虽是公正的,却不是出于公正的动机和要求,而是出于自私,导致这一公正结果的原因是博弈的客观条件,是形势所迫的公正。这似乎意味着,人性自私仍然能够形成公正合作。
利益最大化的理性计算:“万一他先我就惨了”
罗尔斯受到“最大最小规则”的鼓舞,设计了“无知之幕”,试图证明,假如每个人都被无知之幕蒙住了眼睛,无法知道自己和他人的能力差距,也不知道自己的社会地位和未来的可能性,在这样毫不知己也不知彼的情况下,自私自利的人们必定会选择一个实际上公正的社会制度,这个制度在利益分配上将相对最有利于处境最差的人们,大概接近“损有余而补不足”的意思。他的计算法是,人们担心万一揭开无知之幕之后发现自己属于处境最差的人,为了避免这一最差结果,就一定会给自己留出保险的后路。罗尔斯的这个理论影响巨大,很有魅力。但美中不足的是,罗尔斯似乎计算得不太对,他的劫富济贫式公正并非“无知之幕”的唯一有效解,理论上其实存在两个以上的有效解,而且严格地说,罗尔斯解甚至不是最优解,最符合“最大最小规则”的解应该是平均主义,每个人都得到平均利益,这才是一个能够满足最保险要求的解。
更深刻的博弈论问题是纳什提出的。纳什发现,在更多的情况下,即使人们有心合作,而且,如果合作就明明会有双赢的最好结果,也会由于无法确保互相可以信任而必然导致不合作的坏结果。纳什这个由数学算出来的无懈可击的结果严重地打击了人类的各种美好理想和价值观,形成至今难以超越的一个根本性困难。最典型的例子是“囚徒困境”:两个疑犯涉嫌重大犯罪,警方对他们分别单独审问,告诉他们说有三种选择:(1)都坦白,则各判8年;(2)一个坦白,一个抵赖,则坦白的释放,抵赖的判12年;(3)都抵赖,则将因其主要罪行证据不足而各判1年。很显然,如果他们信任对方而选择一致抵赖,这是最好结果,但是,残酷的逻辑是,由于他们是理性的、自私的、不信任对方,不愿意比别人吃亏,不愿意冒险,因此他们必然都选择坦白,最后得到一个虽然不是最差但也足够悲惨的结果。
目前,博弈论能够深刻地分析人类如何不合作,但还不能很好地说明如何形成合作。看来,解释坏事容易,解释好事就难得多。
一个坏的纳什均衡