我们已经知道,由于一次性博弈的大量存在,引发了很多不合作的行为。而且,即便是在重复博弈中,合作的一方在遭到对方背叛之后,往往没有机会也没有还手之力去进行报复。比如,资本积累阶段的违约行为,国家之间的核威慑。在这些情况下,要使交易能够进行,并且防止不合作行为,必须设置严格的惩罚背叛行为的机制。
有人曾经在网上提供了这样一个集体活动迟到的问题。
王老师是某班的班主任,他经常组织本班同学参加集体活动,比如郊游。但在组织的过程中,他遇到了一个棘手的问题。在一次集体活动中,王老师通知全班同学早上8:00到校门口集合。结果有几个同学拖拖拉拉,导致大家8:15才出发,从而白白耽误了一刻钟。
在此后的集体活动中,王老师改变了策略,虽然真实的集合时间仍是8:00,但是他通知大家7:45集合,结果最晚的几个同学也在8:00赶到,从而准时出发。王老师对自己的策略很满意。
但是好景不长。时间久了,同学们都发现了王老师通知的集合时间故意提前,甚至可以根据王老师的通知猜测出真实的集合时间。因此,每当王老师通知7:45集合时,大家仍然按照真实的集合时间,也就是8:00来做安排,从而导致几个同学在8:00后才赶来。而那些准时即7:45到达集合地点的同学都开始抱怨,进而也变得不那么守时了。
王老师的目标是通知合适的集合时间,从而达到准时出发且避免同学因为等待而有所抱怨。那么应当制定怎样的策略,才能使活动准时开始并使大家都满意呢?
在这个问题中,存在着老师与学生、学生与学生之间的博弈。实际上也是一种多人的囚徒困境。因为每个学生都知道,其他学生的占优策略是选择到达集合地点的时间,既不能太早,以免白白浪费等待的时间;又不能太晚,以免承担耽误大家时间的责任。
要破解这个困块,老师有两个策略选择:一是只要过了集合的时间,就不再等下去,让迟到的同学独自承担责任。这种责任和相应的惩罚对同学会造成很大的损失,他们就不会再迟到了。二是如果迟到的学生比较多,那么等某个数量的学生到齐以后马上出发,而让迟到时间过长的那些同学承担责任。
一般说来,博弈中双方合作时得益最大,但若一方不遵守合作约定,必定是另一方合作者吃亏。所以需要引入惩罚机制:谁违约,就要处罚他,使他不敢违约。一位玩家之所以会与另外一位合作,只是因为他知道,如果他今天被骗,明天还能对欺骗实施惩罚。奥曼先生把这一洞察结论称之为“无名氏定理”。
只有对迟到的学生进行惩罚,迟到问题才能解决,一句话,也就是实行一份带剑的契约。从囚徒困块中我们可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下定律:按照你希望别人对你的方式来对别人,但只有他们也按同样方式行事才行。