首页 » 思维的发现:关于决策与判断的科学 » 思维的发现:关于决策与判断的科学全文在线阅读

《思维的发现:关于决策与判断的科学》第五章 碰撞:小白鼠与巨蟒

关灯直达底部

尼尔和阿莫斯同在密歇根大学待过6个月,但是两人从未有过交集,两人的思想火花也从未发生过碰撞。丹尼尔在这栋楼里研究人的瞳孔,阿莫斯在另一栋楼里用数学模型分析相似性和决策制定。“我们之间没有什么共同话题。”丹尼尔说。因此,在1969年的春天,当阿莫斯出现在丹尼尔的研讨课上时,十几个研究生都感到意外。之前,丹尼尔从未邀请过什么人来做嘉宾,研讨课就是他一个人的秀场。在他那以现实问题为依托而展开的应用心理学课堂上,阿莫斯和其他所有心理学家一样,显得格格不入。而且,两个人之间看似也不太和谐。“学生们觉得,丹尼尔和阿莫斯好像彼此较着一股劲儿,”研讨会上的一个研究生说,“两位心理学系的明星人物不知怎么并不在一个步调上。”

在离开以色列去北卡罗来纳之前,阿姆农·拉波波特就有一种说不清道不明的感觉,觉得他和阿莫斯的存在让丹尼尔不快。阿姆农说:“我认为他好像有些怕我们,有些怀疑我们。”而丹尼尔却说,他仅仅是对阿莫斯·特沃斯基有些好奇。“我想我得找个机会多了解了解他。”丹尼尔说。

丹尼尔把阿莫斯请到自己的研讨课上,让他愿意讲什么就讲什么。出乎他的意料,阿莫斯没有聊自己的研究——他的研究工作还停留在抽象的理论阶段,也许是他觉得不适合研讨课的氛围吧。稍加留意就会发现,阿莫斯的研究几乎没有与真实世界发生任何关联,在他痴迷于那个抽象世界的同时,丹尼尔却在专注于思考真实世界的问题,尽管他总是在生活中刻意和别人保持距离。

如今人们提起阿莫斯,会说他是一个“数学心理学家”,这多少让人有些不解。在丹尼尔这一类不研究数学的心理学家眼中,数学心理学家基本上就是那些打着数学的幌子,去掩盖他们对心理学的无知,并因此做出一些毫无意义之事的人。而从数学心理学家的角度来看,不懂数学的心理学家纯粹是愚不可及,根本不会理解他们的研究有多重要。当时,阿莫斯正与一帮数学天赋超群的美国学者一道,完成一个三卷本的、内容庞杂、公式密集的教科书,名为《测量基础》——1000多页有关测量的论证和实例。这本书一方面是纯理论的精彩呈现,另一方面却像是幽谷琴音——如果没有人听得到,再美妙的琴音又有何意义?

所以,阿莫斯在丹尼尔的研讨课上没有聊自己,反而聊到了密歇根大学沃德·爱德华兹实验室里正在进行的一项前沿研究,关乎人类在决策制定过程中如何对新信息做出反应。据他介绍,研究人员把满满两口袋筹码放在被试面前,每只口袋里都有红白两种颜色的筹码。其中一只口袋里,75%的筹码是白色,25%的筹码是红色。另一只口袋里正好相反,75%是红色,25%是白色。被试随机挑选一只口袋,然后把筹码一个接一个往外拿,其间不得向袋子里面看。每拿出一个筹码,他都需向研究人员汇报他的猜测:他手中的袋子究竟是白色筹码居多,还是红色筹码居多?

这个实验的妙处在于,以下这个问题能够得到一个准确的答案:我有多大概率会选中红色筹码居多的口袋?解答它靠的是统计学中的贝叶斯定理(以托马斯·贝叶斯的名字命名。他于1761年去世,奇怪的是,人们是在他死后才在其论文中发现了这个定理)。每当被试从袋中拿出一个筹码,贝叶斯定理都能让他们算出手头这个口袋红色居多的概率或者白色居多的概率。在拿出第一个筹码前,这个概率是50∶50,也就是说,被试手中的口袋有50%的可能性是红色居多,另有50%的可能性是白色居多。但是,当筹码被一个接一个拿出后,概率会发生怎样的变化?

从大的方面来说,概率的变化取决于所谓的基准率,也就是袋中红白两色筹码各占多少百分比(这个百分比信息应该是已知的)。假如你知道这只口袋中红色筹码占99%,另一只口袋中白色筹码占99%,那你拿出一个筹码后所判断的概率准确性一定远远高于基准率仅为51%时的准确性。但是除此之外,它还能说明什么?把基准率输入贝叶斯的公式,你就能得出答案。当口袋中的红白两色筹码各占75%和25%,或是25%和75%时,假如你连续三次抽出的是红色筹码,那么你手中口袋以红色筹码居多的概率就该乘以3;假如你连续三次抽中白色筹码,则口袋中以红色筹码居多的概率就该除以3。如果你第一次抽出的是红色,那么口袋中以红色居多的概率就是3∶1(或者说75%)。如果你第二次抽出的还是红色,那概率就增加到9∶1(或者说90%)。假如第三次你抽出了白色,则概率又会降至3∶1。以此类推。

基准率越大,也就是红色筹码和白色筹码之间的比例越大,概率变化得就越快。当你从红白比例为75%和25%的口袋中抽出的头三个筹码全是红色时,那就意味着这只口袋有27∶1的概率,或者略高于96%的概率,是以红色居多。

实验室里不知情的被试们在抽取扑克牌筹码时,可不知道什么贝叶斯定理。如果知道,那实验就没法做了。他们必须靠猜,以便心理学家能将他们的猜测和真实结果做一番对比。从他们的猜测中,心理学家希望能有所发现,看看人的大脑在面对新的信息时,其加工过程与统计计算之间有没有共性。心理学家想知道,人究竟是不是天生的统计高手?当他们不依赖统计公式时,是不是还能够做出准确的猜测?

当时,这项实验给人耳目一新的感觉。心理学家认为,他们的研究成果可以用来解释生活中的各种问题:投资人如何根据收益报告决定下一步行动,病人如何根据医生的诊断判断自己的身体状况?政策制定者如何根据民意调查制定下一轮政策?教练如何根据新的进球部署下一步战略?20岁的女性在检查胸部时被诊断为乳腺癌,那么比起接受同样检查的40岁女性,她被误诊的可能性要高得多(因为基准率不同:20岁女性罹患乳腺癌的概率比40岁女性要小得多)。她是否能预感到自己患病的概率?如果能,准确率是多少?生活中这样的概率游戏俯拾皆是:人们在游戏中表现得如何?准确评估信息的概率是高还是低?人们是如何依据线索得出结论、做出判断的?人们对下一步态势的概率预测是否会因为新情况的出现而改变?

至于最后这个问题,阿莫斯对丹尼尔班上的学生说,密歇根大学的教授们给出了明确的答案:是。他向大家介绍了沃德·爱德华兹实验室里的研究,研究表明,当被试从口袋中抽出的是红色筹码时,他们更倾向于认为该口袋里红色筹码占多数。假如他们抽出的头三个筹码都是红色,那么他们认为袋中筹码以红色为主的概率就变成了之前的3倍。他们的判断没错,只不过,根据贝叶斯定理的计算结果,概率其实变成了之前的27倍。换言之,他们的判断方向是正确的,就是转换的幅度没有那么大。为了描述人们在面对新情况时是如何做出反应的,沃德·爱德华兹实验室的研究人员发明了一个词,叫“保守的贝叶斯人”,意思是说,人们的所作所为很像是依靠公式完成的。当然了,没有人真的以为贝叶斯公式被植入了我们的大脑。

爱德华兹实验室的人员,还有其他许多社会科学研究者,都相信(好像也愿意相信)人们的行为好像和贝叶斯公式脱不开干系。这一观点与当时社会学研究中的主流观点不谋而合。1953年,经济学家米尔顿·弗里德曼发文指出,人们打台球时,不会去计算击出母球时应该采取什么角度,或是使用多大力量。那是物理学家研究的东西。但在打球时,人们就好像精通物理,会从大致准确的角度,以大致适宜的力量,去击球。他们的大脑会形成一个接近标准答案的选择。至于大脑是如何做出这个选择的,并不是我们关注的重点。同样,人们在某些情境中判断概率时,其实并没有做任何的精密计算,但准确率之高往往显得他们好像做过计算似的。

阿莫斯讲完了,丹尼尔却陷入了迷惑。就是这样吗?丹尼尔说:“阿莫斯以一种人们惯用的方式,描述了那些让人肃然起敬的同行们所做的研究。听完后,你会觉得还不错,你会选择相信他们。每每读到刊载在核心期刊上的文章,我们都会折服于它的表面价值,会以为作者所言必然有其道理,否则它也不会出现在这样的期刊上。”可是,阿莫斯所讲的这项试验,却让丹尼尔觉得格外荒唐。人从袋子里抽出一个红色筹码后,会比先前更确信这个袋子是以红色筹码居多:呵,多新鲜哪,难不成他还会有别的想法?丹尼尔以前从没有接触过此类研究,对于人在做抉择时的思维状态,他并不了解。“我从未过多地关注过思维。”丹尼尔说。他对思维的认识,还停留在把思维当成“看见”的阶段。而这项涉及思维的研究,据他所知,与人们在生活中的真实做法并不一致。眼睛见到的,耳朵听到的,往往会是错觉和假象。

丹尼尔最钟爱的格式塔心理学家们,正是从视觉幻象中取得了重大发现:明知是错觉,人还是难免被误导。因此,丹尼尔觉得思维是个不值得信赖的东西。人不是天生的统计高手,人的大脑也不会理所当然地提供“正确”答案——要想明白这个道理,你只需在希伯来大学随便找堂统计课听一听就足矣。学生们并不是一生下来就知道基准率的重要性。他们无论是从大样本还是从小样本中,都有可能得出一个重大的结论。丹尼尔——他本人就是希伯来大学最好的统计学教授——就曾在事后发现,他当初从以色列儿童选择帐篷的倾向中总结出的结论,无法被复制推广,因为样本量太小了。他只调查了少数几个孩子,研究结果并不一定适用于大多数人。换句话说,他曾认为几个扑克筹码和几把扑克筹码的作用是一样的,都能清楚地透露袋中的情况。

在丹尼尔看来,人类并不是“保守的贝叶斯人”,也不是任何一种类型的统计学家。他们常常是依据细枝末节直接做出判断。说人的大脑就像统计学家一样精准,不过是个比喻。但是丹尼尔觉得,这个比喻并不恰当。“我知道自己是个靠直觉做判断的讨厌鬼,”他说,“而且也知道自己一点儿也不比别人更愚蠢。”

沃德·爱德华兹实验室的心理学家与奥斯汀·里格斯中心的精神分析专家堪有一比,丹尼尔之所以对他们抱有同样多的兴趣,是因为这二者都不能正视自己的愚蠢。阿莫斯所介绍的这个实验只能吸引那些秉承如下观点的人:人的直觉判断接近正确答案,他们基本上算是出色的统计学家。

稍加思索,你会发现其中的荒谬之处。现实生活中,大部分事情并不像判断哪只口袋里装有更多红色筹码那样一清二楚。此类实验充其量只能证明一件事:人们不善于通过直觉做判断,不精于此道,因而连明摆在那里的答案都看不到。预测口袋中筹码颜色时表现出色的人,在遭遇更复杂的情境时也会举棋不定,比如预测某个国外的独裁者究竟是不是拥有杀伤性武器。丹尼尔认为,当人们依附于理论时,上述情况就会发生。他们会让证据去顺应理论,而非让理论来检验证据。每当这时,他们的观点就难免偏颇。

无论在哪儿,我们都能看到蠢话被当成真理的事例,其原因就是这些蠢话被披上了理论的外衣,和科学家的研究工作捆绑在了一起。丹尼尔说:“想想看吧,心理学家几十年来一直认为可以通过学习解释人类行为,所以他们去观察饥饿的老鼠如何学习在迷宫中找到方向。这就是他们干的事儿。连智商平平、学识不高的人都认为他们在瞎扯,可他们还在全情投入地研究着被我们视为垃圾的东西。”

研究人类决策制定这一新命题的人们也同样被理论蒙蔽了双眼。“保守的贝叶斯人”这个字眼一文不值。丹尼尔说:“它的意思是人们知道正确答案,并且盗用了正确答案,而非心理活动所致。人们在判断这些可能性时都做了些什么?”阿莫斯本人就是个心理学家,但他在描述这项与心理学毫无关联的实验时,明显持肯定态度,或者说至少是没有质疑。“给人的感觉就像是做数学题。”丹尼尔说。正因为如此,当丹尼尔听到那些白痴理论时,他做了一件希伯来大学任何一个有德行的人都会做的事:他和阿莫斯争辩了起来。丹尼尔后来解释说:“他经常说是我‘让他下不来台’,就连朋友聊天时都会这样说。人人有权表达观点——这是美国人的规矩,在耶路撒冷,我们可不这么干。”

研讨会接近尾声时,丹尼尔显然觉察到了,阿莫斯无力再和他争辩下去。回到家中,丹尼尔对妻子爱丽琦夸口说,自己辩赢了一个桀骜不驯的年轻同事。也可能这是爱丽琦根据记忆所总结的。“这是以色列式辩论的一个重要时刻,”丹尼尔说,“双方都是雄辩家。”

在阿莫斯的人生历程中,他很少在辩论中屈居下风,被对方说服的时候更是少之又少。“你绝不能说他错了,即便他真的错了也不行。”阿莫斯的学生祖尔·沙皮拉说。并不是因为阿莫斯刻板教条。与人讨论时,阿莫斯总是随心所欲,大胆直言,乐于接受新想法和新观点——尽管多数时候这些观点与他的观点之间并不存在明显冲突。可能是因为他往往是正确的那一方,以至于在每一场辩论中,所有人,包括他自己,都会理所应当地认为“阿莫斯是对的”。在被问及对阿莫斯的印象时,诺贝尔奖得主、希伯来大学经济学教授罗伯特·奥曼回忆起的第一件事,就是有一次他的观点让阿莫斯感到了惊讶。奥曼说:“我记得他说‘我从来没有想到过这个’,我之所以记得这件事,是因为很少有什么东西是阿莫斯不曾想到过的。”

丹尼尔后来怀疑,阿莫斯可能压根儿就没有认真地思考过人类思维与贝叶斯统计之间的关系——这不是他的研究方向。丹尼尔说:“可能他从来没有和别人严肃地探讨过这个问题,即便有,也没人会提出如此明确的反对意见。”人们以做数学题的方式进行统计分析,大部分人能算出7×8=56,但假如有人算不出呢?他们有可能犯各式各样的错误。并不是像有些人说的,人的大脑自带一种做数学题的机制,能让他们的错误具有系统性。假如有人问阿莫斯:“你认为人类是保守的贝叶斯人吗?”那他可能会说:“当然不是所有人,但是作为一种宏观描述,它是成立的。”

至少在1969年的春季,阿莫斯对于社会科学领域的主要理论还不是特别排斥。和丹尼尔不同,他并不拒绝理论。对他而言,理论好似一个思维的口袋,里面可以容纳任何你想要容纳的观点。在没有找到一个更好的理论——能够更好地发挥预测功能——之前,旧理论不该被摈弃。理论决定着知识,它使我们有望进行更准确的预测。当时,社会科学领域最具影响力的理论就是,人类是理性的——至少可以说,是称职的直觉型统计学家。他们善于诠释新信息,能够在各种可能性之间做出判断。当然,他们也会有出错的时候,但所犯错误往往是情绪使然,而情绪具有随机性,因此可以被忽略不计。

可是这一次,阿莫斯内心的某种东西发生了改变。离开丹尼尔的研讨课时,他的思绪陷入了一种罕见的状态:怀疑。那些他曾经或多或少认为站得住脚的理论,如今变得令人生疑。

阿莫斯的密友们看出了他的惊人变化。在他们眼中,阿莫斯实际上一直都抱有这种怀疑心态。有一次,他说起了以色列军官在带领部队穿越沙漠时遇到的一个问题,也是他亲身经历过的难题。在沙漠中,肉眼很难判断形状和远近,因而不太容易确定行进方向。“这一点让阿莫斯格外头疼。”他的朋友阿维沙·玛格里特说,“带兵时,你得不停地确定行进方向,阿莫斯精于此道,但即便如此,在沙漠中也会觉得困难。夜间行军时,看见远处的灯光,你会想,这光是近还是远?看见水源,你以为只相隔一千米,最后却花了几个小时才走到。”作为以色列士兵,要想保家卫国,就必须了解这个国家,可这个国家又是那么难以了解。阿莫斯手里有军用地图,但多数时候,地图都派不上用场。不期而至的风暴会彻底改变沙漠中的景观,今天尚在此处的山谷,风暴后却出现在了彼处。在沙漠中带兵让阿莫斯对视觉错觉的感知更加明了:视觉错觉会要人的命。20世纪五六十年代,假如带兵的以色列军官在沙漠中迷失了方向,那么士兵就会不服管束。因为大家很清楚,迷路与死亡仅有一步之遥。阿莫斯感到不解:既然人类具有适应环境的能力,为什么对环境的感知还会出错?

阿莫斯对于决策制定领域其他理论学家的观点并不完全认同,这一点在其他一些事情上也体现了出来。数月前,在还没有参与丹尼尔的研讨课时,他被召回军中,前往戈兰高地服预备役。当时那里并没有战事,他的职责就是指挥新占领区域的一支队伍,监视叙利亚士兵的动向,以判断他们是否有进攻的企图。他手下有一个即将赴斯坦福大学任数学教授的学者,名叫伊兹·卡兹内尔森。和阿莫斯一样,卡兹内尔森的童年时代也在耶路撒冷度过,正赶上1948年的独立战争,当年的情景早已成为他记忆中的烙印。他清楚地记得,犹太人闯入逃离的阿拉伯人的家中,把值钱的东西洗劫一空。“我心想,那些阿拉伯人和我一样,都不是战争的始作俑者。”卡兹内尔森说。当时,他跟着人群跑进一个阿拉伯人的家里,看到一些犹太中学生正挥刀砍一架钢琴——仅仅是为了获取木材。卡兹内尔森和阿莫斯没有谈起这些——这些事最好被尘封起来。

他们二人谈到的,是新近引起阿莫斯好奇心的一件事:人们是如何对不确定事件的发生概率做出判断的?比如,在当时,叙利亚军队发起进攻的可能性是多大?卡兹内尔森回忆说:“我们就站在那儿监视着叙利亚士兵,听他谈着可能性,以及如何确定可能性。他感兴趣的是,1956年西奈战役爆发前,政府为何会认为战争持续不了5年,而另有人认为战争持续不了10年。阿莫斯想要说明的是,可能性是不确定的。人们并不知道如何对可能性做出正确的判断。”

自阿莫斯返回以色列后,假如说他的心中原已产生了裂痕,那么和丹尼尔的这番交集无疑引发了一场地震。那之后不久,他遇见了阿维沙·玛格里特。“我在走廊里等人,”玛格里特说,“阿莫斯走了过来,一脸的心烦意乱。他把我拽进办公室,对我说,‘你想象不到我刚才经历了什么’。他向我说了去丹尼尔那里讲课的事情,说丹尼尔的反应是‘讲得很精彩,但是我压根儿就不信’。他看起来是真的觉得很困扰,我只能尽力安慰他。他说,‘判断力与感知力不可能毫无干系。思考并不是一种孤立的行为’。”当时的最新研究探讨的是人在做出客观判断时,思维在如何运作。但是这些研究并没有涉及其他时刻思维的运作方式。“阿莫斯的这次经历意义重大,”丹尼尔说,“他曾经信奉的那套观点,那套使沃德·爱德华兹的研究能够成立的观点,在这个下午之后,被另一套观点取而代之了。在新观点的参照下,沃德·爱德华兹的研究显得荒唐极了。”

研讨会之后,阿莫斯和丹尼尔有过几次共进午餐的机会,但两人依然是各干各的。同年夏天,阿莫斯去了美国;丹尼尔去了英国,继续开展他的注意力研究。对于这一研究可能具有的价值,丹尼尔已经了然于心。以坦克战为例。在研究中,丹尼尔尝试给被试的左耳输送一组数字信号,给右耳输送另一组数字信号,然后检测他们能以多快的速度在左右耳收听到的信号之间进行切换,以及他们的思维是否能成功地阻隔那些本该被忽略掉的信息。“坦克战和西部枪战一样,作战方确认目标继而采取行动的速度决定着他们的生死。”丹尼尔后来说道。利用这一测试,他可以知道哪一个坦克指挥官能够凭借感觉做出最佳判断——以最快的速度识别相关信号,并聚焦于此,而不是被对方的炮火炸成碎片。

1969年秋,阿莫斯和丹尼尔均已回到了希伯来大学。除了睡觉时间,两人基本上形影不离。丹尼尔习惯早起,所以午饭前的时段人们可以找到他。阿莫斯是个夜猫子,深夜时分去打扰他都不为过。至于其他时间,他们会从公众的视野中消失,一起躲进一间研讨室。路过的人有时会听见两人在里面大声争执,但更多时候,里面传出的是笑声。大家推断,他们二人一定在讨论格外有趣同时也是格外私密的某些事情,因为从来没有人受邀参与过他们的谈话。假如你在门口驻足倾听,也只能听到里面的人在用英语和希伯来语交流。他们在两种语言间来回切换,尤其是阿莫斯,每当他情绪激动时,就会使用希伯来语。

在过去,希伯来大学最聪明的这两个人总是和对方保持着距离,而如今,性格迥异的他们竟有了如此多的共同之处,而且竟然成了知己。这一切不禁让学生们感到匪夷所思。“很难想象他们之间发生了什么化学反应。”曾经师从二人的心理学研究生迪萨·卡夫里这样说。丹尼尔在童年时经历过大屠杀,而阿莫斯,照老话来说,是个“土生土长的以色列人”。丹尼尔总认为自己是错的,阿莫斯却总认为自己是对的。丹尼尔不爱参加聚会,阿莫斯却总是聚会中的核心人物。丹尼尔行事正统,阿莫斯却随性洒脱、不拘小节。和阿莫斯在一起,你随时都能找到一见如故的感觉;而和丹尼尔在一起,即便你昨天刚刚和他聊过天,也会觉得生分,好像又得重新去认识他。阿莫斯是个乐盲,但总会热情似火地哼唱希伯来语的民谣;丹尼尔尽管有副好歌喉,却甘愿将它埋没起来。面对不合逻辑的论调,阿莫斯会断然将其推翻;丹尼尔则总会问“这有没有可能在某种情况下是成立的?”丹尼尔是个悲观主义者;阿莫斯却是个乐天派,他志在于此,因为悲观主义在他眼中是愚蠢的代名词。阿莫斯总是说,当你悲观时,定会有坏事成倍地发生,当你忧虑时,忧愁定会再次找上门。他们在希伯来大学的同事说:“他们是截然不同的两种人,丹尼尔尽管脾气急躁,但还是常常以让别人高兴为己任。阿莫斯却无法理解为什么要去曲意逢迎。他也知道谦卑有礼的必要性,却不懂为什么要刻意为之。”丹尼尔把许多事都看得很重,阿莫斯却惯用戏谑的心态面对生活。受希伯来大学任命担当博士学位评定委员会成员后,阿莫斯对一篇人文学科博士论文的粗制滥造深感惊讶,但他没有直接提出反对意见,而是说:“如果这篇博士论文在其领域内称得上好,那我这儿没问题,但前提是这个作者能够清楚地划分章节!”

除此之外,阿莫斯还是人们所见过的拥有最恐怖大脑的一个人。“人们不敢在他的面前探讨问题。”他的友人说,因为大家担心他会不客气地指出那些他们并未清楚意识到的漏洞。阿莫斯曾经的一位研究生露玛·福尔克说,她因为害怕阿莫斯挑剔她的驾驶技术,而在用车送他回家时坚持让阿莫斯自己开车。如今,阿莫斯的空闲时间都是和丹尼尔一起度过。后者的内心极度敏感,以至于学生的一次差评都会让他长时间地陷入自我怀疑的阴郁之境。把他和阿莫斯放在一起,就像把小白鼠扔进了巨蟒的地盘,可待你回头再看时,却发现小白鼠在滔滔不绝,而巨蟒蜷缩在角落安静地倾听。

其实他们二人也有不少共同之处。首先,两个人都是东欧犹太拉比的后裔。其次,对于人们在“正常的”非情感状态下会有何种表现,他们都极感兴趣。他们都乐意开展科学研究,都希望能找寻到简单而有力的真理。丹尼尔的个性也许算得上复杂,但他依然想要做一个“只研究某一类问题的心理学家”;阿莫斯的研究也许也算得上复杂,但他的最大愿望是透过重重废话找寻出问题的核心。两人都拥有令人瞠目的丰富思想,都是生活在以色列的犹太人,都不信仰上帝。但即便如此,大家注意到的依然是他们之间的差异。

至于两人间的巨大差异,最有力的证据莫过于他们办公室的状态了。丹尼尔的办公助理丹妮拉·戈登回忆说:“丹尼尔的办公室乱成一团,写有一两句话的纸片随处都是。到处都是书,到处都是纸。书总是那样摊开着,以方便他下次接着读。有一回,我看到自己的硕士论文被翻到第13页——我猜他是刚读到那儿。相隔三四间房的地方,是阿莫斯的办公室,而那里,除了桌上的一支笔,什么都没有。你在丹尼尔的办公室找不到东西,是因为那里太乱;而在阿莫斯的办公室找不到东西,是因为那里根本没有东西。”周围人冷眼旁观地揣摩着:为什么他们会相处融洽?一位同事说:“丹尼尔是个难伺候的主儿,阿莫斯又最不买这类人的账,但在丹尼尔面前阿莫斯甘愿迁就,实在让人感到意外。”

关于两人独处时都在做什么,丹尼尔和阿莫斯并没有过多提及,但避而不谈越发激起了周围人的好奇心。刚开始,他们其实还是围绕丹尼尔的那个命题在谈——人类不是贝叶斯人,不是保守的统计学家,不是任何一类统计学家。不管人们在面临概率选择时做了何种决断,都与统计学无关。但是如何才能让被理论或多或少蒙蔽了双眼的社会学家接受这一观点?如何去验证这一观点?二人决定,要设计出一个打破常规的统计测试,交给科学家去检验一下成效。他们将以真实数据为依托,根据人们给出的问卷答案来设计这套统计工具。在此,所选的被试都具备统计学知识,都清楚何为概率理论。问卷中的问题多数是丹尼尔构想出来的,其中有很多是升级版的“红色筹码还是白色筹码”类问题,比如:

某市八年级学生的平均智商是100。为检验当地的教育水平,你随机选择了50名学生接受测试。第一个学生的智商测试得分为150,请判断这50名学生的平均智商。

1969年夏末,丹尼尔设计的这些问题被阿莫斯带到了在华盛顿特区召开的美国心理学年会上,之后又被带到了数学心理学大会上。在那里,一屋子有着极高统计学素养的专家接受了他的测试,其中有两人还曾出版过统计学教科书。测试结束后,阿莫斯将测试结果收集完毕,与它们一同乘飞机返回了耶路撒冷。

在耶路撒冷,他和丹尼尔首度坐在一起动手写论文。办公室太小,所以他们在一间小研讨室展开了工作。阿莫斯不会打字,丹尼尔又不喜欢打字,所以两人就拿着笔记本坐在了一起。他们对每一个句子都会仔细斟酌,每天最多能写完一至两个段落。“我有一种感觉:哦,这绝对不是一番寻常的体验,”丹尼尔说,“因为这一切太有意思了。”

回望那段时光,丹尼尔记得最清楚的莫过于笑声——也就是屋外路过的人听到的笑声。“我脑海中有一个画面,就是试图让椅子靠其后腿保持平衡时,我因为笑得太厉害差点儿摔到地上。”如果两人因为阿莫斯的笑话而大笑,那笑声往往还要更大些,主要原因是,阿莫斯惯于对自己讲的笑话笑个没完。(“他太搞笑了,所以就算是自说自话地发笑,也很正常。”)在阿莫斯的陪伴下,丹尼尔也变有趣了——之前他从未有过这样的体验。而在丹尼尔的影响下,阿莫斯就像换了一个人,他不再挑剔;或者,至少对丹尼尔提出的所有想法,他不再吹毛求疵。他甚至都不再开玩笑。他以前所未有的方式让丹尼尔感受到了自信,而丹尼尔也平生头一回体验到了进攻者的滋味。“阿莫斯从不会以防御者的低姿态去写作,”丹尼尔说,“他有一股自然流露的傲慢气质,觉得自己比所有人都聪明。”完稿后的文章处处都透着阿莫斯的那股自信劲儿,首当其冲的就是文章标题:“小数定律之我见”。然而,文章是两人完美合作的结晶,所以到署名时,他们都认为自己不能觊觎第一作者的宝座,于是靠抛硬币做了决定,最终是阿莫斯赢了。

《小数定律之我见》这篇文章对于人们——包括训练有素的统计学家——常犯的一个思维偏误进行了系统的梳理。文章指出,人们会错误地以为局部能够代替整体。就连统计学家也会从不足以说明问题的少量证据中武断地得出结论。丹尼尔和阿莫斯认为,之所以如此,是因为人们错误地相信——他们不认可也罢——样本必能反映出总体的特性。

在人们对待随机事件的态度中,这种思维偏误表现得尤为明显。以抛硬币为例。人们都知道,硬币落下时,正面朝上和反面朝上的概率是一样的。但是,他们依然认为,如果一个硬币连续多次都是正面朝上落下,那么下一次极有可能会反面朝上。这就是人们常说的“赌徒的谬误”。人们似乎以为,硬币能够自动地调节正反面,好让它们机会均等。“即便是最公正的硬币,鉴于其有限的记忆容量和道德水准,始终不可能像赌徒们期待的那样做到不偏不倚。”他们在文中写道。这句玩笑话显然是学术期刊中的另类。

他们接着又指出,受过训练的科学家——参与实验的心理学家们——也同样会犯此类错误。例如,当这些心理学家只知道第一个孩子的智商得分是150,然后要去猜测一群孩子的平均智商时,他们给出的答案是100,也就是说,他们认为八年级孩子的平均智商是100。在他们看来,智商超高和智商超低的孩子都是群组中的特例,会两相抵消——就像硬币,这次正面朝上,下次就会反面朝上。只不过,贝叶斯定理的计算结果显示,孩子们的平均智商是101。

即便是精通统计学、了解概率论的专家,都没有意识到小样本在代表大群组时所具有的差异性,即样本量越小,其准确反映整体特质的可能性就越低。人们总以为样本能够自我调节,直至可以准确反映它所代表的整体。在大群组中,由于大数定律的影响,其预测准确性是可以得到保障的。假如你抛掷硬币多达1000次,那么最终正面朝上和反面朝上的次数基本会相等;而抛掷10次时,结果就不尽然了。出于说不清道不明的原因,人们就是看不到这一点。“人们对于随机取样所抱的态度似乎是符合小数定律的。也就是说,他们认为小样本和大样本一样,都能反映出它所代表的整体的特性。”丹尼尔和阿莫斯在文中写道。

人类的这种直觉偏误在很多领域都产生了重要影响,例如人是如何行走于四方,如何做判断,以及如何做决定。但是丹尼尔和阿莫斯这篇最终刊发在《心理学公报》上的文章,却主要阐述了直觉偏误对于社会科学的影响。在社会科学实验中,科学家往往从大群体中选取一个小样本,然后来检验某个理论。比如,某位心理学家认为,野营时孩子对单人帐篷和多人帐篷的不同选择可能与他们是否热衷社交活动紧密相关。他挑选了12个孩子作为调查对象,从中验证了他的猜想。但是在现实中,并非所有愿意单独睡的孩子都排斥社交,也并非所有愿与多人同睡的孩子都擅长社交。为了确保研究结论的严谨性,这位心理学家又选取了另一组孩子作为样本,想看看上述结论是否适用。可是,对于多大的样本量才能正确反映整体特征,他做出了错误的判断,因此即便第二次调查验证了他的结论,也只能说是侥幸成之。[1] 鉴于小样本固有的差异性特征,第二次调查结果有可能是完全不同的,根本不能反映大多数孩子的情况。可即便如此,他还是会坚持己见,认为样本在进行自我调控,一会儿能验证他的假设,一会儿又能推翻他的假设。

这就是丹尼尔和阿莫斯眼中很多心理学家所陷入的一个思维误区:认为小样本亦能反映群体特征。丹尼尔本人也不例外。比起大多数心理学家,甚至大多数统计学家,丹尼尔的统计学知识都要更胜一筹。他和阿莫斯的这项研究,可以说是他对自己的研究工作发起的质疑。他渴望从中找出漏洞,到了有点儿迫不及待的地步。丹尼尔热衷于自我纠错的这种态度,为两人的研究注入了极有价值的内容。事实证明,丹尼尔不是唯一一个会犯此类错误的人,每个人都会犯。这不是哪一个人的问题,而是人性中普遍存在的一个弱点。至少,他们二人是这样认为的。

对心理学家进行的测试验证了他们的怀疑。在判断哪一个口袋中红色筹码居多时,心理学家往往会通过少数几个筹码的颜色来做出判断。在探寻真相的过程中,他们过多地依赖了偶然性。此外,由于坚信小数定律,他们也总是会为自己的结论找出合理的解释。

依据阿莫斯和丹尼尔设计的这套测试,心理学家需要回答一个问题:如何指导学生验证一条心理学理论?比如,鼻子长的人更爱撒谎。当学生在样本A身上验证了这一假设,而在样本B身上推翻了这一假设时,他该怎么办?丹尼尔和阿莫斯给这些参加测试的心理学专业人士提供的是多选题。四个选项中,有三个都是建议学生要么增加样本量,要么进一步完善理论。结果,心理学家们几乎是一边倒地选择了第四个答案:“他应该试着分析一下两组样本之间的差异。”

也就是说,当A组被试证实了“鼻子长的人更爱撒谎”,而B组被试证伪了“鼻子长的人更爱撒谎”这一假设时,学生应该为之提供一个合理解释。心理学家对于小样本的依赖程度之高,使他们坚信无论两组的实验结果有多大差异,都自有其道理。丹尼尔和阿莫斯写道:“参与测试的心理学家很少会把超出预期的某个结果归结于取样变异性,因为他会随意地‘注解’任何一种不一致的情况。如此一来,他就很难发现是取样变异性在作怪。他对小数定律的依赖会因而继续存在下去。”

阿莫斯还补充道:“爱德华兹先生……曾指出,人们无法从一组随机数据中提炼出足够多的信息或是得出确凿无疑的结论。他将这种情况归结为‘保守’。但是,在我们的研究中,很难用‘保守’二字来形容被试。相反,就像相似性假说所总结的,他们过分依赖随机数据,总是要大胆地从随机数据中提炼出确定的结论。”(丹尼尔说:“沃德·爱德华兹在学术界地位显赫,而我们却对他大肆抨击——阿莫斯的毒舌已经伸向他了。”)

当1970年年初这篇文章终于完工时,两人已经记不清哪些内容是由哪个人执笔的了。很难说得清是阿莫斯的贡献大,还是丹尼尔的贡献大。但是丹尼尔认为,文章那自信甚至有些狂妄的文风无疑要归功于阿莫斯。丹尼尔本人一直是一个谨小慎微的学者,他说:“假如是我独自执笔,那么除了引用上百条文献并且用词相当含蓄之外,我可能还会自谦一番,说自己不过是刚刚开悟的呆瓜。我原本也可能独立完成这篇文章,但那样一来,它可能不能引起大家的关注。文章如今具有一种明星气质,这都是阿莫斯的功劳。”

丹尼尔认为仅凭他自己,文章不可能有这种风趣、狂放、富于挑衅性的特质。事实上,他认为阿莫斯对文章的贡献也就仅止于此。完稿后,二人将文章交给了一位在他们看来极具怀疑精神的读者,密歇根大学的心理学教授戴夫·克兰茨。克兰茨也是位严谨的数学家,与阿莫斯一同参与了《测量基础》这一艰涩的大部头教材的编写。“我认为文章见地非凡,”克兰茨回忆道,“我现在依然认为这是有史以来最有价值的文章之一。其他文章都反映出这样一个宗旨:通过修正偏差,使之符合贝叶斯模式,继而对人类决策做出解释。这篇文章则完全不同。它与我之前的想法简直是南辕北辙。在不确定的情境中,我们应该依靠统计学做出判断,但实际上我们并没有这样做。他们选择的研究被试都是统计学高手,可就连这些人都会犯错!被试所答错的每一个问题都是我自己也会答错的。”

克兰茨的这一评判——丹尼尔和阿莫斯的文章不仅有趣,而且意义重大——最终在心理学之外的领域也得到了响应。“经济学家再三地说,‘如果有证据表明某件事正确,那么人们就会想方设法找出正确之处’,”哈佛大学的经济学教授马修·雷宾说,“实际上,人人都是出色的统计学家。如若不然,他们是活不下去的。所以,假如你想看看这世上哪些事情算得上重要之事,那么人们不相信统计学这件事绝对位列其中。”

以丹尼尔的性格,他对于溢美之词表现得非常淡然。(“当戴夫·克兰茨说‘这是一个重大发现’时,我还以为他在说胡话。”)但不可否认,他和阿莫斯所取得的发现,远远不止如何开展统计分析。人们习惯从少量证据中得出重大结论,这种倾向如此之强,以至于明知此处有陷阱,人们还是会主动跳下去。“人们对周遭世界长期以来的错误感知,使他们养成了靠直觉做判断的习惯。”丹尼尔和阿莫斯在文章最后一段中写道。这种错误感知深植于人类的思维中。在对不确定的世界进行概率判断时,如果思维不是在依靠直觉得出结论,那它又在依靠什么?如果思维并不像权威的社会科学家和经济学理论认为的那样运行,那它又是如何运行的?

[1] 当时,包括丹尼尔在内的很多心理学家都会选择40个被试作为样本,而这也只能保证他们的研究结论有50%的概率具有普适性。要想将这个概率提高到90%,样本量至少得增加到130。但是大样本检验需要更多的研究投入,整个研究进度会因此慢下来。