首页 » 超越智商:为什么聪明人也会做蠢事 » 超越智商:为什么聪明人也会做蠢事全文在线阅读

《超越智商:为什么聪明人也会做蠢事》贝叶斯前来救援!

关灯直达底部

在辅助沟通案例中所展示的,是考虑备择假设必要性的科学思维原则,这种原则在现实生活中有着广泛的适用性。这种推理策略最基本的形式被称为“反向思维”,这是一种可以被用于解决很多日常问题的心智程序。试想在你的住所附近新开了一家看起来还不错的餐厅,但是你从未在那里用过餐。之所以一直没有尝试,主要原因是据曾经去过那家餐厅的朋友反馈,那里的食物味道非常一般。暂且不管他们的评价是对还是错(也许他们的观点并不具有代表性,你过度受到他们的评价影响),你在不知不觉中认为这是一家很普通的餐厅,好吃的概率大概只有50%。过了一段时间,当你在发廊理发时,刚好遇到这家餐厅的老板。老板认出你是住在附近的邻居,于是热情地询问你为何从未到过他的餐厅吃饭?慌乱之中,你临时编了一个很蹩脚的理由应付他。老板似乎觉察到了你的迟疑与不情愿,询问道:“怎么了?发生了什么事情?来过我店里的顾客有95%都说很好吃呢。”

老板的这番话能够打消你的疑虑吗?你有想去那家餐厅尝试一下的冲动吗?老板的一面之词能够证明这家餐厅很棒吗?

上述问题的答案毫无疑问是一个坚决的“不”。事实上,如果硬要说老板的这番话对你的态度有什么影响的话,也许是让你变得更加不愿意去尝试。很显然,老板的说法没有提高这家餐厅在你心目中的印象。他的推理过程出了什么问题呢?为何他的说辞并没有成为证明这家餐厅值得一去的有力证据呢?

18世纪,来自英格兰坦布里奇维尔思的教士托马斯·贝叶斯(Thomas Bayes)提出的定理为这个问题提供了理论性答案[1]。贝叶斯公式基于两个基本概念:待检验的焦点假设(称为H),以及与假设相关的数据集合(称为D)。在下面我将要给大家展示的公式中,你将看到这样的符号:~H(非H)。这个符号代指备择假设,即如果焦点假设为假,则备择假设一定为真,两者是相互排斥的。因此,按照惯例,备择假设为真的概率等于1减去焦点假设为真的概率。例如,如果我认为鱼竿另一端咬钩的鱼是鲑鱼的概率为0.6,那么,这只鱼不是鲑鱼的概率就是0.4。

接下来的章节是本书中技术性最强、对数学要求最高的一部分。但是,此处的重点与难点并非在于数学公式,而是概念。即使你有数学恐惧症,想要忽视所有的数字和公式,也应该对理念有清晰准确的把握,这是关键所在。掌握贝叶斯思维方式,除了一些词汇规则之外,你并不需要学习太多其他的知识。正规的贝叶斯统计肯定包含计算,但是,为了避免犯概率相关的思维错误,你只需要掌握正确进行概率计算思维方式所需的概念性逻辑即可。

在接下来出现的公式中,P(H)表示在收集数据之前估计焦点假设为真的概率,P(~H)表示进行数据收集之前,备择假设为真的概率。另外,接下来的计算中还牵扯到一些假定概率(条件概率)。例如,P(H/D)代表在对数据(D)模式进行分析之后,焦点假设为真的概率;P(~H/D)代表备择假设的后验概率。P(D/H)表示在焦点假设为真的情况下,观察到特定数据模式的概率;P(D/~H)(下文中将要提到,这是一个非常重要的值)代表在备择假设为真的情况下,观察到特定数据模式的概率。需要引起重视的是,P(D/H)与P(D/~H)并非是互补的(两者相加不为1)。数据有可能同时给定焦点假设和备择假设,也有可能不给定焦点假设和备择假设。

接下来,我们将聚焦于贝叶斯公式中理论性最强的一种变形形式,该公式以概率形式呈现:

在这个比率等式中,或者说概率形式公式中,从左至右3个比率分别表示:在获得新数据(D)的情况下,焦点假设(H)成立的后验概率;焦点假设概率除以备择假设概率,被称为相似率(LR);焦点假设成立的先验概率。具体来说:

该公式告诉我们,在给定数据集的情况下,焦点假设成立的概率等于两个概率的乘积:相似率乘以焦点假设成立的先验概率。即:

焦点假设的后验概率=相似率×先验概率

值得引起大家重视的一个问题是,不知道贝叶斯定理,并不意味着这个人一定是非理性的。普通人其实并没有必要熟记这个公式。问题在于,无论个体的判断是否遵循贝叶斯定理,人们在做出概率方面的决策时,通常是根据自动化加工做出的推测,实验室研究所关注的正是这种自动化推测是否符合贝叶斯定理的限制条件。当我们跌倒在地时,我们的身体倒下的轨迹遵循牛顿定律。当我们跌倒时,我们不会有意识地根据牛顿定律进行计算,但是,我们的行为可以被认为是遵循牛顿定律的。同样的道理,人们在做出判断时也许并不知道贝叶斯定理,但我们仍然可以将他们的行为描述为符合贝叶斯定理的理性推理。哪怕在人们不了解任何贝叶斯公式的有关知识,或是没有进行有意识计算的情况下,人们的概率判断也有可能被认为是遵循贝叶斯定理的。

个体的推理偏离贝叶斯定理的形式多种多样,在接下来的章节中,我将重点关注其中一种[2]。

通常情况下,当人们对证据的可诊断性进行评估时,即评估[P(D/H)/P(D/~H)],常常会忽略掉分母[P(D/~H)]。在焦点假设为假的情况下,人们没有意识到评估获得观测数据概率的必要性。

这是由于没有想到反例而导致严重推理错误的理论性原因。好了,现在让我们回顾一下在开篇中提到的社区餐厅老板的故事。如果你认为老板的回答很棒,那么你跟他犯了相同的错误。原因如下:

根据贝叶斯定理,餐厅老板仅提供了P(D/H)的信息[如果这是一家很棒的餐厅,少于5%的客人会投诉的概率],而忽视了P(D/~H)[如果这是一家很糟糕的餐厅,少于5%的客人会投诉的概率]。他/她希望告诉你一个很高的P(D/H),以提高餐厅的吸引力和你光顾的概率,但是你(正确地)意识到,如果要评估后验概率,仅仅有P(D/H)是不够的,因此你并不会被老板说服。你觉得老板提供的论据可信度不高,并且,由于老板没有提供P(D/~H),你可能还会做出一些其他的假设。在这个简单的例子中,你能够认识到获取P(D/~H)的必要性。换句话说,如果这家餐厅很糟糕,有5%的客人会直接向老板抱怨的概率是多少?

上述情况如何用贝叶斯公式表达呢?请大家先来回想一下贝叶斯公式的基本形式:

后验概率=相似率×先验概率

让我们假设你收集数据之前估计这家餐厅很棒的概率是0.5,那么,估计这家餐厅很差劲的概率也是0.5。因此,认为这家餐厅很棒的先验概率是0.5:0.5,即1:1,用博彩术语来说,就是赌一赔一。

这个例子中的相似率指的是什么呢?根据老板提供的信息来看,95%的客人从未抱怨过这家餐厅。因此,可以对此处的相似率做如下表述:

假定这是一家好餐厅,很有可能有95%的客人都不会抱怨、投诉餐厅。事实上,5%的投诉率在竞争激烈的餐饮业中是非常高的,这样的餐厅很有可能面临生存危机。因此,95%的客人用餐后没有任何怨言这一评价指标,超过99%的好餐厅都可以轻松达标。餐厅老板所犯的错误在上述公式的分母部分,即P(D/~H)。如果这是一家很差劲的餐厅,超过95%的客人不会抱怨的概率是多少?这里问题就多了。多数差劲的餐厅并非一如既往得差。另外,多数餐厅之所以收到差评,并非因为顾客对食物有所怨言(那样的餐厅距离关门不远了),而是由于这家餐厅的各方面一直都差强人意,或是差于周围餐厅的平均水准。这些餐厅并非提供令人反胃的食物,而只是“一般般”的餐厅。再考虑到基于社会化因素,当人们仅仅是轻微不满意时,通常不会公开表示抱怨。也就是说,人们如果在一家很糟糕的餐厅吃饭,虽然心中暗下决心绝对不会再去第二次,但多数人离店时都不会把抱怨挂在脸上或者说出来。这就是为何餐厅老板提供的95%满意度的数据并没有很强的说服力。

如果这家餐厅很差劲,有90%的概率至少有95%的顾客离店时不会口头表达不满。当我们把这些数据代入到贝叶斯公式,结果如何呢?

后验概率=相似率×先验概率

后验概率=(0.99/0.90)×(0.5/0.5)

后验概率=1.1

“这是一家好餐厅”的赔率是1.1比1(这是一家好餐厅的概率已由50%变为52.4%[3])[4]哪怕是最为乐观的估计,这家餐厅值得品尝的概率都不大。

餐厅老板试图诱惑我们犯思维错误。他的伎俩包括以下3步:

(1)制造一个已知数D,以产生很高的P(D/H);

(2)希望对方忽视P(D/~H);

(3)仅仅根据高P(D/H),推测焦点假设的发生概率。

越来越多的研究表明,人们普遍倾向于忽略能够证明非焦点假设为真的证据。例如,心理学家麦克·多尔蒂(Michael Doherty)及其研究团队使用一种简单的范式对这个问题进行了研究。该研究范式让被试想象自己是一位正在给红疹病人做检查的临床医生[5]。研究者给他们提供了4条信息,要求被试从中选取一条可以确诊病人患有“Digirosa”的临床证据。这四条信息内容如下:

患有Digirosa的人口比例。

没有患Digirosa的人口比例。

患有Digirosa的患者中,红疹患者的比例。

未患Digirosa的患者中,红疹患者的比例。

这些信息对应于贝叶斯定理中的4个术语:P(H),P(~H),P(D/H)和P(D/~H)。由于P(H)和P(~H)是互补的,所以在计算后验概率时,实际上只有3条信息是必需的。其中,未患Digirosa的人群中红疹患者的比率,即P(D/~H),是必选的信息。因为根据贝叶斯定理,它是计算相似率不可或缺的关键部分。然而,在多尔蒂及其同事的研究中,48.8%的被试没有选择P(D/~H)这条信息。因此,对于很多面临这个问题的人来说,未患Digirosa的红疹患者数量与当前问题的解决毫无关系,它被(错误地)认为是一件无关痛痒的事。

能够意识到P(D/~H)的重要性,这并非是默认安装在大脑中的心智程序,因此,选择它作为解决问题的必需信息看起来有些“反直觉”。人们必须通过学习而得知这条信息的重要性,否则,默认的信息加工过程会选择忽略这条信息。因此,那些没有认识到加工P(D/~H)重要性的人,可以认为他们存在心智程序缺陷。

[1] 更多关于托马斯·贝叶斯的信息,参见斯蒂格勒的文章(Stigler,1983,1986),关于贝叶斯公式在心理学领域中的应用,参见费诗霍夫的文章(Fischhoff and Beyth-Marom,1983)。

[2] 此处需要格外强调一下,随着本书的深入展开这个问题会越来越明晰。本章中所讨论的这些概率推理问题并非只会出现在实验室,或是传说轶事中,也并非只会出现在家庭聚会小游戏上的错误。我们将会看到,这些错误出现在一些极为重要的领域,包括金融规划、医学决策、生涯规划决策、家庭规划、资源分配、税务政策和保险购买方案等。很多文章对这些推理谬误在多个领域中的现实意义和价值进行了讨论(舠tebro,Jeffrey,and Adomdza,2007;Baron,1998,2000;Belsky and Gilovich,1999;Camerer,2000;Chapman and Elstein,2000;Dawes,2001;Fridson,1993;Gilovich,1991;Groopman,2007;Hastie and Dawes,2001;Hilton,2003;Holyoak and Morrison,2005;Kahneman and Tversky,2000;Koehler and Harvey,2004;Lichtenstein and Slovic,2006;Margolis,1996;Myers,2002;Prentice,2003;Schneider and Shanteau,2003;Sunstein,2002,2005;Taleb,2001,2007;Ubel,2000)。

[3] 这个概率值是通过贝叶斯公式的一种变式计算而来:P(H/D)=P(H)P(D/H)/[P(H)P(D/H)+P(~H)P(D/~H)];P(H/D)=(.5)(.99)/[(.5)(.99)+(.5)(.90)]=.5238

[4] P(H/D)=1-P(~H/D),故P(H/D)=1.1/(1.1+1)。——译者注

[5] 文献出处:Doherty and Mynatt,1990。