因为新生儿的身体免疫系统还未发育成熟,所以需要采取一切措施使其尽量少接触到细菌和病毒,以避免引发疾病。
——“健康婴儿抗菌建议”,美国有线电视新闻,2011年2月2日
在成长早期接触到的细菌种类越多的婴幼儿,在长大后出现各种过敏症状的概率越小。
——“婴幼儿接触病菌与低过敏风险的关联”,加拿大电视新闻,2011年11月3日
我们每天都会被朋友、同事和媒体提供的各种信息淹没,他们竭力向我们建议,应当如何生活以及如何进行专业活动。
在过去10年中,我们了解到应当在饮食中尽量减少摄取脂肪,而现在我们却得知适量的脂肪是对人体有益的。去年的报道说老年人补充维生素B6可以改善情绪和提升认知功能,而今年的消息否定了维生素B6的这两种功效。15年前,权威人士说每天喝一杯红酒有益于心血管健康,8年前的研究说所有的酒类都有此功能,而上个星期人们又说只有红酒有效了。
即便我们有意默认相信最新的医学建议,我们还是得思量不同建议之间的矛盾之处。詹妮弗表姐的牙医建议每天使用两次牙线来清洁牙齿,而你自己的牙医则建议偶尔使用牙线就足够了。
《纽约时报》的金融作家建议你抛售股票、买进债券;《华尔街日报》的客座专栏作家建议你购置房产,并存储大量现金;你的理财顾问建议你“把鸡蛋放在多个篮子里”;你的朋友杰克的理财顾问则劝你转移基金,改买国外的股票。
你的朋友埃洛伊丝和马克斯十分热切地想把孩子送进最好的早教班,为此不惜一切代价;你的朋友厄尔和迈克则想让他们初学走路的孩子在家里接受教育,他们认为专门报一个早教班是多此一举,只想让孩子快乐地成长。
本章会为读者提供一些技巧,如何评估媒体上的各类科学说法和熟人们给出的各类建议,读者们能够学会如何自己搜集和分析信息。你会看到,如果我们一味依赖那些对于受到干预的结果的假设,而不是进行相关实验去证明的话,会造成多么糟糕的结果。
说服力的链条
2月,你看到美国有线电视新闻网(CNN)的新闻,他们告诉你让你的孩子远离病菌;11月,你又看到加拿大电视台的新闻,他们说病菌对孩子有好处,多接触可以降低孩子患自身免疫性疾病的概率,比如过敏症。你该相信谁呢?什么样的证据可以说服你让孩子接触病菌,而哪种证据又能让你倾向于让孩子尽量远离病菌?这里有一些自然实验可能会对你回答这些问题有用。一个自然实验是将两个(或几个)有共性却在某个层面上存在差异(此差异与变量结果相关)的样本进行对比。没有人可以操纵那种可能的相关差异,如果有,那就将是真正的实验了。同时,我们也没有任何理由假设这些样本在某种程度上有差异,这样也会导致对比无意义。
假设你知道德国东部的人比德国西部的人更不容易过敏。
假设你知道俄罗斯人比芬兰人更不容易过敏。
假设你知道农民比城市居民更不容易过敏。
假设你知道那些参加了日托项目的孩子比没有参加的孩子更不容易过敏。
假设你知道那些在婴幼儿时期就与宠物相伴的孩子比没有和宠物玩耍的孩子更不容易过敏。
假设你知道那些在婴幼儿时期时常腹泻的孩子比腹泻少的孩子更不容易过敏。
假设你知道那些以自然分娩方式出生的孩子比剖腹产出生的孩子更不容易过敏。
这些真实发生了,它们都是真实的。在一些相似的样本以一种特定的方式恰好不同(实际上是自变量)时,这会引发结果上有争议的差异(过敏作为因变量),在这种情况下,自然实验类似于真正的实验。每种自然实验都提供了一种对假设的检测方法,这种假设即是早期接触病菌会对过敏产生免疫性,对其他自身免疫性疾病也会有抵抗,例如哮喘。(自身免疫性疾病是一种反常的,会对身体中正常存在的物质产生错误“保护”作用的过度反应,在这种情况下,白细胞会攻击身体组织。)
过敏产生的后果小到令人难受、大到使人身体虚弱,而哮喘引发的后果糟糕得多。在美国,每天都有上万个孩子因哮喘不能上学,数以百计的人因此进入医院,还有人因此而去世。
我们可以假设德国东部和俄罗斯的医疗卫生条件比德国西部和芬兰要差,或者我们可以说在不久之前是这种情况。(有趣的是,许多年前,一位移民美国的波兰人半开玩笑地告诉我,他认为过敏这事是美国人的发明。他可能语带玄机。)
我们也可以假设在农场长大的孩子比在城市长大的孩子更有可能接触到多种病菌。我们知道常和宠物在一起的孩子会接触到更多细菌,包括宠物的排泄物中的细菌。我们还知道刚学会走路的孩子简直就是行走的细菌培养皿,他们在日托幼儿园彼此传播细菌的可能性比在家高许多。许多腹泻的病例都是接触了大量病菌而致。通过自然分娩的婴儿在母亲的阴道里接触了各类细菌。这些自然实验都支持了细菌对婴幼儿有益的观点。
我怀疑这些发现会鼓励你让自己的孩子处在更加恶劣和不洁的环境里,甚至让孩子接触到最不堪的那类细菌,比如黏液和动物排泄物中携带的细菌。
但是,如果你知道在孩子6岁时清理其带有各类细菌的直肠可以降低免疫缺陷,你会怎么做呢?事实就是这样。我们现在有了相关性证据,或者说观察性证据。在一类人群中,早期接触病菌的范围越广,其患自免疫性疾病的概率越低。
如果你仍旧不想让孩子接触大量不同的病菌,那么当你知道有一个相当可信的假说——“病菌暴露理论”可以解释这些相关的和自然实验的证据,你可能会受到影响。早期接触病菌可以刺激免疫系统,而这种刺激会在日后有益于身体。处在发育初期的免疫系统可以通过这种方式增强其抵抗力,适应环境,调试自身,日后较不易感染炎症,自身免疫性失调的可能性也会降低。
现在,你是否做好准备让你的宝宝接触一点儿脏东西了呢?我得承认,我恐怕不会这样做。的确,自然实验、相关性证据和可信的理论看上去都很有说服力,然而我还是想通过真正的双盲,随机控制实验来检验这种论断。在这个实验里,婴儿要通过众所周知的那种掷硬币式的随机分配法被分配到实验组和控制组中,实验组是高接触病菌的环境,而控制组正相反。实验者和参与者(在这里是母亲们)都对婴儿接触到的具体环境不知情。这种双盲设计可以避免由这两者在知情的情况下可能带来的影响。如果实验证明那些接触了更多病菌的孩子会更不易过敏或患上哮喘,那么我会严肃考虑让我的孩子接触大量病菌。
然而,我还是不确定我真的愿意让我的孩子成为像豚鼠一样的实验品,尽管实验之前的确说服了我。幸运的是,不需要任何人把他们的孩子当作实验品。有大量的动物模型可以帮助我们实验。这是一种在进化序列上接近于人类的生物,那些实验环境对这类生物产生的效果类似于对人的效果。
研究者研究了幼鼠接触病菌程度不同所产生的结果。研究者没有将幼鼠置于可高度接触病菌的环境中,转而创造了一种无菌环境并放置一些幼鼠于其中,同时将控制组的幼鼠置于有一定病菌存在的普通实验室环境中。结果,那些在无菌环境中的幼鼠在结肠的部分位置和肺部出现了异常数量的杀伤性T细胞。这些多出来的T细胞甚至会攻击那些不具有威胁性的物质,结果使得幼鼠们易发炎、过敏、患上哮喘。
我想我现在会听从加拿大电视台的建议,让我的孩子接触病菌,即便这的确会让我极度紧张。(还是请读者们对我的建议保持警惕。毕竟,我不是真正的医生,而只是一个博士,就像我儿子不时会提醒我的那样。)
如果你决定让你家的婴儿接触大量的病菌,请注意这种接触可能主要在生命最初的几年起作用。因此,你可能并不想无限期地有意让孩子接触病菌。
无论你是否相信,就在我完成上述文段的那个星期,《美国医学会小儿科期刊》上发表的一篇文章指出,被一些人认为是由肠道易激综合征引发的婴儿腹绞痛,可以通过让婴儿摄入5滴含有罗伊氏乳杆菌的溶液得到缓解。这种治疗方式可以让近半数腹绞痛的婴儿减少啼哭。
要是你年幼的孩子被感染了怎么办?你会听取医生的建议让孩子注射抗生素吗?如果你了解到越是富裕的国家,人们患上炎症性肠病的概率越高,包括克罗恩氏病和溃疡性结肠炎,你会如何做?这些疾病可能让患者的病痛非常严重,甚至会致命。它们会引发腹痛、呕吐、腹泻、直肠出血、严重的腹部绞痛、贫血和体重下降。这应当引起你的警觉,即这种炎症性肠病,就像过敏和哮喘一样,也是自身免疫性疾病。相关的症状提供了间接的证据。不过,富裕本身并不会引发炎症性肠病。
但是某种与富裕有关联的东西可能会引发这个问题。一些上了年纪的人会记得他们还是孩子的时候被瘟疫冲击,患上中耳炎,而他们自己的孩子因为新时代发明出了阿莫西林得以在刚感染的时候就得到了有效治疗。一个国家越富裕,那么你去看医生的可能性就越高,那么便能通过抗生素得到救治,而借助医疗保险或自己出钱付诊费的概率也越高。
然而,如果你像我一样,你可能会怀疑注射所有的抗生素是否是个好主意。看起来,我确实也在担心。那些耳部严重感染且注射了大量抗生素的孩子更有可能在日后患上炎症性肠病。
抗生素的作用有些过大。无论好坏,它们都会杀死,以及肠道的微生物群落中的丑陋的东西。
在成年人身上使用抗生素也会和患上肠道疾病有关联。研究者发现,两年前注射过多种抗生素的成年人患上炎症性肠病的概率是其他人的两倍。
我们的证据依然只是间接的。现在需要做一个真正的实验。是的,这样一个真正的实验是存在的。
如果没有接触良性细菌是引发炎症性肠病的原因,那么可以向肠道中注射良性细菌。比如使用含有健康人体肠道内部成分的灌肠剂就是治疗炎症性肠病的有效方式。
勇敢的科学家们,甚至是那些更勇敢的病人,就曾尝试这个实验。(“所以,琼斯太太,在这个实验中,我们要将一个陌生人肠道中的提取物注入你的肠道内。并不是因为我们要拿你做实验,而是这确实会对你有好处。”)幸运的是,这个实验奏效了。接受此治疗法的病人的病况确实有所改善,比那些控制组中注射盐水的病人的情况要好。(这对你也是个好消息,现在有可能买到含有有效肠道菌的药片了。)
要做一个有关治疗任何具体的儿童疾病是否需要注射抗生素的决定都需要大量研究,以及全面的成本–收益分析。这种方式对于感染了疾病的成年人同样适用。
从自然实验到适当实验
从自然实验中可以得出一些十分重要的推论,而这些需要通过适当实验来进一步研究。
那些父母受教育程度不高的孩子也可能在学业上无法有太大作为。如果教他们一年级的老师的教学能力处于学校后三位的水平,那他们在小学的表现更可能比较糟糕。如果他们足够幸运,遇到一位教学能力在学校里排前三位的老师,那么他们的学业表现有可能接近中产阶级家庭出身的孩子。这种发现包含了一种自然实验。如果孩子们被随机分配在老师教学水平不同的班级里,那么我们可以进行一次真正的实验。同时,什么样的父母在听到自然实验的结果会对教师的教学水平采取漠不关心的态度呢?
城市中的绿色植物很好,甚至比你假想的还要好。一项针对芝加哥同等公寓的研究发现,在周围种植了绿色植物的公寓发生犯罪案件的数量比在周围一片荒芜或是只有混凝土墙壁的公寓中的案件少一半。鉴于我们在第1章中就讨论过,微妙的情境性暗示会深刻地影响人们的行为,因此这项研究并不令人惊讶。这项研究可能是一个真正的实验,因为芝加哥住房办公室的人员相信实验是随机选择公寓的,并且没有理由认为那不正确。另一方面,普通人在提及“随机”一词时,他们理解的含义未必和科学家的定义相同。因此,若要确定绿色植物和低犯罪率之间的联系,还需要进行真正的随机实验研究,以找到二者之间的可能因果关系,而不仅止于某种关联。很明显,这种真正的实验十分必要。如果由真正的实验得到的结果与自然实验的结果一致,那么我们需要用第4章中讨论过的成本–收益分析来进一步分析。这样的分析可以明确得出拆掉混凝土墙,种上绿植要耗费的成本。这种分析可能会表明改变城市布局是个可商讨的课题。
科学家们常常从他们在自然实验中的偶然发现里得到灵感。18世纪的医生爱德华·詹纳注意到挤奶女工很少会得天花,而这种疾病和牛痘有关系,挤奶女工会接触到牛痘。或许挤奶女工比黄油搅拌工人得天花少是因为牛痘在某种程度上起到了保护作用。詹纳在一位年轻的挤奶女工手上提取了牛痘菌,然后将牛痘菌中的一些物质接种在一个8岁男孩的身上。这个男孩发了高烧,并且腋窝处感到不适。几天后,詹纳从一个天花病人身上的创伤处提取天花病毒接种在了男孩身上。这个男孩并没有患上天花,于是詹纳宣布他发现了一种防止感染天花的方法。在拉丁文中,“vacca”这个词指牛,而牛痘则是“vaccinia”,因此詹纳将他的治疗方法称作“vaccination”,即种痘。一个自然实验引致了适当实验,而后产生了改变世界的发现。今天,天花只是作为一个单纯的病毒样本被保存在实验室里。(它之所以被保存,是因为万一世界上的某个地方出现这种疾病,便需要从它那里获取制成疫苗的物质。)
不做实验付出的高昂代价
不严肃进行实验,我们有时会付出生命、财产、幸福的代价。
在实施“开端计划”的近50年中,我们已经投入了2000亿美元。开端计划是一个针对学龄前儿童的项目,主要帮助那些贫困家庭和少数族裔的孩子改善其健康状况,提升学业成绩,甚至是智商水平。我们从这些投资中获得了什么呢?这个项目确实让孩子们的身体素质改善,在初期提高了他们的智商水平和学业成绩,然而这些成果只维持了几年。到小学三四年级的时候,那些参加这个项目的孩子的表现与没参加的孩子相比就不再超出很多了。
我们并不是很确定参加开端计划的孩子在成年后是否比没参加该计划的孩子过得更好。这是因为这个项目中的孩子并不是随机挑选的。那些完成了开端计划的孩子会有迥异的人生道路,也不同于那些未参加计划的孩子。调查者能得到的这些孩子成年之后的信息很少,而且几乎只能依赖他们对当年这个项目的回忆信息。人们需要回忆当年他们是否参加过这个学前项目,如果参加了,具体是哪一个呢。回顾性研究面临着大量潜在的陷阱,尤其是要追溯几十年前的回忆时。回顾性研究的确表明了参加过开端计划的孩子在成年后获得了明显的收益。然而,这个结果甚至都达不到自然实验的水平,因为如果参加开端计划与未参加计划的孩子之间没有预先存在的差异,那么结果将是令人吃惊的。
人们继续投入大量的资金在可能有效也可能没有效果的项目上。
幸运的是,就像我们在第4章中提到的一样,我们知道一些学前项目的确对一些孩子的未来起到了十分重要的作用。比开端计划目的性更强的这些项目对参与者的智商水平的影响更长久,更重要的是,在实验组中的成年人的确在学业成就和经济收入上有显著提升。
如果不知道在学前项目中什么因素起作用,什么因素不起作用,那么耗费的成本将是极其巨大的。花在开端计划项目上的2000亿美元若用于较小范围内的特定有困难的孩子,给他们提供更有针对性的帮助,则效果更好。这可能会带来更大的社会效益。(事实上,我们知道出身越贫寒的孩子,早期高质量的教育对他们的影响越大。而这些早教项目对于出身中产阶级家庭的孩子的效果并不明显。)此外,也没有任何实验来证明开端计划的哪个方面(如果有的话)是最有效的。对孩子的关注集中在教育方面会比集中在社会方面更好吗?全日制的,还是半日制的?两年的项目好,还是一年就足矣?若能知道这些问题的答案,则随之而来的社会、经济效用都会更大。找到这些问题的答案比较容易,其所耗费的成本比对项目的投资要少得多。
至少,像开端计划这样的项目不太可能给孩子们带来什么伤害。而许多非科学家们设想的干预方式可能会伤害孩子。
善意的人们设计了一个项目来帮助那些经历过悲剧事件的精神受创的受害者。这样的心理治疗师鼓励加入治疗小组的人们以自己的角度重述事件,描述他们的情感反应,说出自己对他人反应的评价,讨论自己的压力症状。治疗师会引导受害者恢复正常状态,并帮助他们在一次次治疗过程中减轻症状。在“9·11”恐怖袭击事件发生后有大约9000名心理治疗师到纽约市提供帮助。
这类心理治疗师深得我心。然而,行为科学家们进行了大量随机实验来检验这种严重应激诱因疏泄治疗的效用。他们并没有发现任何证据可证明严重应激诱因疏泄治疗对于抑郁、焦躁、睡眠障碍等压力症状有积极效果。相反,有一些证据还显示接受了严重应激诱因疏泄治疗的人可能会发展出更严重的创伤压力心理障碍。
巧合的是,行为科学家的确发现有些干预对于创伤受害者有实际作用。在经历过危机事件几周后,社会心理学家詹姆斯·彭尼贝克让创伤受害者连续4天晚上各自写下内心最深处的感受,以及危机事件对他们生活的影响。没有与治疗师面谈,没有小组治疗,没有专家提供如何应对创伤的意见,就是写下感受。通常创伤经历会对受害者带来很大影响,让他们受尽压力和精神折磨。然而,我本人并不是很相信这种书写伤痛的方法有很强的效果。这种书写的方法自然比不上即刻的心理干预、陈述伤痛或提供建议有效。但是这的确有效,我们的假设有时候并不正确。
彭尼贝克认为他的书写练习方法有效果,这是因为这种方法让人们在一段时间的煎熬和自我消解之后,形成了对于事件和自身反应的一种理解式的叙述。实验表明,那些最有收获的人是在书写伤痛经历早期有着不成熟和无序的叙述,而在结束时叙述连贯统一的人。
另外有一些善意的人试图帮助一些因同辈压力而犯罪或是自甘堕落的青少年,结果有时候甚至比用严重应激诱因疏泄疗法治疗创伤受害者还要糟糕。
几十年前,在新泽西州的拉维州立监狱里,狱友们决定做一些事警告那些以身犯险的青少年,告诉他们犯罪的严重后果。这些狱友向孩子们展示了监狱是什么样的,包括以图表形式叙述了高墙之内的强奸和谋杀行为。
一部在艺术与娱乐频道播出的获奖纪录片被命名为“现身试法”。这个名字和相关实践席卷了美国各地。
这个“现身试法”项目会有作用吗?人们针对此项目进行了7项实验。每一项实验都表明,那些参加了这个项目的孩子比在控制组的那些未接受任何干预的孩子更容易犯罪。平均而言,犯罪率增加了13%。
这个拉维项目仍然在进行,在东新泽西有超过5万个孩子参与过这个项目。让我们用5万这个数字乘以13%,得到6500这个数字。这就是那些善良的人们进行了所谓的干预之后带来的新增犯罪数量。而这只是新泽西一个州的情况。这一项目还在很多地区被推行。华盛顿州公共政策研究所的一项研究发现,每在“现身试法”项目上花费一美元,则对于犯罪治理和监禁的成本就增加了200多美元。
为什么“现身试法”项目不起作用呢?它看上去应该是有效的。我们不知道原因,也不知道它为何还会起到反作用,但这些并不重要。这种方法被设计出来是一个悲剧,犯罪并没有停止。
为何犯罪没有停止呢?我大胆猜测原因正是“它看上去应该明显有效果”。许多人,包括大量政客,会宁愿相信他们直觉上认定的因果假设,而不是科学数据。然而,这种认识对于理解科学家们无法找到“现身试法”项目无效的证据并没有帮助。科学家,尤其是社会科学家,不会陷入在科学数据面前抓住自己的直觉不放的陷阱,因为他们很清楚假设可能是错的。(在本书写作期间,美国艺术与娱乐频道仍在播出宣扬“现身试法”项目的节目。)
D.A.R.E.(毒品抗拒教育)是另一项有意防止孩子误入歧途的项目。该项计划的一部分内容是,当地的警察接受80个小时的授课技巧培训,然后进入学校,劝告孩子们减少服食毒品、饮用烈酒、消费烟草。这个项目每年得到地方、州和联邦政府高达10亿美元的资助。D.A.R.E.网站上的信息表明,美国75%的学校,全球有43个国家加入了这项计划。
然而实际上,在D.A.R.E.计划推行的30多年中,它并没有降低青少年吸毒的概率。D.A.R.E.并不承认其项目的无效,还对于证明其失败的科学证据强烈反对。由D.A.R.E.延伸出来的项目补充和替代了原有的项目,然而在外部研究机构的测评中,其效果仍然不显著。
为什么D.A.R.E.不起作用?我们不知道。它应该是有效的,但是我们没有找到真正的原因。不过,有一些项目的确是降低了青少年吸毒、酗酒、消费烟草的概率。这其中包括“生活技能训练”项目和“中西部预防计划”。这些项目中有一些D.A.R.E.中不具备的因素,明显的一点是这些项目会在孩子进入青春期前教授他们一些应对同辈压力的方法。D.A.R.E.项目的设计者假设警察是一个重要的社会影响因素,会对青少年起作用。而一位社会心理学家会告诉他们,同辈群体其实才是更有影响力的。这些更成功的项目也提供了有关青少年和成年人吸毒酗酒的信息。回顾这些信息,你会感到很惊讶,因为超出大多数青少年的预期,他们的吸毒概率下降了,并且是其同辈群体的行为使他们自身减少了错误行为。
那些伤害青少年的项目仍在继续开展,而同时真正有用的项目却没有被正视,甚至不被采用。我们的社会为那些错误的假想付出了高昂的经济和人身代价。
小结
有时候,我们会将自己观察到的一些事物之间的关系认定为紧密的确定性关系,就像真正的实验一样。那些在幼年时期相对而言接触了较多病菌的孩子在成年后较少患上自身免疫性疾病。当这一发现在多种情形下被观察到时——卫生条件差与条件好的国家,乡村与城市,养宠物与不养宠物,自然分娩的与剖腹产的孩子等,这一论断就显得十分有说服力了。这类观察引导科学家进行真正的实验,以证明人在成长早期接触病菌能够降低未来患上自身免疫性疾病的概率。
随机控制实验通常被当作科学和医学研究中的黄金标准,这是有充分理由的。此类实验的结果比其他任何实验的结果都更有说服力。随机分配保证了在实验组和控制组的任何变量之间都是没有差别的。我们发现的二者之间的任何差别通常都被认为是科学家的干预导致的。双盲随机控制实验是指在实验中,研究者和病人都不知道病人所处的具体环境是什么。这类实验确保了结果仅仅是由干预这个行为本身而导致的,而非医生或病人有关干预的知识的影响。
社会为不进行实验而付出了高昂的代价。因为没有进行随机实验,我们不知道花费了2000亿美元的“开端计划”是否对于提高孩子的认知能力有效。因为进行了随机控制实验,我们了解到高质量的早教项目极其有效,参与其中的孩子在成年后在健康和其他方面都获益匪浅。针对早教技术的适当实验有可能让我们节省大量成本,并为个人和社会带来益处。D.A.R.E.项目并未使得青少年减少吸毒酗酒,“现身试法”项目导致了更多的犯罪,心理治疗师可能让病人陷入更深的焦虑而没有减轻他们的症状。不幸的是,在许多领域,社会并没有办法保证其采用的干预手段总能经过实验的检验,也不能确保所有公共政策都经得起实验的检验。