心理学家认为智力是一种天生的综合的智能,是靠遗传,而不是通过教育或训练得到的,勤奋或热情也不会对智力产生任何影响。
——西里尔·伯特爵士及其同事(1934年)
小学五年级我们班刚刚开始学习分数时,我有一周没到学校上课,此后我学习算数就开始吃力起来。在接下来的小学生涯里,我的算术成绩再也没有好起来。父母很同情我,安慰我说,我们家的人数学都学得不太好。他们认为数学能力主要是靠遗传得来的,要么生来就有,要么生来就没有。
我的父母恐怕并没有读过有关智力的心理学文献,但他们的观点与之不谋而合。20世纪末,不少专家都认为智力和学习能力在很大程度上受到基因的控制,它们在出生前便被预设好,在正常的环境下或多或少地得以展露。这些专家认为任何为提高智力而做出的努力都不会得到回报。所以,像儿童早期教育这种干预措施并没有取得持久的效果,也就不足为奇了。他们不相信通过改善教育或改变社会就能够使人们变得更加聪明。
不过心理学、遗传学和神经系统科学近期的研究成果,以及目前对教育干预有效性的研究,已经合力推翻了根深蒂固的智力遗传决定论的立场。我们现在可以肯定的是,智力的环境可塑性非常强。一个没有接受过正规教育的人无论如何也不可能变得非常聪明——无论我们是用智力测试还是别的标准来测量。一个人的智力,及其学业成就和职业成就的高低,很大程度上取决于环境因素,而与基因没有任何关系。
这一新近产生的环境决定论有三条重要的原则:
1.包括学校教育在内的正确的干预措施,可以使人变得更加聪明。当然学校教育还可以被改善得比现在好很多。
2.社会对智力的要求变得更高了,加之文化及教育环境的不断改善,使得所有人口在整体上都变得更加聪明了——但这种聪明与以前的聪明有所区别。
3.经济地位的高低造成了不同阶层的人在智力及学业成就上的差距,但这种差距是可以缩小的。同样地,白人和某些少数族裔之间的此种差距也是可以缩小的。
本书的基本内容很简单,就是关于环境对智力潜能的影响力,更具体地说,是关于学校及文化对于环境的影响作用。越来越多的研究证据,尤其是大量最新的研究证据让我们有理由相信,和几年前的大多数专家相比,我们应该更加乐观地看待个人、群体及社会整体智力提升的可能性。
另一方面,就像有些外行和专家错误地坚持智力主要取决于遗传的观点一样,另一些外行和专家对于能够提升智力和学业表现的方法存在一定误解,有时甚至是过于乐观。本书的目标之一就是要证明究竟何种干预措施才能最有效地提升智力和学业表现。
在接下来的几章里,我会着重阐述不同群体间的社会和文化差异对智力及学业成就的重大影响。社会经济地位较低的人平均智商及成就都不高,这一部分是由环境因素造成的——并且部分环境因素在本质上也是文化因素。而黑人及其他少数族裔的智商和成就不高,则完全是由环境因素造成的。大部分环境因素都与历史上遗留下来的不利条件有关,但有些也和社会习俗有关,而这些社会习俗是可以改变的。
文化也能够促进智力和学习成绩的进步。大体来说,某些文化群体相较于主流的白人群体具有明显的智力优势。这些群体包括带有东亚血统的人和德系犹太人。后面我会讨论这些优势是如何产生的,以及那些想要提高自己智力和学业成就的人是否也能获得其中的一些优势。
最后,我会介绍最新的科学发现所显示的提高智力的方法。
不具备任何专业知识的读者也能很好地理解本书中绝大部分内容,不过熟悉一点儿统计学的知识可能会更有帮助,所以我在附录中对一些统计学术语下了定义。想要加强统计学知识的读者也可以参考这个附录。其中涉及的概念包括:正态分布、标准差、统计显著性、效应量(在标准差术语中)、相关系数、自我选择以及多元回归分析。
多元回归分析,就是对一些自变量进行测量并检验这些自变量与其他因变量的关系。请注意,我对多元回归分析有点儿排斥,因为这样的分析不能正确地显示不同变量之间究竟存在何种程度的因果关系,所以我极少谈到多元回归分析,并一贯持怀疑态度。想要了解我为何对多元回归分析带有偏见的读者可以看看附录一,我在里面做了相关解释。
作为全书的开始,在这一章里我会给出智力的定义,探讨测量智力的方法,提供智力测试可以测量出的两种不同类型的分析型智力的例证,以及探讨智力测试无法测量出的智力类型。同时,我还会检验智商究竟能够在多大程度上预示未来的学业成就和职业成就,智商不能代表的智力类型以及有关动机和性格的一些重要方面。
智力的定义及测量方法
我们可以将琳达·戈特弗雷德森对智力的定义当作一个很好的开始:
智力是一种内容非常广泛的脑力活动,其中涉及推理、计划、解决问题、抽象思考、理解复杂概念、迅速学习以及从经验中学习的能力,而不局限于学习书本知识、学术能力或应试技巧。智力反映的是一种能够更加广泛和深刻地理解我们周遭环境的能力——“理解”、“领会”事物,或“决定”要做什么。
智力方面的专家几乎一致认为,智力包括抽象推理、解决问题和获取知识的能力。绝大部分专家也都认为,记忆力和心理速度也是智力的一部分,还有大约一半的专家认为常识和创造力也应算作智力的一部分。
这些定义没有将智力的某些方面包含在内,而这些方面恰恰构成了其他文化中智力的组成部分。发展心理学家罗伯特·斯滕伯格研究了大量不同文化中非专业人士对于智力组成部分的看法。他发现,很多人都将理解他人并产生共鸣等社交特征视为智力的一部分,这在非洲和东亚文化中尤为突出。不仅如此,东亚人对于智力的理解比西方人更强调实际和实用性。西方人更有可能看重对知识本身的研究,不论这些知识是否有很明显的直接用途。
我们通常都利用智力测试对智力进行测量。顺便提一下,智商(IQ)的“商(Q)”代表的是商数(quotient)。最初的智力测试是为小学生设计的,用智力年龄除以生理年龄得到的就是商数。按照这个定义,如果一个10岁的孩子在测试中的表现相当于一个12岁的孩子,那么这个孩子的智商就是120分;如果一个10岁的孩子在测试中的表现相当于一个典型的8岁孩子,那么其智商就是80分。不过现代的智力测试都是将某个特定年龄群人口的平均智商值定为100分,然后使智商值围绕这个平均值分布,由此获得特定的标准差——通常是15分。因此,如果一个人在智力测试中的表现比他(她)所属年龄群体的平均值高1个标准差,那么他(她)的智商就是115分。
这里举一个例子说明智商相差15分意味着什么。智商为100分的某个人可能会以一般的成绩从高中毕业,然后再上一两年的社区学院。而一个智商为115分的人预计能从大学毕业,进而成为某行业中的专业人士或企业中的高层管理人士。反过来,如果某个人智商为85分,也就是正常值范围内的最低值,他(她)极可能连高中都无法毕业,只能找份技术工人的差事。
虽然设计智力测试是为了预测学习成绩,但我们很快就发现,这种测试所测量的智力与普通人理解的智力有很多地方是重合的。至少,人们对于他人智力水平高低的评定与智力测试得到的结果基本是吻合的。那些被普通人视为智商较高的人,在智力测试中得到的分数也相对较高。
智力测试种类繁多,但是综合性的智力测试之间都没有太大的区别,而任意两种智力测试,即使是测试内容明显不同,其典型相关度也都在0.8~0.9的范围之内。
智力测试有时会测量一些非常具体的技能,例如拼写能力和推理速度。这些高度具体化的测试往往有彼此相关成为集群的倾向。[1]例如记忆力测试往往都是相互关联的,各种测量视觉和空间感知能力(例如将彩色的积木拼成一个二维的图案)以及测试语言知识的试题(例如词汇)往往也是如此。所有测量你能称之为智力的测试,至少从某种程度上来说都是相互关联的。(就这件事而言,任何被社会认为是好的事物,都和其他好的事物相关联。生活是不公平的。)
表1–1 韦克斯勒儿童智力测验量表中使用的小测验
表1–1就是一个智力测试的范例,显示的是韦克斯勒儿童智力测验量表中的各项小测验,用来测试6~16岁孩子的智商。像这样的智力测试,各小测验之间的相关度为0.3~0.6。有一种说法认为,小测验之间具有相关性,就表示有可能存在某种因素,这种因素可以反映一般智力水平的高低,叫作g因素。(“因素”有技术上的含义,但我们没有必要细究。g因素本身与智商得分高度相关,但在某些方面与智商值存在细微的差别,不过这些方面与我们现在的讨论无关。)某些小测验与g因素的相关度要比其他小测验高一些,因此这些小测验的g负荷量较高。例如,词汇测验与g因素的相关度就很高,而译码(按照所给的例子将种种符号对应起来)与g因素的相关度就不高。
智力的两种类型
实际上g因素或一般智力有两个组成部分,其中一个是液态智力,或叫作解决新奇的抽象问题的能力——这种智力需要的是智力活动,而这种智力活动对于人在一生中不断获取的现实生活经验的依赖不大。液态智力通过所谓的“执行功能”的运转得以运用,这些执行功能包括“工作记忆”、“注意力控制”及“抑制控制”。那些为了解决问题而必须经常储存在头脑里的信息,以及那些需要花些力气才能记住的信息,据说都保留在工作记忆中。注意力控制这种能力,不仅要求将注意力集中在有待解决的问题的相关方面,而且能在需要的时候将注意力转移到问题的下一环节。抑制控制是指抑制具有诱惑性但并不相关的行动的能力。
图1–1中显示的是一道用于测试液态智力的典型问题。这是从瑞文推理测验中摘录出来的。约翰·C. 瑞文在1938年发表了这项测试的第一版。
图1–1 类似于瑞文推理测验的一道题
资料来源:Flynn, 2007.
左边方框内上面的两个图案是解决该问题必须要遵循的范例,下面左边的图案指定了要想解决这个问题需要进行哪些变形。右边方框内的6个图案是备选的答案。要解决这个问题,你就要注意到左边方框内左上方的图案是一个菱形,右上方的图案是一个正方形。这就告诉你答案必须是一个正方形。然后你必须要注意到左上方菱形的下半部分被平分成了两部分,左半部分是黑色的;右上方正方形图案的左下半部分也是黑色的。这就告诉你右下方正方形中对应的部分必须和左下方菱形图案对应的部分一致——也就是说,整个下半部分必须都是黑色的。你还应注意到,左上方菱形图案中中间的一条竖线被拿掉了,保留了对称的两条竖线,这就决定了为使图案对称,你必须清除右下方正方形中一条竖线。这样正确的答案就出来了,也就是右边方框内右下角的那个正方形。
在表1–1显示的韦克斯勒儿童智力测验量表的各项小测验中,涉及液态智力较多的是:图画补缺,你需要关注一个图案的所有方面,然后分析其中的哪个部分缺失了;积木图案,你需要处理纯粹抽象的视觉材料;图形拼凑,你需要在给定物体的外观和构成这个图案必须使用的抽象形状之间反复比较;图片排列,你需要将各种图片存入工作记忆中,并在头脑里将它们重新排列,直到按顺序排好的图片构成一个内容连贯的故事;译码,这是一项完全抽象的任务,主要用来测量信息处理的速度。由于这几项小测验都要求进行某项操作,所以有些人认为这些小测验的得分就构成了操作智商。这些操作都要求测试者当场反应,只用到很少一部分知识储备。
一般智力的另外一个组成部分叫作晶态智力,是指你储存的关于世界本质的信息,以及通过学习得到的有助于你对世界本质做出推论的步骤。韦克斯勒儿童智力测验量表的小测验中最能集中测试晶态智力的是常识、词汇、理解、类同及算术。当然,做算术既要使用储存的或晶态的知识,又要执行某些操作。即使不是全部,这些操作的大部分也是在之前就已经学习过的。韦克斯勒儿童智力测验量表的创建者们,将这几个小测验得到的分数之和称为语言智商,因为绝大多数在测验过程中利用的信息在本质上都与语言相关。操作智商和语言智商得分之和就是总智商,或称为全量表智商。
我们是如何知道一般智力有两种迥然不同的类型的呢?首先,我们称之为操作导向的各项小测验显然更多地利用了推理能力(液态智力)而不是储存的知识(晶态智力),我们称之为与语言有关的各项小测验显然更多地借助知识(包括运用算术解决问题的知识)而非推理能力。不仅如此,各项语言小测验之间的关联度也要高于它们与各项操作小测验之间的关联度,反之亦然。
另外,完成测量液态智力的各项小测验需要的都是执行功能,而执行功能不仅需要额叶皮质的一部分,也就是前额皮质的支持才能得以实现,还需要与前额皮质连接构成网状结构的另外一个区域,也就是前扣带皮层的帮助。前额皮质的损伤会严重破坏完成脑力任务的能力,因为完成脑力任务需要应用工作记忆、注意力控制和抑制控制的执行功能。前额皮质受到严重损伤的人可能根本无法完成瑞文推理测验,根据测验中的表现,他们可能会被视为智力发育迟缓,但他们的晶态智力则有可能完全正常。相反的模式同样存在。患有自闭症的儿童通常都是晶态智力受到了损伤,而液态智力则完全正常,甚至超出常人。
就像我们从有关前额皮质损伤的证据中能够得出的结论那样,脑成像研究也显示,当人们试图解决需要利用大量液态智力的问题时(例如瑞文推理测验或复杂的数学题),前额皮质的活动尤其活跃。
另外一个可以证明智力分为两种类型的证据就是,液态智力和晶态智力的曲线在人的一生中轨迹大不相同。图1–2显示的是这两种智力曲线的理想状态。液态智力在生命的最初几年发展十分迅速,但是在很早的时候就开始衰退。20岁出头的时候液态智力就开始显现出衰退的迹象。数学家,还有一些需要为符号化的、抽象的材料找出新的解决方案的人会发现,他们的能力在30岁左右就开始慢慢衰退了。到了70岁的时候,液态智力下降的幅度已经非常明显了,比1个标准差还多,这就是老年人更难完成拼图游戏和迷宫游戏的原因。而另一方面,晶态智力水平会随着年龄的增加而不断提升,这种提升能够持续到很大的年纪。历史学家以及一些依赖大量信息储备才能有所成就的人会发现,直到50岁的时候他们的能力还在持续增强。
需要注意的是,上述所有关于液态和晶态两种智力的年龄曲线的内容,在一定程度上还存在争议。争议的详情我就不在这里赘述了,在此只说达成普遍共识的一点,那就是液态智力的衰退早于晶态智力的衰退。
图1–2 液态智力和晶态智力的年龄曲线图
资料来源:Cattell, 1987.
前额皮质是大脑所有结构中最早出现衰退的部分,这一点也预示了液态智力早于晶态智力开始衰退。
最后一个可以证明存在两种智力类型的依据就是,执行功能和整体智商是可以分开来遗传的。执行功能在一定程度上遗传自父母。晶态智力,或者说有利于解决问题的知识,也在一定程度上遗传自父母。如果父母拥有较强的执行功能而晶态智力相对较低,那么子女的执行功能也较强,晶态智力也相对不高。
与上了年纪的人相比,液态智力对于年轻人的智力发展更为重要。对于小孩子来说,阅读及数学技能与液态智力之间的相关度要高于其与晶态智力的相关度。与此相反,对于大一点儿的孩子和成年人来说,阅读及数学技能与晶态智力之间的相关度要高于其与液态智力的相关度。后面我会谈到为什么社会经济地位较低的人以及一些少数族裔的人智商相对不高,这一论点在讨论中非常关键。
另一个与液态智力有关的极其重要的事实是,前额皮质与边缘叶之间存在大量互连,而边缘叶与人的情绪和压力有很大关系。当一个人处于情绪激发状态时,前额皮质的活动就会减弱,因此液态智力的功能就会更弱。日复一日,长期饱受压力的折磨可能会永久性地损伤前额皮质的功能。这一信息在我后面谈及穷人及少数族裔的液态智力可变性时,会变得非常关键。
虽然智力是由液态智力和晶态智力共同构成的,但我在讨论时重点将智商值作为一个整体来讨论,只在必要时才会对这两种类型加以区分。
多种多样的智力
智商得分能够预测什么呢?首先,智商得分可以用来预测学习成绩。这一点儿也不奇怪,因为这正是100多年前阿尔弗雷德·比奈发明智力测试的初衷。他想要通过智力测试挑选出那些不太适合正规教育,有可能需要特别的教育方法的孩子。典型智力测试的得分与小学生的学习成绩之间的关联度是0.5。虽然这个数值已经够高了,但这意味着还存在大量智力测试没有测量出的变量,而这些变量也能够预测学习成绩。
智力测试测量的往往是所谓的分析型智力,以及与之相对的实践型智力。分析型的问题通常是人为设计的,对问题的描述很详细,解决问题所需的所有信息都已经包含在对问题的描述中了。分析型的问题只有一个正确答案,通常只有一种特定的策略才能解决,而且和日常生活经验的联系并不紧密,问题本身也没有什么趣味性。这和实践型的问题形成了鲜明的对比。实践型的问题首先需要人们意识到有问题需要解决;对问题的描述往往不够完善,存在多种不同的可能解决方案;经常需要借助日常经验来解决问题;并且通常需要内在动机的参与。
测量实践型智力时,罗伯特·斯滕伯格要求受试者回答在某些情景下应该采取何种应对方式,例如走进一个派对,但参加派对的人你一个也不认识;和几个人合租房子,讨论应该如何分担房租以确保对每个人都公平;为一个你根本不怎么熟悉的人写一封推荐信等诸如此类的问题。
斯滕伯格还提到了第三种类型的智力,即他所称的创造型智力,是指创造、发明或想象事物的能力。他采用命题作文的形式来测试创造型智力水平的高低。例如,他让受试者以“章鱼的腕足”或“第五次机会”为题写一个故事。他还向受试者展示一系列图片,然后要求他们就其中的一张图片编一个故事,或要求受试者为新产品写广告语。
测量分析型智力时,斯滕伯格采用的都是标准化方法,即SAT(美国学术能力评估测试)、ACT(美国大学入学考试)或者智力测试,在测量实践型和创造型智力时则采用他独创的新奇方法。他发现,测量实践型和创造型智力能够更加准确地预测诸如学习成绩和工作表现等各种结果。有时,这种对于可预测性的提升是十分可观的。实际上,有时这些测试的效果远远好过智力测试。
斯滕伯格利用假想出的三个大学生的例子来进行说明,他的说明非常具有说服力。分析型的爱丽丝非常善于与人讨论各种想法,对他人的产品分析得头头是道。创造型的凯茜对于处理各种观点不太在行,但总有一些独创的有趣的想法,其中一小部分往往最后还真能派上用场。实践型的帕蒂既不善于分析也不是特别有创意,但她总能找到方法并完成任务,她可以用既明智又划算的办法完成某项任务。
你当然希望你的同事们同时具备这三种智力类型,但是在一个团队里一起工作的时候,哪怕只是在其中一种智力类型上很突出的人,都能发挥至关重要的作用。值得我们注意的是,在斯滕伯格对实践型和创造型智力的测试中,少数族裔与多数族裔之间的差距比分析性测试所显示的差距要小得多。这就意味着,这种测试能够使更多的少数族裔进入学校学习,找到工作,避免仅仅由于分析型智力测试的结果不佳就被拒之门外。
霍华德·加德纳认为智力测试测量的只是语言、逻辑数学和空间方面的能力,而忽视了其他方面的“智力”。这些智力包括各种“人际智力”,即类似社会心理学家彼得·萨洛维及其同事研究的“情绪智力”。情绪智力包括能够准确地感知情绪、利用情绪促进思考、理解情绪,以及管理自己及他人的情绪。萨洛维及其同事测量的情绪智力,与智力测试测量的分析型智力几乎毫不相关,但却可以用来预测同龄人及上司评价的诸多维度,例如对人际关系是否敏感,是否善于交际,能否营造积极的工作环境,能否承受压力,以及是否具备领导潜力。有些人也许不愿使用“智力”这个词来描述这些与情感技巧有关的能力,但这是没有道理的。
加德纳谈到的其他类型的智力还包括“音乐智力”和“动觉智力”。一些智力研究专家完全不屑于把“智力”这个词用在这些能力上。但是确实存在与音乐及动觉有关的种种灵感,也确实有音乐及动觉方面的问题需要解决。我个人很乐意将贝多芬的《第七交响曲》和阿尔文·艾利的《启示录》称为天才作品。所以我十分赞成:创造这些作品的本领就是智力的体现。不过,我不会把我个人的偏好强加给那些反对将这些能力称为智力的人。
对于增加的这几种智力类型,加德纳是这样解释的,他指出,在这几种智力类型中大都出现过神童,并且有神经学的证据显示,这几种智力与大脑的不同区域是一一对应的。不管别人称他发现的这几种智力只是技能还是别的什么,很明显,它们与标准的分析型智力不同,测量这几种智力能够预测——或至少在理论上能够预测——人类技能进步的重要方面,而这些都是标准测试所无法做到的。
动力与成就
最后,某些谁都不会称之为“智力”的特质也会显著影响学业和职业成就。
几十年前,人格心理学家沃尔特·米歇尔对儿童的“延迟满足”能力进行了研究。他将一组来自斯坦福大学幼儿园的儿童分别安排在一个房间内(孩子们以为别人看不到他们,而实际上房间外有一名实验人员在观察他们的一举一动),房间内会放一块曲奇,或一块棉花糖、一件玩具,或者其他有吸引力的物品。研究人员告诉孩子们,他们想什么时候拿到这样东西都可以,只需摇一下铃铛,实验人员就会进来把这样东西拿给他们。不过他们也可以等到实验人员自己进来,如果能等那么久,他们就可以得到两块曲奇,或者两块棉花糖、两件玩具。这一实验测量的就是“延迟满足”的能力。孩子们在摇铃前等待的时间越长,延迟满足能力就越强。
米歇尔等待了十几年,直到这些大多出身中上层家庭的孩子进入高中学习。根据家长们的评价,那些在实验中能够等待更长时间的孩子更能集中精力,做事更有计划性,能更好地面对挫折以及更成熟地面对压力。这些特点在测量学习智力的测试中发挥了积极作用。当年那些幼童的延迟满足能力越强,他们高中时的SAT成绩就越好。拖延的时间长度与SAT语言部分得分之间的关联度是0.42,与数学部分得分之间的关联度是0.57。有可能是越聪明的孩子能够忍耐延迟的时间就越长,不过这似乎并不是唯一的解释。更可信的解释是,越能抵制住诱惑的孩子,长大后越有可能用功读书。后面我们还会注意到,虽然SAT分数与智力测试的分数之间相关度很高,但它并不能完全等同于智商。一些文化群体的SAT成绩比智力测试预测的成绩更优秀——其中的原因很可能与动力有关。
激励因素会影响学业成就的高低,这并不令人惊讶。但动力有时候也许能比智力测试更好地预测学业成绩,却有点儿让人出乎意料。这一点是通过一项极其重要的研究发现的,这项研究在美国东北部地区某大城市的一所磁铁学校[2]内展开。安吉拉·达科沃斯和马丁·塞利格曼将该校的八年级学生作为研究对象,采用多种方法对他们的自律程度进行测试。实验人员不仅询问学生们在多大程度上会产生冲动的言行,还测试学生们对待不同奖励的态度,例如他们是要一个小小的但是马上能够得到的奖励,还是要一个大大的但是要等待一段时间才能得到的奖励。当时他们给孩子们提供了两种选择:立即得到一美元,或等待一星期后得到两美元。他们还向父母和老师询问孩子们约束自己的行为、遵守纪律及控制冲动反应的能力。他们将所有这些测试的得分加在一起,得到测量自律的综合分数,然后比较究竟是这种测试还是标准智力测试,能够更好地预测学习成绩。结果是:智力测试预测成绩的准确度远远不及动力测试。智力测试分数与成绩之间的关联度仅为0.32,而自律测试分数与成绩之间的关联度则比前者高出一倍多——0.67。自律测试(0.43)比智力测试(0.36)能更好地预测标准的学校测验分数,尽管这两个数值的差距并不大。如果要你为孩子在高智商和强自律性之间做出选择的话,也许选择很强的自律性更明智一些。
虽然达科沃斯和塞利格曼的研究成果很重要,但我们还需要对这一实验进行重复验证。在一所随机挑选的学校,甚至是另外一所磁铁学校里,也许自律测试和智力测试对学业成就的预测效果和在这个实验得到的结果并不相同。尽管如此,这项研究还是能够证明激励因素比智商更能准确地预测一个人未来的成就。
让我们来总结一下我们从上述种种研究中学习到的一些知识。
智商只是智力的一个组成部分。智力测试并不能准确地测量实践型智力和创造型智力,但二者能增加学业成绩和职业成就的可预测性。一旦我们能够进一步改善这两类智力的测量方法,我们也许会发现,实践型智力和创造型智力与智力测试测量的分析型智力是同等重要的。
不论哪种类型的智力,也不论采用哪种方法测量,都只是学业及职业成就的一个预测指标而已。情感技巧和自律,很可能还有其他一些涉及动力和性格的因素,对预测学业及职业成就来说都是很重要的。
除了上述削弱智商重要性的因素以外,我们还要提到一点:只要智力达到一定的水平,大多数雇主似乎并不苛求智商越高越好。相反,他们表示,他们更看重职业道德、可靠度、自律性、毅力、责任感、沟通技巧、团队合作的能力以及应变能力。
所以,智商并不是智力的全部要义。智力,即使赋予了它比智商分数更加广泛的定义,也不是影响学业成绩或职业成就的唯一重要因素。不仅如此,学业上的成功本身也只是预测未来职业成就的一个方面而已。
智商在多大程度上能预测未来?
尽管如此,智商与学习成绩还是和很多结果息息相关,但是很难确定它们之间的因果关系究竟是什么。研究人员通常会确定一些变量,例如个人现在的智商或此前的智商,原生家庭的社会经济地位,童年的生活情况,兄弟姐妹的数量,家里是否有图书馆借阅卡,个人的受教育程度,以及其他一些变量,然后将所有这些变量放入一个多元回归方程式中,用这个方程式预测成年后的社会经济地位、收入或社会病状等。研究人员记录下在排除所有其他变量时(即保持其他变量不变),每个变量对该多元回归方程式贡献的大小。结果总是证明,在不考虑所有其他变量时,智商对结果而言是非常重要的。但是正如我在关于统计学的附录一中所申明的那样,自变量之间存在着极其复杂的因果关系——天晓得某些自变量会以何种方式影响着其他变量,或者某些自变量会受到甚至尚未测量到的某些未知变量的影响。父母的社会经济地位与子女的学业成绩是有联系的,社会经济地位较高的父母智商也较高,这不仅会影响孩子从父母处遗传的基因,更重要的是这样的父母会更重视子女的抚养及教育,从而促进孩子智力技巧等的发展。所以诸如“智商在职业成就中占百分之几”的说法是最没有统计学依据的。自然所配合的,多元回归不可分开。[3]
不过,我们可以更精确地对智商决定人生成就的重要性进行定位。政治科学家查尔斯·莫瑞曾经进行过一项研究,研究对象的智商数据都是通过武装部队职业资格测验得到的。武装部队测验是20世纪70年代末进行的美国青年纵向调查的一部分。莫瑞研究了当初的研究对象在成人后的收入和其他社会指标。不过他的研究样本具有高度的选择性——出生在经济状况不算太差(也就是说,家庭收入高于占社会1/4的最低收入家庭)的家庭中的两个子女。他们不能是私生子,至少在他们7岁前父母没有分居或离婚。但两个孩子的智商必须有所区别。一个要在正常范围内——90~109分,一个必须超出这个范围。智商超出正常范围的孩子可以是聪明(110~119分)、非常聪明(120分以上)、迟钝(80~89分)或非常迟钝(80分以下)。
莫瑞能够通过这个被他称为“乌托邦”的样本来确定,智力属于正常范围和超出正常范围的人之间会有多大的差距。他将样本中的个体成年后的收入水平作为最重要的衡量标准。收入当然是与职业成就和社会阶层相关的,所以当我们处理收入这一变量时,可以用收入代表职业成就和社会阶层等其他变量。他同样收集了不少关于样本中的女性是否育有私生子的数据。这一变量也可以代表大量其他的变量,在该研究中是指一些社会功能缺陷,例如坐牢或靠福利救济生活的可能性。
莫瑞发现,即使是在这群家庭稳定、大多数都属于中产阶层的子女中,不同的智商也会产生迥然不同的结果。表1–2显示,如果一个人的兄弟姐妹智商平平,而他(她)却非常聪明,那么他(她)的收入比兄弟姐妹要高出1/3以上——通常(她)的职位相对较高;如果一个人的兄弟姐妹智商正常,而他(她)却非常迟钝,那么他(她)的收入就可能还不及其兄弟姐妹的一半。育有私生子的行为也与智商有着很密切的联系。非常迟钝的女性比其智力正常的姐妹生育私生子的可能性要高出1.5倍。
表1–2 同一稳定的中产阶层家庭内智商不同的两个子女, 其智商与收入及女性生育私生子的比例的关系
这些分析之所以重要,就在于它们显示出,平均来说,同一个家庭中子女智商不同,其未来的生活状况往往也会截然不同。不仅如此,这些分析无须考虑测试对象原生家庭的社会经济地位带来的影响,因为所有这些比较都是针对同一家庭内部的不同成员的。不过这些分析并不能证明未来的生活状况完全是由智商直接造成的。例如,很有可能受智商影响的教育机会也是因果关系链上的重要一环。实际上,教育很可能会成倍放大智商的作用。另外,智商与同样发挥作用的性格和动力等因素之间,无疑也存在着联系。尽管如此,这些分析结果还是显示了智商的重要性。即使是在稳定的社会阶层较高的同一家庭内部,不同成员的智商也与其未来的生活状况相互关联。
莫瑞研究的智商得分无疑在很大程度上受到遗传的影响。某些孩子在获得父母遗传的过程中比其他兄弟姐妹更走运。莫瑞自己也一直认为智力主要由遗传决定,同时他还认为,正因为这样,智力不容易受到环境因素的影响。但遗传究竟有多大的作用?除了基因,环境扮演了什么样的角色?在下一章中,我将继续讨论有关智力究竟在多大程度上取决于遗传,以及环境究竟能在多大程度上改变人的智力的问题。
[1] 如果在某项测试中的成绩很好,那么在与之具有相关性的其他测试中的成绩也往往不错。如果在某项测试中的成绩不佳,很可能在与之具有相关性的其他测试中的成绩也不太理想。
[2] 磁铁学校(magnet school),又称磁石学校,是美国一种公立学校,学校提供额外课程以便从广大社区吸引学生。——译者注
[3] 作者在这里化用了《圣经·马可福音》中的“所以神所配合的,人不可分开”。