《超越智商》书摘
书名原文 :What Intelligence Tests Miss: The Psychology of Rational Thought
ISBN 978-7-111-50927-1
导读 理性:重新定义人类认知能力
思考,快与慢
斯坦诺维奇敏锐地注意到这一点,既然“聪明人”会做“傻事”,那么就意味着认知科学对“聪明”的界定出了问题。因此,早在 1989 年,他参照学习障碍(那些智力测验正常,却学习成绩低下的人)的概念,发明了一个新的词汇:理性障碍(dysrationalia),用于描述那类智力测验正常,但思维能力低于人类正常水准的人群。正如书中所写:
什么是理性障碍?布什的认知缺陷没有影响到他在智力测验上的表现,但是削弱了他做出理性决策的能力。这些认知缺陷,是“理性障碍”(类比“阅读障碍”(dyslexia))的根源。我于 20 世纪 90 年代创造了这个词,用以引起人们关注智力测验的不足之处。我把理性障碍定义为,尽管具有足够智力,却缺乏理性思考和行动的能力。因此,总统并非不聪明,而是很可能患有理性障碍。
学术界的奇妙就在这里。高手过招,相互激发。“理性障碍”作为斯坦诺维奇所言的“模因”,又引出了一连串的新模因。首先是理性障碍概念启发了哈佛大学认知科学家帕金斯提出“心智程序”(mindware)概念。1995 年,帕金斯注意到理性障碍的普遍存在,因此在著作《出类拔萃的 IQ》第 1 章中引用斯坦诺维奇发明的词汇“理性障碍”来呼唤人们重视反省智力。为了解释人们如何提高反省智力,帕金斯发明了一个新词汇——心智程序,用来形容那些安插在人们大脑中的程序。我们要抵制那些坏软件,安装好软件。
结果,心智程序概念反过来启发斯坦诺维奇提出人类心智架构的“双过程理论”。他与英国认知科学家埃文斯审查了大量认知科学、神经科学与心理科学文献,注意到,无论是齐瓦·孔达在社会心理学领域提出的冷认知、暖认知,还是雷伯在教育心理学领域提出的内隐学习、外显学习,还是埃文斯在推理心理学领域提出的进程 1、进程 2,都在阐述人类大脑的运作可以区分为两种不同的认知过程。
因此,在 2000 年左右,斯坦诺维奇首先提出了“双系统理论”(dual-system),他认为人类的心智加工存在系统 1、系统 2 两个不同过程。斯坦诺维奇的“双系统理论”又启发了 2002 年诺贝尔经济学奖得主、认知心理学家卡尼曼。卡尼曼不仅在诺奖演讲中提及斯坦诺维奇的贡献,还将斯坦诺维奇与埃文斯提出的这一理论作为其 2011 年出版图书《思考,快与慢》的标题与图书架构。卡尼曼在《思考,快与慢》中写道:
基思·斯坦诺维奇与其长期合作者理查德·韦斯特(Richard West)首先提出了系统 1 和系统 2 这两个术语(他们现在更喜欢将其称为第 1 类型过程和第 2 类型过程)。斯坦诺维奇和他的同事用了几十年的时间来研究不同个体面对各种问题时的不同反应,这也是本书所关注的问题。
他们用多种不同的方式问受试者同一个基本问题:为什么有些人比其他人更容易受判断成见的影响?斯坦诺维奇在《理性与反省心智》(Rationality and Reflective Mind)一书中阐明了他的观点,对书中相关章节的主题进行了大胆而独到的论述。他对系统 2 的两个部分做了明确区分,这一区分十分明显,斯坦诺维奇称其为泾渭分明的两种“思维”。
其中一种思维(他称其为算法)负责的是慢思考和要求很高的计算活动。有些人在这些脑力活动中比他人做得更好,他们在智力测验中超越他人,并且在从一项任务转换到另一项任务上时,他们往往更快、更高效。不过,斯坦诺维奇认为,高智商并不能消除成见。要想消除成见,还需具备另一种能力,他称其为理性。斯坦诺维奇对理性之人的定义和我之前说到的“勤快人”有相似之处。他的核心观点是我们应当将理性和智力区分开来。在他看来,肤浅的或者惰性思考是一个反思缺陷,是一个理性错误。这是个引人注目且发人深省的想法。为了论证自己的想法,斯坦诺维奇和他的同事们发现,在某种情况下,球拍和球的问题以及其他此类问题比传统的智力测验(比如智商测试)更能反映出我们对认知错误的敏感度。关于智力和理性之间的区别是否会引出更多的新发现,时间最终会告知我们答案。
《思考,快与慢》的不少中国读者没有注意到这段话,甚至部分读者以为双系统理论是卡尼曼的贡献,其实不然。它来自斯坦诺维奇与埃文斯。尤其是英国认知科学家埃文斯,少为人知。但是实际上,他才是最初原创者,早在 1989 年,埃文斯便发表了相关的论文与著述。
正如卡尼曼上文中提及的肯定被人忽略的要点:“他们现在更喜欢将其称为第 1 类型过程和第 2 类型过程。”近些年来,斯坦诺维奇与埃文斯等合作的论文,否定了通过卡尼曼畅销书《思考,快与慢》的宣传而广为人知的“双系统理论”,而更倾向于使用“双过程理论”(dual-process)描述人类大脑工作的两种不同进程。为什么要否定自己提出的双系统呢?因为系统 1、系统 2 的区分,容易使读者造成一个错觉,以为人们的大脑真的存在两种不同的生理区域。然而,它们仅仅是加工机制而已,所以斯坦诺维奇现在更倾向于使用进程 1(Type 1Process)、进程 2(Type 2Process)来描述我们人类大脑存在的两个进程:快与慢。
·在快的心智处理进程,我们调用的认知资源非常少,像个猛张飞。猛张飞常常情绪化,依赖直觉,见多识广又很会联想,擅长编故事,经常下意识做出反应,但很容易被骗,以为亲眼所见就是事情全貌,任由损失厌恶和乐观偏见之类的错觉引导我们做出错误的选择。
·在慢的心智处理进程,我们想得多一些,调用的认知资源也更多,像个诸葛亮。诸葛亮动作比较慢、擅长逻辑分析,猛张飞搞不定的问题,都丢给他来处理。他虽然不易出错却很懒惰,经常走捷径,直接采纳猛张飞的判断结果。
这,就是斯坦诺维奇提出的人类心智“双过程理论”(见表 0-1)。
自主心智、算法心智与反省心智
卡尼曼问道:“关于智力和理性之间的区别是否会引出更多的新发现,时间最终会告知我们答案。”这个答案已在斯坦诺维奇的理性三部曲中揭晓。
它就是斯坦诺维奇提出的人类心智的“三重心智模型”。
- 自主心智
正如前文所述,我们知道可以将人类的心智区分为进程 1、进程 2 两种。斯坦诺维奇将进程 1 称为自主心智(autonomous mind),自主心智是我们通过进化与内隐学习习得。比如,我们看到蛇就会害怕,不同民族不同文化对女性的择偶偏好存在一致规律,这都是因为我们虽然生活在互联网时代,但我们的大脑来自石器时代。
除了来自进化习得的适应性组块,自主心智还包括情感化反应、学习习得的自动化反应与条件化反应等。举个例子,一旦学会骑自行车,就终身难忘,变为本能,这就是后天习得的自动化反应。
- 算法心智
进程 2 是传统智力研究重心。它与进程 1 最大的区别是需要工作记忆介入。什么是工作记忆?你可以将人类大脑想象为一个简化的输入输出装置。制约这个装置输入输出速率的是工作记忆,它是人类所有能力,包括阅读速度、记忆、注意、执行功能的瓶颈。这个瓶颈受制于人类进化早期出现的前额皮层。因为工作记忆的瓶颈,导致进程 2 是个“慢慢想,仔细计算”的过程。
在智力研究领域,目前集大成的是 1997 年诞生、影响至今的 CHC 理论,强调一般智力(G 因素)的重要性,将人的智力分为流体智力与晶体智力两种。流体智力更多受制于先天习得因素,包括记忆、处理速度、逻辑推理等核心能力;晶体智力则来自后天习得,如语言能力。其中最核心的智力元素是一般流体智力,也就是智力研究者常常称呼的大 G。斯坦诺维奇将传统智力,尤其是与一般流体智力相关的认知操作过程定义为算法心智:“维持认知去耦化是流体智力的重要机制。”
试看一位女士不幸死亡的例子:
场景 1:一位女性沿着海边悬崖散步,她试图爬上一块巨石,然而她所爬的并不是石头,而是一道深渊的边缘,她不小心跌落巨石而死。
这位女士不幸死亡,在认知科学家看来,是由于她的算法心智出问题了,计算失误。
- 反省心智
然而,问题来了。进程 2 仅仅包括流体智力与晶体智力吗?答案是,否。基于上述例子,继续来看:
场景 2:一位女士试图自杀,飞身跃下海边悬崖,撞到海边巨石而死。
显然,在场景 2 中,这位女士的算法心智工作正常,她准确地知道自己跟悬崖的关系,也准确地知道自己行为的后果,那么,她为什么还会做这类非理性行为呢?我们不得而知。既然聪明人会做傻事,那么就意味着我们需要进一步厘清进程 2,需要将理性从进程 2 中剥离出来,独立于传统意义上的智力。不仅仅是这位我们假设的女士会采取非理性行为,试看以下一个经典例子:
琳达 31 岁,单身,性格外向,哲学毕业。在学校期间关心歧视和社会公正问题,参加过反核武器抗议示威活动。那么,她可能是?
选项有以下两个:
A.她既是银行职员又是个女权主义者。
B.她是个银行职员。
当询问琳达更有可能是哪一种人时,结果表明,绝大部分人认为她更像 A。虽然选项 A 出现的概率要比选项 B 出现的概率小得多。不过人们似乎认为 A 是对琳达更自然的描述,更像她的代表性特征。
这就是来自卡尼曼的经典实验“琳达问题”。多数人在这样的问题上,都会回答错误,只有少数回答正确,而这跟他们的智力测验成绩无关。同样,认知科学研究发现大量类似“琳达问题”这样的认知偏差。试看另一个经典例子:
杰克正看着安妮,而安妮正看着乔治。杰克已婚,乔治未婚。请问是否有一位已婚人士正看着一位未婚人士?
A.是。
B.不是。
C.无法确定。
你会选择哪个答案?A、B 还是 C?如果你选择的是 C,恭喜你!你是正常的人类。一定会选错的那批人。研究表明,大约有 80% 的人会选 C。最后,再看一个类似例子:
球和球拍的总价是 1.1 美元,已知球拍比球贵 1 美元。请问球的价格是多少?
如果你脱口而出的答案是 0.1 美元,恭喜你,你又一次答错了!而上述题目,研究者发现,即使是就读于麻省理工学院、哈佛大学等顶尖学府的学生,都会答错。大脑总是个认知吝啬鬼,能省就省。这就意味着我们需要将进程 2 继续拆分为算法心智与反省心智。除了那类偏计算的算法心智外,斯坦诺维奇将这类对人类心智过程进行监控、帮助执行决策与判断的人类心智加工过程称为反省心智(reflective mind)。
斯坦诺维奇注意到传统智力理论作为考察人类认知能力的理论,缺失了两种人类心智运作机制:自主心智与反省心智。因此,斯坦诺维奇重新定义人类的认知能力,将其分成自主心智、算法心智与反省心智三种。这就是斯坦诺维奇的三重心智模型。其中:
·自主心智来自进程 1,同时受到进化与内隐学习影响,比如看到蛇就会害怕,或者学会骑自行车后不再需要思考。
·算法心智与反省心智来自进程 2。算法心智就是传统意义上智力测验考察的能力,比如记忆、处理速度、逻辑推理等。
·反省心智主要指对人类心智过程进行监控,帮助执行决策与判断,如行为经济学关心的非理性偏差等。
具体如图 0-1 所示。
流体理性与晶体理性
那么,理性是否可以习得?
斯坦诺维奇的答案坚定不移:理性可以习得,甚至比智力更容易习得。
仿照智力领域的 CHC 理论,既然我们可以将人的智力分成流体智力与晶体智力两种,那么同样地,我们可以将人的理性分为流体理性(fluid rationality)与晶体理性(crystallized rationality)两种。
其中流体理性指更多人类大脑早期习得的模式,比如人人都是认知吝啬鬼;晶体理性更多关乎后天习得的能够增进理性的知识,比如概率知识会有助于增进我们的理性。斯坦诺维奇整理了人类最重要的 13 个流体理性,具体如下。①认知吝啬鬼;②避免自我中心偏见与准确的自我评估;③决策时缺少上下文(框架效应与锚定效应);④信念灵活性:积极的开放性思维;⑤信仰理性与真理;⑥倾向于寻求信息、享受思考与充分处理信息;⑦客观的推理风格;⑧对矛盾的敏感:倾向于寻求信念与判断之间的一致性;⑨自我效能感;⑩审慎贴现未来(双曲线贴现);自我控制的技能;良好控制情绪调节;情绪调节对奖励。
既然我们的大脑会安装各种各样的心智程序,那么,有好的心智程序,也有坏的心智程序。斯坦诺维奇将能够促进人类理性的称为晶体理性促进剂(crystallized facilitators),主要包括 5 大类知识:①概率推理,如明白基线概率;②决策科学知识,如明白决策偏好;③科学推理知识,如明白自变量、因变量与控制变量,会区分相关与因果的不同等;④逻辑的一致性与有效性的规则,如明白证伪、证据的不同层级、个人经验作为证据的不足等;⑤经济思维,如明白什么是机会成本、沉没成本,什么是指数增长。
将世界最聪明的头脑汇聚在一个房间中的 Edge,曾经提过一个有意思的问题:有无数能够增进人们心智能力的科学概念,普通人最应掌握的是什么?答:双盲实验。《自私的基因》作者道金斯如是回答,你只需要理解其原则,领悟到为什么有必要这么做,就能感受到其优美。在这些晶体理性促进剂中,或许双盲实验是最重要的,如果每个学校都教学生做,那么会提高我们抵制坏的心智程序的能力。
同样,那些阻碍我们人类理性的心智程序,斯坦诺维奇则将其称为晶体理性抑制剂(crystallized inhibitors),主要包括 8 大类知识:①信仰超自然与迷信;②信仰直觉;③过度依赖民间智慧与民间心理学;④信仰“特殊”的专业知识;⑤金融误解;⑥屡教不改的反思(过度自信自己的反思能力);⑦个人信念功能失调;⑧自我鼓励自我中心。
怎样才能避免大脑中被安装上这些坏的心智程序,斯坦诺维奇认为我们需要遵从以下几个规则。
(1)避免安装可能对你(宿主)产生生理伤害的心智程序,比如自残;
(2)关注影响你目标的心智程序,确保它不妨碍目标选择的多样性,比如让你只相信它的思想;
(3)关注同认识世界相关的信念和模型,努力只安装正确的心智程序,也就是真实反映世界的心智程序,比如不选择过激的价值观;
(4)避免拒绝对自身进行评估的心智程序,比如神秘主义色彩的思想。
可以说,斯坦诺维奇将人类对理性的认识提高到一个新的水准。甚至不夸张地说,他的理性三部曲著作秒杀其他一切行为经济学著作,将传统行为经济学辐射的 50 来种认知偏差,重新归类、编织为三类,用来指涉人们的理性思维水准高下,从而为我们提高理性提供了一条清晰可循的路径。斯坦诺维奇在编制一个全新的、类似智力测验的理商测验,可惜至今为止,还没编制完毕,大约 2016 年将完成此项工作。安人心智团队则在编制一个理商测验的中文版。
如果一个人有两个大脑
那么,提高人类理性的意义何在?我们可以来玩一个思想实验。
在前文中,我们指出人类工作记忆作为大脑信息处理的瓶颈,制约了人们的记忆、注意等事情。因此,研究大脑的科学家之间有个玩笑:如果神灯只能增进你的一种能力,那么就请灯神将你的工作记忆能力提高一倍。然而,如果你的工作记忆真的提高一倍,这个世界会变得更好吗?
不会。
当我们人类的智力,比如工作记忆、注意力提高了几倍,变得更强,这个世界并不会变得更好,因为如果一个人有两个大脑——
那么,它只会加倍愚蠢。
当你的能力提高了一倍,那时如果你不具备理性思维,你犯错的概率也将伴随增加,给人类造成的社会危害也越大。正如常常为纳粹辩护、高呼希特勒万岁的海德格尔,他是举世闻名的思想家;又如精通文字的著名诗人庞德,在第二次世界大战期间专注于通过意大利广播为法西斯宣传;第二次世界大战后纽伦堡大审判,绝大多数纳粹战犯的智商高于 125 分,最终策划大屠杀的 14 人中,有 8 人拥有博士学位。
这就是认知科学历史上著名的 IQ 之辩。认知心理学家乔纳森·巴伦(Jonathan Baron)在 1985 年的著作中介绍了上述思想实验。巴伦让我们设想一下,如果能给每个人服用一种无害的、又能增加他们的算法心智的药,结果会怎样呢?从人类幸福感角度来看,发生戏剧性变化的可能性很小。你不可能在服药后的第 2 天就能更好地实现自己的愿望,很可能依然重复昨日的事情,只不过效率更高。
通过上述思想实验,可以再次强调:“如果一个人有两个大脑——那么,它只会加倍愚蠢。”荷兰学者范博克塞尔甚至整理了一本图书,叫作《痴愚百科全书》,记录了人类生活中各式各样的痴愚。
对于身处信息大爆炸时代的人类来说,理性更具备非凡意义。随着进化心理学的流行,人们普遍意识到我们携带着石器时代大脑生活在互联网时代。不过,人们并没有普遍意识到,大脑刻下 3 个历史时期印记,分别是:
·A 周期:数百万年,从 600 万年前人类与猿人分离后到 200 万年的更新世;
·B 周期:数万年,符号语言诞生后到现代科学诞生前夕的数万年;
·C 周期:数百年,近代科学诞生后的数百年。
在不同历史周期,人类各种认知能力发育不平衡。在 A 周期,选择贫乏、忙于狩猎的男人与忙于采集的女人,需要大幅度改善视觉听觉与记忆,调整身体各个部位,比如让喉咙处于咽部下方,为语言诞生做好准备,此时更多习得与强调记忆、注意力等智力元素。在 B 周期,我们选择权多了一点,此时已诞生符号语言,主要习得与强调经验和学习。有的人作为奴隶或佃农,通过积累捕猎、种地等经验,扩大生存权;有的人则拥有丰富的文字能力与特殊专长,伴随而来的是相应的生存特权。在 C 周期,身处信息爆炸时代,新学科层出不穷,需要更频繁地从一个领域切换到另一个领域,此时,反省心智隆重登场,即使是普通大众,也需要提升理性。
序言
现行的智力测量工具与理性决策测量却没有丝毫联系。上述两个原因导致一些令人费解的现象,比如,“聪明人也会做蠢事”。如果考虑到人们测量评估智力的方式,这种现象就很容易理解了。如果“聪明”意味着智力测验分数高,“蠢事”指糟糕的决策,那么,造成这种现象的原因显而易见:智力测验没有评估适应性决策能力。如果你因“智商高却做蠢事”现象而感到惊讶,就说明你骨子里默认所有优秀的心理属性都伴随着高智商一起出现。比如说,理性思维一定与高智商共存。不过,学者们的研究结果不断对这个假设提出质疑。卡尼曼和特沃斯基的研究发现,理性思维技能与智力测验成绩之间只有小到中等强度的相关性。这种低相关性不足为奇,因为智力测验压根儿没有对理性思维技能进行评估。
第一部分 理性之心
智力测验并没有测量理性,这就是聪明人会做蠢事的原因:所谓的“聪明”仅仅是高智力,而非高理性。
人类存在两种信息加工机制:快与慢。快的类型一加工包括自主心智,慢的类型二加工包括算法心智和反省心智。算法心智就是传统的智力,而反省心智就是理性思维。
第1章 乔治·布什的心智:有关智力测验缺失什么的线索
他不太有耐心,容易动怒;有时说话没有经过仔细考虑,非常武断;对事物缺乏好奇心,常表现得一问三不知。
大家都同意布什总统的思维多少有点问题:怠于思考、缺乏认知弹性、闭合需要、信念固着、确信偏差、过度自信以及对前后矛盾不敏感。这些都是心理学家研究过,且能在一定程度上进行测量的认知特征。另外,这些特征也是智力测验没有触及的思维风格的典型例证。因此,一个人有上述各种认知缺陷,与此同时仍有着相对较高的智商,两者同时出现并不值得大惊小怪。
理性障碍定义为:尽管具有足够的智力,却缺乏理性思考和行动的能力。因此,总统并非不聪明,而是很可能患有理性障碍。
我们诧异于医生在金融投机中输掉所有的积蓄,也为受过训练的科学家信仰神创论而感到震惊。我们无法理解为什么受过高等教育的专业人士会去墨西哥找赤脚医生看病,而不选择经过科学检验的医疗方法。我们迷惑于有些大学历史教授否认犹太人大屠杀,也为在高中当老师的邻居想拉我们做传销而大为吃惊。简而言之,我们认为聪明人相信荒谬之事或做出糟糕的决策是非常矛盾的事情。
事实上,我们不该因此而感到惊讶。一旦我们从当代认知科学的语境中理解这句俗话,就不会因为“聪明人做蠢事”的现象而大惊小怪了。我们常会认为这是特殊的现象,这正说明了我们用来描述心理活动的日常用语存有缺陷——而心理学家谈论诸如智力等概念的混乱方式,恰恰助长了这种缺陷的发展。
聪明人就该是智力高的,愚蠢则意味着智力欠缺,根据逻辑学中的矛盾律,一个人不能既智力高又智力低,“愚蠢的聪明人”,这种表述是逻辑不通的。
斯腾伯格认为对此类例子更准确的描述该是聪明人做事荒谬。哈佛大学的认知科学家戴维·帕金斯(David Perkins)则更喜欢用荒唐一词来形容这些例子。一个行事荒谬的人“缺乏判断力、不讲道理、不理智、不谨慎”。这就从“愚蠢”和“笨拙”中区分出我们所希望关注的部分——做出明智(或不明智)判断的能力倾向,而与智力(敏捷思维)无关。
广义智力理论把聪明(智力)定义为适应环境的能力或做出明智决策的能力,使得聪明人不断做出荒谬行为(适应不良、判断不当或行事轻率)这样的现象无法得到解释,我们也会因此认为那些不断做出荒谬行为的聪明人其实并不如我们所想的那么聪明。
对民众智力观念的研究表明,人们倾向于接受广义智力理论的观点。
广义智力理论把“聪明做傻事”现象中的两种独立因素合并成了一个概念。“聪明”的部分是 MAMBIT,“傻事”的部分则指向能否明智行动、合理决策以及依势而为的能力。广义理论用智力一词把这两者(MAMBIT 和合理决策)混为一谈,给予 MAMBIT 特权地位的同时却贬低了非 MAMBIT 能力的价值。这都是因为 MAMBIT 有自己的名字(智商),能够被明确地(使用智力测验)测量,并且其上百年的历史使得每个人都对其有所耳闻。如果“傻事”的部分也有合适的称谓,能够被准确地测量,而不把它看作智力的一部分,也许就可以得到学术界和民间足够的重视了。其实,这另外的部分也不是没有名字,细数起来有一长串,比如适应性行为、明智的决策、有效的行为调控、合理的目标排序、自省能力以及证据校准。一旦其中某些特质缺失,就会造成行事荒谬、愚蠢或笨拙等后果,而这些特质正是认知科学家在探索理性思维时的研究对象。
关于智力的所有主要疑惑,学者都已找到了满意的答案。比如,我们已经知道智力约有一半源自遗传(由基因决定),另一半源自环境;我们知道智力对于人生成就起着重要作用(这就是为什么有些人可以成为人生赢家)。但是,人的命运轨迹又不是完全由智力决定的。那些智力测验没有涉及却对个体产生重要影响的心理能力是学者近期关注的焦点。其中一些能力的缺失是导致理性障碍产生的罪魁祸首。
大脑的运作可分为两种不同的认知过程,功能各不相同,各有优劣。
类型一加工的本质特征是其自主性。类型一加工又称为自动化加工,原因如下:①执行迅速;②只要触发性刺激出现,就会强制性执行;③不会加重中枢处理能力(central processing capacity)的负荷(换句话说,就是不需要有意注意);④不依赖高层次控制系统的信息输入;⑤可以平行运作,而不会相互干扰,也不影响类型二加工。类型一加工包括:情绪对行为的调控;由进化心理学家提出的,为解决特定适应性问题而存在的封闭性心理模块;内隐学习的加工过程;过度学习联结而产生的自动化激活。由于类型一加工的计算负担较小,因此成为人类信息加工的默认方式。类型一加工有时又被称为适应性无意识,以强调这种加工方式在完成很多重要任务时所发挥的作用,比如面部识别、本体感受、消解语言歧义、深度知觉等,这些加工都不在意识范围之内。类型一也常常称作启发式加工,意指其速度快、自动化、计算负荷低,以及无须对所有的可能性情况进行大量分析。
类型二加工的关键特质与类型一加工截然相反。类型二加工速度相对较慢,相对来说计算负荷也较高,它是意识的焦点。多种类型一加工任务可以同时执行,是平行式加工;而类型二加工只能在同一时间处理一个或几个任务,是序列加工。通常来说,类型二加工是基于语言和规则的,心理学家称之为控制加工。当我们说到“有意识的问题解决”时,指的就是这一类加工。
类型二加工的一个重要功能是压制(override)类型一加工。由于类型一加工速度快但粗糙,所以,很多时候类型二的压制是非常有必要的。在解决问题或做决策时,启发式加工可以帮助我们找到答案的大致范围。但是,当一些极为重要的情境(财务决策、公平裁判、雇用抉择、司法判决等)需要精细加工和分析时,启发式加工就无能为力了。启发式加工在良性环境下运行良好,可是一旦到了恶性环境,就会带来糟糕的后果。
在某些特殊的情景下,如果未能成功压制类型一加工,不同种类的类型一加工(情绪管理、达尔文模块、联结与内隐学习等加工过程)都有可能导致非理性行为反应。在后面的章节中,我们会讨论人是如何通过属性替代(attribute substitution)而成为认知吝啬鬼(cognitive miser)的。所谓属性替代是指使用容易衡量的特质来替代较难衡量的特质,时常以牺牲准确率为代价。比如说,认知吝啬鬼会用回忆起来毫不费力的鲜活记忆或者最突出的属性,替代那些需要费力获取的事实。但是,当我们对事关重大的情境进行风险评估时(比如与孩子有关的活动或环境),我们并不想用不假思索的鲜活印象替代对情境的仔细考量。在这种情况下,我们就希望类型二加工能够压制认知吝啬鬼的属性替换。
需要以更优化的反应替代原有反应。那么,更为优化的反应从何而来呢?一种答案是,它们源自类型二加工所独有的假设性推理和认知模拟。当我们进行假设性推理时,我们创建一个临时的模拟世界模型,并在这个模拟世界中测试各种行为及其后果(或是备择原因)。
为了能够进行假设性推理,一项关键能力是我们必备的,这种能力就是不将真实世界表征与假想的情景相混淆。比如,如若个体正在思考的备选目标与当前目标状态不同,他必须能够同时表征出当前目标和备择目标,并且保证它们之间泾渭分明。与之类似,我们需要能够区分出即将要采取的行动表征和认知建模中尝试过的备择行动表征。在行动实施阶段,前者一定不能受到后者的影响。否则,我们将要采取的行动将会被曾经思考过的备择行动方案干扰。
认知科学家将这种表征状态混淆的现象称为表征滥用(representa-tional abuse)。发展心理学家在试图探索儿童假装行为和假装游戏的起源(比如,小孩说“这根香蕉是电话”)时,表征滥用是他们研究的主要问题之一。儿童必须能够清晰分离香蕉与电话在心智中的表征,才能在游戏中把香蕉当作电话来玩。在一篇广为人知的文章中,发展心理学家艾伦·莱斯利(Alan Leslie)讨论了儿童假装的逻辑,提出了“去耦操作”(decoupling operation)一词,如图 3-1 所示。图中,初级表征直接映射世界,和 / 或直接与某个反应相连。为了使假装模式化,莱斯利提出了次级表征。次级表征是初级表征的复制品,但与真实世界相分离,从而能够被操控,即模拟机制。
诚如莱斯利所述,正在进行的模拟并不妨碍初级表征对外部世界的追踪:“与此同时,原版的初级表征继续保有专属的参照物、事实和事物之间的关系,而初级表征的拷贝则上升至第二位(1987,p.417)。”然而,从认知能力的角度来分析,处理次级表征,即保持它们的去耦状态,对认知能力的要求很高。为何去耦过程是高能耗的呢?进化理论给出了很好的解释。在我们逐渐进化为强烈依赖认知模拟的动物的过程中,有一点非常重要,那就是我们不能长时间地“脱离”世界。因此,处理对世界的初级表征必然有着独一无二的特殊地位。去耦的困难之处会表现在某些行为方面,比如苦苦思索时我们常常会闭起眼睛(或者抬头看着天空,或者转移视线)。此类行为旨在试图阻止初级表征发生改变,从而干扰正在进行模拟的次级表征。
我们关注的重点是次级表征与世界的分离(去耦),并在类型二加工进行模拟时保持这种去耦化。这种加工需要消耗大量计算资源,从而限制个体完成其他类型二加工。去耦操作可能是导致类型二加工具有序列性特点的主要推动者。
通过终止类型一加工触发的早期表征,个体行为通常可以得到优化。类型二加工(慢、序列式、消耗较多计算资源)需要对类型一加工进行压制,并保持认知去耦过程,通过在世界模拟模型中对备择反应进行仿真模拟,以确保想象过程的顺利执行。该图体现了我们之前讨论的压制功能以及模拟的类型二加工。图中左一箭头表示类型二加工接收来自类型一加工计算后的信息。这些被称为“前注意”的加工过程确定了绝大多数类型二的加工内容。
智力测验并不关注自动化的类型一加工,而是重点对类型二加工进行评估。智力测验测量的是本章的焦点之一——认知去耦。如同所有的类型二加工一样,认知去耦需要消耗大量认知资源。去耦操作使得人们可以进行假设性思维。在心理模拟过程中,必须不间断地进行大量的去耦操作,维持模拟的同时保持去耦表征,这些操作体现了大脑的计算能力,也是智力测验评估和测试的能力。在同时关注执行功能和工作记忆的研究中,这一点体现得尤为明显。工作记忆和执行功能与智力测验之间的相关度都非常高。所有的这些任务都需要保持去耦操作,这也许是工作记忆 / 执行功能任务上的个体差异和智力上的个体差异存在高度重合的原因。
与其说“维持认知去耦化是智力的重要方面”,不如换一种说法“维持认知去耦化是流体智力的重要方面”。此处我引用了上一章中提到的卡特尔-霍恩-卡罗尔智力理论。流体智力(Gf)反映了个体在多个领域中表现出的推理能力,特别是在新异情境中。晶体智力(Gc)反映了文化学习过程中获得的陈述性知识。因此,类型二加工与流体智力关系密切。
认知心理学家做了大量工作,认为我们可以假定大脑中存在特定的信息处理机制(输入编码机制、知觉登记机制、短时和长时记忆存储系统等)。例如,一个简单的字母发音任务也许会涉及字母编码、短时记忆存储、与长时记忆中的已有信息进行比较等过程,如果经过比较后发现能够与已有记忆配对,则做出决策,执行动作反应。
反省心智关注于系统目标、与目标相关的信念以及基于当前系统目标和信念的最优化的行动。只有在反省心智分析层面,理性才会参与其中。更为重要的是,算法心智的效率可以被量化评估,但理性的效率却无法被评估。
算法心智与反省心智的区别还体现为个体在认知能力和思维倾向方面的差异,已有充分证据表明这两者之间存在本质性区别。如前所述,认知能力测量实则是对算法心智效率的评估。思维倾向的称谓在心理学中尚存争议,不同的学者看法不一,比较常用的是“思维倾向”和“认知风格”两种说法。许多思维倾向方面的研究将关注点置于信念、信念结构,以及信念形成与改变的态度。另外,个体的目标和目标层级结构也属于思维倾向的研究范畴。心理学工作者已对积极开放的思维、认知需求(乐于思考的认知倾向)、对行为后果的深思熟虑、迷信思想和教条主义等思维倾向 展开了深入的研究。
有关这些思维倾向的文献数量繁多,在此我无意赘述。需要提请大家注意的是,经由思维倾向评估所得出的认知倾向,反映了人们在以下几方面的认知属性:为了做出决策而收集信息的认知倾向、为了得出结论而寻求多元观点的倾向、面对问题时思维广度的认知倾向、根据证据矫正已有观点的倾向、采取行动前考虑后果的思维倾向、做决策前权衡情境的倾向、寻求细微差别以避免绝对论的倾向。简而言之,思维倾向的个体差异可以通过对反省心智操作的测量而得出,具体包括:目标管理、认识价值观、自我管理认识论等。以上这些心理特质是支撑理性思维和行动的基石。
我们已将类型二加工分成了两类:反省心智和算法心智。如果再加上类型一加工的别名“自主心智”,就构成了我们接下来要讨论的三重加工模型。三重加工模型与双重加工模型有所不同,双重加工模型不重视个体差异,因此会错过类型二加工过程中的关键个体差别。
个体流体智力的差异源主要是心智加工效率的个体差异,而思维倾向的差别反映的是反省心智的个体差异。反省心智和算法心智的个体差异都是连续性的,不过,自主心智的个体差异很少是连续性的。如果自主心智出现问题,这就意味着某些认知模块遭到严重损坏,所带来的结果是自闭症、失认症和失读症等非连续性认知紊乱现象。
有些大样本研究在对数千名被试进行分析后表明,智力与有些思维倾向(例如,积极开放的思维、认知需求)之间只有中等偏下水平的相关(低于 0.3),有的思维倾向(例如责任心、好奇心、勤勉)与智力甚至接近于零相关。
智力所圈定的概念范围与智力测验的实际测量内容之间存在巨大分歧。
理性涉及最大化的目标实现,而目标实现的过程有赖于明智决策和信念与证据的优化契合。反省心智的思维倾向是通往这些目的的手段方式。当然,一些得到广泛研究的思维倾向,比如反省和灵活性等,对于理性思维和行为是必不可少的。但是,“优秀”并不一定意味着追求“最大化”。举个例子来说,个体没有必要在反省维度上不断追求卓越,反省维度最大化的人会迷失在无穷尽的思考犹豫过程中,可能永远都无法做出决策。与之相类似,个体也没有必要追求思维灵活性的最大化,这样的人有可能会成为病理性不稳定人格。反省和灵活性都是“好”的认知风格(由于多数人欠缺这两者,因此会形成“越多越好”的错觉),但是,这并不意味着要追求这两种思维倾向的最大化。
在排除掉智力因素带来的差异之后,自律(反省心智中反应管理和抑制的指标)可以预测八年级学生的平均学业绩点。追踪研究数据表明,学生在学期间平均学业绩点变化的最佳预测源是自律,而非智力。人格变量中的责任心涉及反省心智的高级管理属性,它可以独立于智力预测学业表现和工作绩效。
智力测试评估的是认知去耦能力,不可否认这种心智技能非常重要,但是,它只不过是理性思维和行为所必需的三个要素之一。另外两个要素是心智程序和思维倾向,这两点才是滋养理性思维的温床。
教育和现代化增加了去语境化的思维方式,另外,语言也被用作一种去耦化工具(Evans and Over,2004)。这些机制通过增加心智程序(比如短时记忆中的复述策略)的自动化程度,使其操作时占用更少的认知资源,进而提升心智程序增加算法心智功能,尤其是去耦化操作的功能。
如果在丛林中遇到雄狮,当我那擅长内省、凡事深思熟虑的祖先还在思考接下来该做何反应时,恐已成为狮子的腹中午餐。但是,他那不假思索迅速逃命的表哥却得以幸存……很多证据表明,我们人类远远没有自认为的那样遇事都会进行审慎思考。
试想我们现在正身处股票市场极其动荡的 1998 年年初到 2001 年年末这段时间。在这 4 年间,第一手技术价值共同基金(Firsthand Technology Value mutual fund)表现良好,公司公布的年盈利率为 16%,也就是说,这只基金在这 4 年中平均每年净赚了 16%。但是,这只基金的投资者在这 4 年间的平均亏损率约为 31.6%。19982001 年,当第一手技术价值共同基金的年均盈利率是 16% 时,投资者在这只基金上总计亏损了 19 亿美元(是的,19 亿!)。为何会发生这种事情?为何一支年盈利率为 16% 的基金,能够让同期的投资者损失如此惨重?2001 年间 700 家共同基金的表现后,他注意到“很显然,基金投资者的实际收益通常远低于基金公布的预期收益,有时缩水率甚至高达 75%”(2002)。茨威格告诉我们,他研究的这 700 家基金的平均年收益率为 5.7%,但是,投资者的平均年收益率仅为 1%。茨威格引用福特基金会的劳伦斯·西格尔的话说:“如果基金投资者的盈利率真的如基金公布的利润数据一般,他们早就已经赚得盆满钵满了。为何并非所有的投资者都有盈利?因为人们不断地在搬起石头砸自己的脚”。那些“搬起石头砸自己的脚”的人无疑是不理性的。由于多数股票投资者都来自于高收入群体,而高收入与高学历有密切关联,因此,我们有理由相信,这类大规模的投资表现欠佳行为(投资者在面对潜在盈利机会时,却总计损失了 2000 亿余美元)表明了理性障碍发生的广泛性。
反思片刻,即有答案。年平均 16% 的投资收益率对那些 1998 年买入,之后一直持有该基金,直到 2001 年卖出的投资者来说是成立的。但是,多数投资者在这 4 年间并非一直持有该基金,而是在不同的时间点认购,并在不同的时间点赎回——投资者常常会反复多次认购、赎回。第一手技术价值共同基金在那段时间的表现非常不稳定。当它盈利时,盈利率很高;而当它亏损时,亏损率也很高。现在,上述悖论就很容易解释了(某种程度上说明了理性障碍发生的广泛性)。投资者之所以在这只基金上亏损巨额资金,是因为他们恰巧在错误的时间认购和赎回。换句话说,他们通常会在基金的高价位点上买入,并在低价位点上卖出。加之这只基金的波动幅度较大,当它升值时会升至非常高,而当它跌价时会跌至非常低,所以导致了这只基金投资者的巨额亏损。
这类“被自己打败”的行为并非仅仅发生在第一手技术价值基金这一则案例中。例如,同时期的骏利墨丘利基金(Janus Mercury Fund)的年均盈利率为 13.9%,但是,这支基金的投资者却是亏损的(年均亏损率 7.4%);富达积极成长基金(Fidelity Aggressive Growth)年均盈利率为 2.8%,而他的投资者年均亏损 24.1%;景顺动力基金(Invesco Dynamics fund)的年均盈利率为 7.0%,但是它的投资者却每年亏损 14.4%。财经记者贾森·茨威格(Jason Zweig)在研究了 1998
许多人对他们的知识储备量过度自信。他们自认为知道的事实,远比真实知道的要多,这些人认为自己处理信息的速度和效率优于他人。对于一个股票市场投资者来说,这是一种非常糟糕的心理特质。大盘指数的变化是基于极其复杂的技术分析运算产生的,大盘的点数和股票的价值变化是对各种信息进行充分、全面的分析后得出。对于“周末投资者”来说,他们认为自己可以发现在分析过程被忽视的信息,并试图从中牟利。这种想法是非常愚蠢的。数以千计的投资者(多数拥有较高智商)饱受这种非理性思维特质的折磨。结果,他们的这种过度频繁交割的投资行为拉低了总的投资回报率。频繁交易增加了额外成本,由于他们的交易行为并非基于什么高深的知识,他们希望把握最佳“市场时机”(表现为反复地进出市场)的企图反而减少了投资回报。讽刺的是,不那么自信的投资者倾向于固守“购入并持有”的保守策略,而这恰恰被私人金融专家认为是最为明智的选择。这种对投资行为影响较大的心理特质被称为过度自信倾向。心理学家已开发出一些测评工具对其进行评估。
第二种致使人们犯投资错误的心理特征,在多数情况下是非常有用的。人类大脑通过进化发展出不断地搜寻各种既定模式的认知方式。我们不断寻求发生在我们身边的事物间的相互关系、究其原因并寻找其意义。这种思维特征无疑是极具适应性的,但是它带来的副作用会让人们给随机事件赋予意义。这种行为模式时常发生在股票投资者身上。股票大盘以及各只股票的走向不断受到一些不可预知事件的影响,但这些随机事件对于公司的分红(股票长期价值的主要决定性因素)并无影响。投资者试图对这些随机事件进行解读并做出反应,这种做法无疑是非常错误的。有一些投资者对消息的反应阈限非常低,任何风吹草动就会让他们过度反应。这种为随机事件寻求解释的心理倾向导致投资者频繁交易,进而减少了长期收益。
导致过度频繁交易的第三个因素是“短视损失厌恶”(myopic loss aversion)。这个理论是 2002 年诺贝尔经济学奖获得者、认知科学家丹尼尔·卡尼曼的获奖成果是判断与决策的前景理论(prospect theory)的组成部分。卡尼曼和他的合作者阿莫斯·特沃斯基提出,人们对预期损失的主观评估感受大约是预期收益的两倍。也就是说,损失 100 美元导致的痛苦强度,是获得 100 美元诱发愉悦感的两倍。“损失厌恶”(loss aversion)的概念就源自这种现象。“短视”是说人们监控投资的时间尺度与投资期限的时间尺度出现不同步的现象。例如,一位 40 岁的投资者在进行退休投资时,如果他每小时、每天,甚至每周都检视自己的投资状况的话,这就是“短视”。金融专业人士建议这位投资者以每月一次的频率检视自己的投资状况即可,最理想的状态是每年四五次。
等一下,通常意义上讲,不是获取的信息越多越好吗?为何频繁地对财务状况进行监控却成犯错误了?对,大错特错。股票市场风云莫测,涨跌不定。人们害怕损失(请回忆“损失厌恶”),因此,会对股票市值下降做出更为强烈的行为反应。每一次股票下跌,都诱惑着投资者将股票卖出变现,进而避免或减少损失。那些频繁监控投资状况的投资者,他们在一次次地检视自己的投资账户时,面临着更多的诱惑,有更多的“机会”将股票卖出。相对比那些不经常查看投资情况的投资者来说,对自己账户状况了如指掌的投资者更容易臣服于卖出诱惑。当投资者将股票卖出变现之后,那些勤于监控账户状况的投资者常常能第一时间注意到跌势已止,价格开始上涨,简而言之,局势安全了,于是投资者又开始跃跃欲试。一旦他们在这种情况下买入,那么,他们就完成了股票市场上最忌讳的事情:高买低卖。
上述探讨的 3 个因素——过度自信、对随机事件的过度反应以及短视损失厌恶,是已被广泛接受的用于解释个人金融领域不良行为的理论。
大脑有两个特征致使人类不够理性。一个是处理信息方面的缺陷,另一个是内容缺陷。对于这两种认知缺陷,智力均未提供让人类能够不受影响的免疫力。
人类在思考问题时,大脑对认知资源的分配和使用极为吝啬,我们称为“认知吝啬鬼”。围绕着认知吝啬鬼开展的研究是过去 30 年间心理学和认知科学领域的重要研究主题。当遇到问题时,我们的大脑有多种可用的信息计算机制。但是,这些机制各有利弊,都需要在功率和消耗之间有所取舍。有些认知机制有强大的计算功率,它们可以非常准确地解决大量问题。但是,这种高功率需要付出一定的代价,即占用大量的注意资源,运行缓慢,并且会干扰到同时进行的其他想法和行为。相比来说,另一种信息加工机制的功率较低,但优点是低能耗。有很多问题难以使用这一类机制进行解决,并且这类加工机制在处理信息时的准确性无法得到保证。但是,它们的加工速度快,与同时进行的其他认知任务互不干扰,仅需要极少的专注力即可。它们就是我们在第 3 章讨论过的类型一加工,也称作启发式加工。
由于人类大脑默认的加工模式是低能耗的类型一加工,因此,人类在多数时候都是认知吝啬鬼。当人类同时加工处理两个任务时,其中一项任务占用的认知资源越少,意味着可被用以完成另一项任务的认知资源越多。这种机制看似是具有适应性的。然而,这种对简单认知机制(认知吝啬鬼)的默认偏好,意味着人类通常是不够理智的。在现代社会中,越来越多的决策需要我们做出精确的反应,这种精确性远非启发式加工可以达到的。类型一加工过程所能够提供的通常是与最佳反应接近的快速解决方案。但是,现代生活对于信息加工的准确性有着越来越高的要求。对于那些依赖自动加工机制的人来说,现代科技社会可谓危机四伏。蓬勃兴起的广告业,正是利用了这种加工机制的缺陷。市场经济体制下,到处都潜伏着试图利用人类的认知缺陷赚上一笔的陷阱,自动化加工机制日益威胁着人们的幸福生活。认知吝啬鬼将严重阻碍个体目标与理想的实现。
人类总在想尽办法减轻认知负担,试图让自己尽可能地处理更少的信息,然而,正是这种想法致使我们常常会深陷不理性的泥潭。人类为什么是认知吝啬鬼,而不是完全理性人?一言概之——进化。进化塑造了人类今日的认知机制,进化造就了人类的非理性。
进化为何没有将人类塑造为完全理性人? 理性是基于“最大化原则”进行定义的(以工具理性为例,使行为的预期收益最大化)。而自然选择是基于“更好”原则。正如理查德·道金斯所说:“自然选择从当前可用选项中选出那个‘更好的’方案……进化塑造的动物并非是完美设计方案的成果,也并非差强人意的无奈选择,而是历史变更过程中同时期诸多选项中那个更为适宜的选择”(1982)。简单来讲,进化论中变异与选择性保留的逻辑是基于一个生物相对于另一生物体的繁殖优势来说的,而非基于某一个特征的完美优化(包括理性)。有一种说法认为,进化应该被描述为幸存的“适应者”,而不是优胜劣汰后的“最佳选择”。
生物体在进化过程中不断地增加基因的繁殖适应性,而非人类理性。适应性的增加并不一定会带来理性的提升。
进化并不能保证人类拥有完美的知识理性。例如,进化有可能不会选择高度准确的知识性思维机制,因为这种机制会消耗掉太多的资源(例如,金钱、能量和注意力)。信仰形成机制并非以最大化保存事实为原则的另一个原因是“相对比一个需要深思熟虑、证据确凿才能做出的判断来说,胆小甚微、风险厌恶的推论策略,即基于少许的证据快速得出即将身临大敌的结论,通常会带来较多的错误信念,较少的真实信念。然而,自然选择却钟爱这种不可靠、易出错、风险厌恶的策略。因为自然选择毫不在乎事实与真相,它只关心是否能够繁殖成功。”
目标和欲望领域的情况与之类似。进化的目的并不是最大化人类的快乐与幸福。近些年情感预测领域的研究表明,人类其实并不擅长做出让自己开心的选择。这个结果完全在意料之中。大脑中存在快乐神经回路的原因是鼓励我们做出有利于基因传递事情(例如生存、繁殖、帮助亲戚),而非为了使我们享受更多的快乐时光。
进化之所以不能确保人类具有工具理性,还有另外两个原因。第一,由于环境的剧烈变化,原本根植于大脑中的许多基因设定的预订目标已无法达成。例如,千百年前,人类需要积累尽可能多的脂肪以获取更多的生存机会。脂肪越多,意味着可以活得越久。在远古时代,人类的平均寿命很短,只有少数人类可以活到适于繁殖的年龄,更长的寿命意味着更多的基因传递机会。简而言之,当储存能量是一件对生存和繁衍有益的事情时,人类通过进化改进了储藏和使用能量的生理机制。然而,在当今这个麦当劳随处可见的现代科技社会,上述生理机制已经不能达到提高繁殖概率的既定目标,这种生理机制背后的目标已经与相应的进化情境剥离开来。最后,由于理性标准的文化变革速度远远快于人类进化的速度,因此,提供了大量将效用最大化机制与基因适应最大化这两者分离的机会。我们的进化史并没有提供给我们一个默认设置为理性的大脑。
第二,正如在第 3 章中讨论过的,对心智多重加工理论的研究告诉我们,大脑的某些处理过程时常与另外一些处理过程发生争斗。我们的部分心智是工具理性取向的——致力于实现个人目标。反之,脑内另一些处理过程倾向于简单粗暴取向——致力于实现远古基因的目标,而非是当下的个人目标(比如,许多类型一加工)。进化使得一些认知吝啬鬼信息加工倾向成了默认选项。在千百万年前,这些默认方式也许是非常棒的,但是,在环境发生了剧烈变化之后的今天,这些默认选项已不能很好地服务于人类需要了。
进化无法保证认知科学领域中定义的“理性”,即最大化主观期望效用(Gauthier,1975)。
自然选择的“择优”机制,参见 Cosmides 和 Tooby 的研究(Cosmides&Tooby,1996)。Ridley 独辟蹊径,称之为进化“短浅”,因为它更关注即时利益而非长期策略。与此相反,人类理性必须关注个体的长期利益。
人类大脑天生懒惰。在没有具体线索提示个体需要避免最简化信息处理(比如,考试就是一种提示线索)的情况下,人们通常会成为认知吝啬鬼,受困于非理性。不过,认知吝啬鬼在信息处理时的方法也并非千篇一律,他们会采取多种多样不同的策略,这就意味着每个人的认知 / 行为特征都有所不同,人类的理性程度存在着个体差异。另外,我们还会发现,策略多样性与智力之间几乎没有相关关系。
在本章中我已提到过,人类大脑不理性的主要特征有两种:一是信息处理过程问题,二是内容问题。所谓信息处理过程问题就是受到认知吝啬鬼的影响。内容问题是指我们在进行理性的思维和行为时,所必需的某些具体知识结构。当理性行为所必需的思维结构缺乏时,我将其定义为“心智程序问题”,参考的是帕金斯对“心智程序”的定义,即个体在决策和问题解决时,能够从记忆中提取出的规则、知识、程序和策略。在第 10 章和第 11 章中,我会具体讨论导致人类不理性的心智程序问题。
评估人类行为的理性标准是社会和文化发展传承的产物,独立于基因得以保存和传承。21 世纪概率理论、经验主义概念、逻辑和科学思维的发展,给人类提供了形成信念、修正信念以及行动推理的概念工具。它们以“心智程序”的形式安装进人类大脑,代表着孕育了人类理性的文化成就,随着社会发展,产生了越来越多的理性文化工具,这些工具逐渐在人群中流传开来。
概率思维、逻辑、科学推理等理性工具,通常是个体没有完全掌握或是根本没有注意到的心智程序。由于未掌握某些心智程序而导致的不理性,我将其称为“心智程序缺陷”。另外一类心智程序问题产生的原因在于心智程序本身是有害的、无用的,不能帮助个体实现目标(工具理性)或是建立正确的信念(知识理性)。事实上,很多心智程序都是导致非理性行为,阻碍目标实现的直接原因。我将这一类问题称为“污化的心智程序”。
高智商群体成为认知吝啬鬼或是出现心智程序故障的概率仅比普通群体低一点点。从统计学角度来看,理性障碍应该是一种不受智商高低影响的普遍现象。换句话来说,如果非理性是一种常见的现象,并且与智商之间仅有微弱相关,那么高智商群体中的非理性行为绝非罕见。
在自然条件下,做一个认知吝啬鬼是默认的人类认识方式。当环境线索提示个体即将要付出大量的认知努力时,由于高智商个体有着更强大的计算能力,所以他们会更快地觉察到环境的认知需求,启动认知吝啬鬼模式。
虽然本书关注的是理性这种最优思维方式,不过接下来的几章我将着重介绍几种思维谬误的产生原因。究其原因,主要在于理性概念的多维性,它要求个体具备多种不同类型的心智程序。为了避免非优化的自主心智自作主张参与思维过程使其走捷径,需要多种反省心智倾向作为保障。现有的测量手段很难对思维成分的优化程度进行评估,也就是说,很难评价一个人是否具有“完美理性”。研究者发现,测量个体是否会违反某一理性规则,是否会犯某一类型的思维谬误,比评估个体的思维是否优质容易得多。这就好比我们在观看一场橄榄球比赛,四分卫在场上的技术细节表现完美时,我们通常很难察觉,但如果他传出一记糟糕的抛球,观众立即就能识别出来。
事实上,很多领域中的优劣评估都与观看橄榄球场比赛十分类似。相对于识别、分辨优秀的认知表现,别人的错误更容易被觉察到。评论家尼尔·博斯曼(Neil Postman)认为,优质思维的教育家和倡导者所采取的立场与医生或律师很相似。对于医生来说,确认某人拥有“完美的健康”是一件非常困难的事情,但是,诊断某种疾病就容易得多。与之相类似,律师很擅长指出不公正和有违民权的做法,但却很难定义何为“完美的公正”或是“理想的公民权利”。
如果想同时具备知识理性与工具理性,要求个体必须表现出深思熟虑、自我行为约束力、审慎的决策、明智的目标优先级设定并对证据进行合理校正。例如,知识理性(信念与客观世界相吻合)要求个体具有概率推理和证据校正的能力。工具理性(最大化的目标实现)要求个体严格遵循各种理性选择原理。由于认知吝啬鬼、重要心智程序缺失和污化心智程序影响等原因,会让个体采用非理性的思维方式,出现各种思维谬误。若想避免思维谬误,可以通过获取理性思维心智程序的方式避免过度使用认知吝啬鬼的思维策略。
提高理性有两条途径,第一条途径是避免先天的信息加工缺陷(即认知吝啬鬼),第二条途径是给自己大脑安装好的心智程序,抵制坏的心智程序。
人类大脑所遵循的准则是:能不用,则不用,该用脑时也不用。
——大卫·赫尔,《科学与选择:生物进化与科学哲学论文集》,2001 请大家先来看一道思考题,这个问题是由赫克托·莱维斯克(Hector Levesque)提出的,我们的研究团队围绕着这个问题开展了很多研究。
杰克正看着安妮,而安妮正看着乔治。杰克已婚,乔治未婚。请问是否有一位已婚人士正在看着一位未婚人士?
A. 是 B. 不是 C. 无法确定 在继续往下读之前,请先给出你的答案:A、B 还是 C?
我们的研究发现,人们在这道题目上的错误率高达 80%(超过 80% 的人给出的答案都是错误的)。绝大多数人选择了 C(无法确定),而正确答案其实应该是 A(是)。心理学中有个概念叫完全析取推理(fully disjunctive reasoning),当我们了解并使用这种推理方式来回答这个问题时,答案就显而易见了。完全析取推理是指面临诸多选项做出决策时,或是在推理任务中选出最佳问题解决方案时,对所有可能性及其结果进行分析、采择的思维过程。析取推理是一种系统性且速度较慢的信息处理方式,是前面几章中介绍过的类型二加工的一种。
如果想正确解答上述问题,就有必要对安妮所有可能的婚姻状态进行考量。如果安妮已婚,那么答案将是“A. 是”,因为她正在看着乔治,而乔治是未婚的。如果安妮未婚,那么答案依然是“A. 是”,因为已婚的杰克正在看着未婚的她。对所有的可能性进行分析(完全析取推理策略)后可以得知,无论安妮婚否,我们都可得出“一位已婚人士正在看着一位未婚人士”的结论。该问题的题干中未提及安妮的婚姻状况,让我们觉得这道题目因为信息不足而无法得出结论。这是人们最容易想到的答案,但是,不好意思,这却是一个错误的答案。“认知吝啬鬼”是以肤浅著称的类型一加工的显著特点。换句话说,人们倾向于寻找显而易见的表面信息,而不愿意对已有信息进行加工推论,进而得出更全面准确的信息。这种认知加工特点是多数人对这个问题给出“无法确定”答案的主要原因。人们往往会根据已知信息进行最简单的(错误的)推理,而不愿进行稍复杂但是能够得出正确答案的完全析取推理。
进行完全析取推理要求人们克服成为“认知吝啬鬼”的冲动,也就是说,避免在对信息进行肤浅加工的基础上给出答案。实际上,在被告知需要进行完全析取推理时(考虑到所有的可能性),绝大多数人都可以做到。然而,事实却是绝大多数人在遇到问题时都不会自动进行完全析取推理。我们也许会认为高智商群体在这一类需要使用析取推理的问题上会表现得优秀很多,其实,在没有明确告知需要使用析取推理的情况下,高智商人群采用这种推理方式的可能性和普通人相差无几。本章开始时提到的安妮问题就没有给出明确的线索让解题者使用析取推理。我的研究小组发现,高智商人群在解决安妮问题及其他相似问题时的正确率和普通人相仿。如果在解题时给予提示,请答题者考虑所有可能的情况,那么高智商人群的反应会更快,更有效率。不过,在没有提示的情况下,他们也会使用简单的认知方式去解决问题。如同其他所有人一样,高智商人群也是认知吝啬鬼。智商与自动使用析取推理之间并无关联。
在启用完全析取推理失败时(没有考虑到所有的可能性),我们通常对此毫无察觉,原因在于类型一加工迅速启动并取代了完全析取推理。丹尼尔·卡尼曼和他的同事肖恩·弗莱德里克(Shane Frederick)在一项研究中让被试解答下面这个问题:
球和球拍的总价是 1.1 美元,已知球拍比球贵 1 美元。请问球的价格是多少?
许多人会脱口而出那个即刻进入脑海的答案:0.1 美元,而不去仔细思考这个答案的正确与否。试想,如果球的价格是 0.1 美元的话,那么球拍比球贵 1 美元,即 1.1 美元,球和球拍的总价则为 1.2 美元,而非题目中的 1.1 美元。只需稍作思考,即可知道 0.1 美元这个答案是错误的。然而,在卡尼曼的研究中,即使是就读于世界顶尖大学的学生,也常常会给出错误的答案,并且不假思索地开始做后面的题目,完全没有意识到自己因为使用了肤浅的信息加工方式而犯了错误。他们并没有意识到自己已臣服于类型一信息加工,未能采用类型二加工。弗莱德里克的研究发现,大量来自麻省理工学院、普林斯顿大学和哈佛大学的天之骄子,与研究中的其他普通人一样,都是认知吝啬鬼。
如果一个事件的结果集合中,包含另一个事件的所有结果,两者之间即是支配关系。当人们对较小结果集合的估值或概率估计高于较大结果集合时,就是违反了支配关系原则。卡尼曼和弗莱德里克通过研究发现了很多因属性替换而导致人们违反支配关系原则的例子。请看下面这个案例。研究者让一组被试估计在某个特定的年份中,密歇根发生的谋杀案数量。这是一个很难的问题,人们很难通过对既有知识的检索获取答案。为了给出这个问题的答案,被试需要回忆与问题有关的信息(包括该州的人口总数、听说过的犯罪事件及其他相关线索),在对这些信息综合考量的基础上进行估计。然而,这个研究的结果表明,人们在回答这些问题时并没有想太多(认知吝啬鬼)。研究中被试被分到两个小组中分别对底特律和密歇根州的杀人犯数量进行估计,底特律组的估值竟然是密歇根州的两倍!
显而易见,人们就上述问题给出的答案违反了支配关系(所有底特律的罪犯,都是密歇根州的罪犯)。人们在这个问题上犯错误的原因很简单,他们根本没有认真去思考并提取与这个问题有关的事实与信息,而是仅仅依据带有情感偏向的印象,估出一个或高或低的数字。相对于“密歇根州”这个地名来说,“底特律”三个字会让人们更多地联想到凶杀案画面,虽然从理性角度分析,底特律的凶杀案绝对不可能多于密歇根州,但人们仍然做出了底特律有更多凶杀案的估计。
。奚恺元(Christopher Hsee)及其同事在另一项研究中进一步证实了这个推论。在这个研究中,研究者告诉一组被试:“如果有科学家在亚洲发现了 4 只大熊猫,你愿意捐多少钱来拯救这 4 只大熊猫?”另一组被试需要回答相似的问题,只不过熊猫的数量由 4 只变成了 1 只。在这个研究中,两组被试都只读到一段阅读材料,没有看到任何其他的视觉图像刺激。相对于上面的鸟类研究,这个研究中涉及的数量较小,因此可以更为清晰地评估人们在决策过程中的所思所想。在这个情境中,相对于拯救一只大熊猫来说(均值 11.67 美元),人们愿意捐出更多的钱去拯救 4 只大熊猫(均值为 22 美元)。第二个研究,所有研究设计完全相同,只不过在提供了阅读材料之后,还为被试提供了非常可爱的大熊猫照片。结果发现,人们救助 4 只大熊猫与救助 1 只大熊猫的捐款金额完全相同。可爱照片所引发的情感反应使被试忽视了对数量的考量。
在股票市场上,人们都知道应该遵循“低买高卖”的交易原则,但情感导致的属性替换时常会阻挠这一原则的贯彻执行。当股指高开时,股市沉浸在一片欢乐祥和的氛围中,这种积极的情绪氛围鼓励非专业的投资者(以及许多专业操盘手!)受到积极情绪的影响而做出买入的决定。当股指下滑时,情况则完全相反。投资者已经开始亏损,而担心进一步加深亏损的恐惧情绪控制了决策氛围。股票市场触发了负性情感反应,导致人们通常不会做出低价买入的行为,而是会选择卖出。因此,情感性评估使得投资者高价买入、低价卖出,与“低买高卖”的投资原则南辕北辙。在金融投资领域,作为一个认知吝啬鬼所付出的代价是非常高昂的。在我们上一章讨论过的共同基金案例中,投资者由于高买低卖,导致他们在 1998~2001 年损失了数十亿美元的未得收益。情感性替代是导致这类昂贵的非理性行为发生的主要认知特征之一(其他的包括损失厌恶、过度自信以及对随机事件的过度解读)。
认知吝啬鬼对信息的生动性和鲜活性异常敏感。非理性行为和信念之所以一而再再而三地不断发生,主要原因在于人们无法抗拒那些活灵活现却不具代表性的数据的影响。
认知吝啬鬼喜欢加工那些与众不同的信息,这种倾向常常会让认知吝啬鬼误入歧途。某些特定形式的信息似乎格外与众不同,公彦山岸(Kimihiko Yamagishi)的研究向我们揭示了这类信息形式。在他的研究中,使用了两种不同的疾病描述方式,一种是每万人死亡 1286 名;第二种是 24.14% 的致死率。被试对这两种疾病的危险程度评估结果发现,被试将前一种疾病的危险等级评定得更高。当人们读到“1286 人死亡”时,脑海中浮现的画面肯定要比一个抽象的百分比数字更为生动鲜活,这种画面所引发的情感反应导致了不准确的判断。为了表明这个研究巨大的潜在应用价值,山岸将这篇文章命名为“在什么情况下 12.86% 的死亡率比 24.14% 的死亡率更加危险?——基于风险沟通的启示”[2]。
“货币错觉”是一种与出众效应相关的现象,得到了行为经济学家的广泛关注与研究。这种错觉发生于人们过度地被货币价值的名称所影响时。简单来说,就是认知吝啬鬼仅仅关注货币的表面价值,而不综合考虑影响实际购买力的其他因素,比如通货膨胀、时间和货币兑换汇率等。一项有趣的研究证实了货币错觉现象的存在。在这个研究中,当人们使用数额是本国货币数额若干倍的外币购买东西时,人们的花费会更少(例如,1 美元=4 马来西亚令吉);当使用数额较小的外币时,人们会花费更多(例如,1 美元=0.4 巴林第纳尔)。这种现象表明了货币表面价值带来的影响:当一件商品用数倍于本国货币的数值标价时,它看起来更加昂贵(因此人们会减少花费);当商品用较小的金额标注时,它看起来很便宜(会刺激人们花更多的钱)。上述现象说明,即使人们清晰地知道,在将货币数额转换成本国货币之前,数额本身并没有太大价值,但是,依然很难抑制住对货币表面价值做出反应。
“货币错觉”会给公共政策带来一些实实在在的影响。在 20062007 年间,美国上下因汽油价格一路飙升至历史最高的 3 美元 / 加仑而陷入了恐慌(民众呼吁采取政治行动干预)。然而,这个价格并非史无前例的高点。如果考虑到通货膨胀因素,20062007 年间的汽油价格远低于 1981 年。事实上,如果从居民购买力的角度来分析,2006 年的汽油价格比 1978~1981 年间的价格都要低。
关于货币错觉,请参见卡尼曼等人的研究(Kahneman,Knetsch,and Thaler,1986;Shafir,Diamond,and Tversky,1997)。外币研究来自斯利瓦斯塔瓦(Raghubir and Srivastava,2002)。Wertenbroch 等人的研究表明,表面价值效应有赖于预算限制,被试会将预算数额作为参照点(Wertenbroch,Soman and Chattopadhyay,2007)。他们的研究令人意识到,货币错觉并不像人们最初想象的那样简单,但基本观点并没有发生变化,即货币错觉是人类信息加工认知吝啬鬼倾向的一种表现形式。
启发式加工常常被用来指代类型一加工,这种加工速度快、自动发生、计算简单并且不会充分分析所有的可能性。因此,一种用来形容认知吝啬鬼的方式是:它大量地依赖启发式加工。
是要警惕不分场合、随时随地使用启发式加工的危险性,尤其是在现代社会,越来越多人为设计的陷阱故意诱使认知吝啬鬼中圈套。如果过度依赖启发式加工,将失去个人的自主性。成为认知吝啬鬼会使得我们对广告推销毫无抵抗力。面对人为操控的环境,如果我们放弃了思考,那么,我们的行为将被那些开发出触发自动化思维模式倾向刺激的人牵着鼻子走。我们的生活方向将被那些控制着符号化环境的人所引导。这使得启发式加工成为一把双刃剑。认知吝啬鬼可以为我们节省很多认知资源以备其他的任务使用,与此同时,当一个情境需要精确反应而不仅仅是一个快速、粗略的回应时,启发式加工未免太过概括笼统。
不宜使用启发式加工的情境也许并不算多,但这些情境往往是非常重要的。一种思维策略的重要性并不是简单地通过计算它的使用数量所决定的。我们不能因为启发式加工在 98% 的情况下都可以得到一个足够接近的结果,就放弃对其做审慎的分析,因为剩下的 2% 可能是会扭转我们人生的关键事件。这一观点来自《货币》(Money Magazine)杂志对一位共同基金领域的领导者拉夫·瓦格纳所做的访谈。瓦格纳在访谈中说:“我们在日常生活中所做的 99% 的事情,我将他们归于‘洗熨衣服类决策’,是指一些我们必须完成,并且没有机会比其他人完成得更好,且没有什么太大价值的事情。我们偶尔会做出一些给生活带来巨大改变的事情,比如决定结婚、生子,或者如果你是一个投资者,你买了一只价值翻了 20 倍的股票。也就是说,我们的生活是被为数不多的事情所掌控的。”
简而言之,我们在生活中做过数不清的决策,但真正对生活满意度产生影响的仅仅是决策总体中一个很小的集合而已。决定从事的职业领域,从事哪一份工作,与谁结婚,如何投资,定居在何处,如何置业,以及是否要孩子,当我们几十年后回看人生时,也许正是这几个简单的问题,决定了我们人生的全部。从数量上来说,我们的一生做过成千上万的决策,而这些支配我们一生的决定,大概只有二三十个。剩下的几千几万个决定,就是瓦格纳所说的“熨洗衣服类决策”。这二十几个决策,才是最有价值的。这些“非熨洗衣服类决策”通常是很特别的,这种与众不同的特征会致使启发式加工毫无用武之地,原因有以下两点。第一,这些数量很少、不经常发生的事情使得潜意识的内隐学习机制没有机会学习到用于启发式加工的信息。第二,如果这些事情是独一无二的,那么从进化角度来说,没有太多加工此类信息的经验,因此,不会有具有进化适应性的潜意识模块来帮助我们加工相关信息。基于上面两个原因,我们有理由怀疑启发式加工是否有足够的资质去处理这些问题。启发式加工可以提供的那些“快速但劣质”的答案,很可能被用于我们生命中这二三十个“非洗熨衣服类决策”,引导我们的生活误入歧途。
有些非常有用且有效的启发式加工,很容易变身捣蛋鬼,给我们惹来麻烦。原因就在于这些启发式加工太容易被触发了。几十年前,阿莫斯·特沃斯基和丹尼尔·卡尼曼发现了锚定与调整启发式。当我们必须要对一个不知道的数量做出估计时,锚定和调整启发式加工就开始发挥作用了。使用这种认知策略时,我们会先锚定一个最容易从大脑中提取出来的相关数字。然后,基于已知的特定信息调高或调低这个锚。
这个信息处理过程看起来还不错。可是,当这个可以被用于锚定的数字与我们即将要处理的问题毫无关系时,问题就出现了。在一个经典实验中,特沃斯基和卡尼曼向我们展示了锚定倾向在使用认知资源时是何等吝啬——它完全懒得对锚定数据与问题间的关联性进行评估。实验让被试看着一个数字转盘,当指示器停留在任意一个数字上时(通过故意操作使这个数字是 65),询问被试:非洲国家在联合国所占的百分比是高于还是低于这个数字。在回答完是高还是低之后,要去被试尽量准确地估计非洲国家在联合国所占的百分比。另一组的被试所经历的实验程序与之相似,唯一不同是指示器停留的数字是 10。他们也被要求回答是高还是低的问题,并尽量对真正的百分比做出最为准确的估计。由于在第一个问题中使用的是随机数字转盘,按道理说,第一个问题中出现的数字与被试回答第二个问题应该是毫无关联的两件事情。但是,研究结果发现,出现在转盘上的数字严重影响了被试对第二个问题的回答。第一组被试(45%)对第二个问题的估值远远地高于第二组(25%)。
事实已经很清楚了,两组被试都在使用锚定和调整启发式加工——高锚定组调低了锚定值,低锚定组调高了锚定值——但两组的调整都太过“黏性”。他们两组的调整力度都不够,因为他们并没有充分考虑到这个锚定值其实是以随机的方式选择出来的。锚定和调整启发式揭示了锚定过程中对认知资源的吝啬,而无暇顾及锚定值与当前问题之间的关联性。
哪怕在锚定值非随机选取的情况下,认知吝啬鬼对锚定值的依赖性也太强了。因为,相对于从记忆中回忆、提取与当前问题相关的信息,使用锚定值是一个更为简单易行的捷径。研究发现,即使是经验丰富的房产中介在对地产的真实价值进行评估时,也会受到挂牌价格的影响。在汽车销售过程中,锚定与调整也发挥着关键的作用。销售人员希望引导顾客将预期价格锚定在 MSRP 上(官方指导零售价),然后以这个价格为基础开始讨价还价。因为他们知道,锚定调整过程是“黏性”的,在很大程度上受到 MSRP 的影响,最终的调整结果并不会偏离 MSRP 太远。消费者类杂志和网站给出的建议与上述做法完全相反,他们建议消费者获取经销商的进货价,并以此为锚定点往上还价。对于二手车来说,情况也很类似。销售人员希望从广告价格为锚定点开始议价,而消费者导刊则建议消费者参考蓝皮书 中的价格议价。销售人员和消费者导刊的做法都是对的。他们都知道协商的起点对于最终的协商结果有着举足轻重的作用。他们都知道,控制了锚定点的那个人,也意味着控制了整场谈判。
依赖于锚定的启发式加工在很多重要的情境中都会产生影响,比如司法判决。在人身伤害案件中,原告所要求的赔偿金额在一定程度上会影响法官对案件的判决以及原告最终获得的赔偿数。另外,统计数据表明,检方提起公诉的罪名也会影响到法官的保释决定。看来,大法官们也是认知吝啬鬼,他们屈服于简单的启发式加工,以减轻自己的认知负担。
锚
蓝皮书(bluebook),是美国查询旧车价格的手册。——
认知吝啬鬼剥夺个人自主性的另一种方式是过度使用“默认启发式”这种信息加工方式。默认启发式的操作遵循一个非常简单的原则:如果你获得了一个默认选项,持有到底!这种启发式是基于 20 年前决策领域中关于现状偏见的研究提出的。20 年前的研究还向我们展示了由于过度使用默认启发式加工,致使无法最大化实现目标。对于那些过度使用默认启发式加工的人们来说,他们的生活由那些有权设置“默认值”的人所掌控,使用默认启发式使得他们失去了个人自主性。
默认启发式加工会在经济和公共政策选择过程中发挥作用。一个研究小组报告了太平洋煤气电力公司(Pacific Gas and Electric)在 19 世纪 80 年代做的一项市场调查。由于地理因素的差异(城市-乡村,等等),电力公司所能提供服务的稳定性在不同地区存在着差异,某些地区的客户不得不忍受更多的电力中断状况。在服务不稳定地区,客户接受调查询问是否愿意付更多的钱以获得更稳定的服务,如果愿意的话,他们是否愿意接受特定比例的涨幅?而在服务稳定的地区,客户被调查的问题是,是否接受更不稳定的服务,以换来一定比例的费用折扣?(降价比例与涨价比例相同)虽然两个地区的人均收入并无显著差异,但是,没有一个地区的人愿意接受改变。绝大多数人愿意保持现状。实际上,两个地区的电力服务质量差异很大。服务不稳定地区每年断电 15 次,每次持续 4 小时;而稳定地区每年仅断电 3 次,每次持续两小时。但是,极少有客户愿意交换!
此处需要格外强调的是,只有不假思索地过度使用默认启发式才能被称为非理性。很多理论家都提出,在有些情境中使用默认选项是决策者的明智之选
马望·希纳克(Marwan Sinaceure)研究团队的工作为我们展示了认知吝啬鬼偏爱加工简单信息刺激的癖好是多么容易被利用。他们给被试呈现了以下假设情境:如果你的晚餐是从超市买的牛肉套餐,饭后你在新闻上得知,食用这种牛肉套餐有可能会导致人感染牛脑海绵状病。接下来,让被试回答在 7 点量表上回答这两个问题:①假设你身处上面的情境,你将在多大程度上减少购买这类牛肉套餐?②假设你身处上面的情境,你将在多大程度上改变你的饮食习惯,减少红肉并增加其他食物的摄入?毫无疑问,被试在听过上述情境后,都决定要减少牛肉的摄入。可是,另一组被试在听过相同问题之后,愿意做出的改变程度更大。两个实验过程完全相同,唯一不同的是改变了情境描述中的一个词,即把“牛脑海绵状病”改为“疯牛病”。这种情况很好理解,我们的老朋友“生动性”又出来捣乱了。相对于“牛脑海绵状病”来说,“疯牛病”更容易引发我们对一种令人毛骨悚然的动物病毒的想象。当认知吝啬鬼当班时,措辞上的微小改变都会引起情感效价和生动性的改变,进而影响到人的行为和想法。我敢打包票,如果当前的社会保障金改名叫“老年人福利金”,那么,社会保障金的收入肯定会大幅下降。
简而言之,极端的认知吝啬鬼全然没有“独立之思想”,决定他们的心智如何加工信息的是眼下最生动的刺激、最唾手可得的信息或是最与众不同的线索。认知吝啬鬼会被那些掌握了如何标签化、如何设定锚定值、如何控制信息生动性的人占尽便宜。在下一章中,我们将讨论框架效应,届时你将会看到关于类型一加工威胁个人自主性的更具戏剧性的案例。
作家路易斯·梅南在他的著作中讨论了投票决策情境中使用启发式的情况(Louis Menand,2004),把启发式放在一个具化的情境中进行讨论。比如我举的这个例子:“在信息匮乏或是面临不确定信息时,走捷径总比无路可走好。但是,走捷径并不是快速地进行缜密计算,而是直接跳过所有的计算过程。比如,在购买立体声音响时,我的直觉是外表最酷的那一款最值得购买。但是,这个判断完全没有涉及音响的音质、性能。如果我选择了预算范围内音质最好的那一款,这才是最符合我切身利益的选择。”
这个例子常常为理性思维的支持者招致讽刺挖苦。此处我所谓的“深思熟虑”并不是说要把数千个基金项目进行一一对比。我的意思是说,在做出决策前,应该将某一领域中的不同种类进行大致比较,比如:借贷基金与非借贷基金;指数基金与管理型基金;债券、股票和现金分配;外币总量;房地产和期货数量等。通过指出某个理性决策所涉及的运算量极其庞大(根据个人需求,将 6000 支基金进行两两配对比较)的方式来诋毁理性思维,这是一种很常见的攻击理性思维的策略。不过,理性思维策略的支持者却并不这么想。将数千种基金进行两两比较的可行性差,并不意味着我们应该在个人金融这么重要的决策领域退而求其次,依赖于快速、劣质的启发式思维来解决问题。在令人筋疲力尽的繁杂比较和快速却劣质的启发法之间,还存有中间地带,在这个中间地带我们需要考虑很多影响决策的其他关键因素,比如对风险的容忍度、年龄、当前资产和负债、退休保证金等。
人们在思考税务相关问题时,思路常常是非常不合逻辑的。接下来,我将着重介绍该研究中涉及的诸多非逻辑性思维中的一种,因为这种非逻辑性思维为我们完美展示了一个专为认知吝啬鬼设下的陷阱。
假设你将为一个虚拟国家制定税收规则。在这个虚拟国家,收入 35000 美元的无子女家庭需缴税 4000 美元,而收入 100000 美元的无子女家庭需缴税 26000 美元。假设该国的政策规定,针对收入为 35000 美元的无子女家庭,若生育一个孩子,则可以享受 500 美元的税收减免,即该家庭需缴纳的税款由 4000 美元降为 3500 美元。那么,针对收入为 100000 美元的家庭,是否应该执行相同的生育税收优惠政策?也就是说由 26000 美元减少为 25500 美元。还是由于他们收入更高,因而应享受更大力度的优惠额度?
诺贝尔经济学奖获得者托马斯·谢林注意到,人们对后一种做法(高收入家庭享有更大力度的税收减免)存有很多争议。“高收入家庭在儿童身上的支出更多,也就是说抚养孩子的成本更高”(1984)。简而言之,高收入家庭在抚养孩子时投入更多,所以他们应该享受更高的减免额度。也许你认为这种说法站不住脚,实际上,多数人都不认同这种观点,他们会毫不犹豫地拒绝这个论点,认为高收入家庭养育孩子的税收减免额度至少应该与低收入家庭相同。如果非要区别对待的话,低收入家庭应该享受更高额度的税收优惠。
经济学家谢林以这个问题为介入点,教我们厘清情境背后的真实逻辑。其实,我们也许并没有真正弄懂这件事情,尤其是我们并没有想到换一个框架去理解这个情境。谢林指出,我们以无子女家庭为初始状态来为事件设立框架的做法太过武断。在设定这个假设的税收系统时,我们也可以考虑选择不同的基线水平,比如,以最典型的“四口之家”(两个成人和两个子女)作为初始状态。与前面一样,子女数量会影响税率,以四口之家为出发点,让我们来计算一下无子女家庭和独生子女家庭的税率。
试想在这个虚拟国家,家庭收入为 35000 美元并且有两个子女的家庭需要缴税 3000 美元,家庭收入为 100000 美元并且有两个子女的家庭需要缴税 25000 美元。按照这种情况来计算的话,无子女家庭的税率应该是多少?我们应该提高税率,因为无子女家庭有能力负担更高的税额。这里不谈生育可减免赋税,而是将这种税率调整计划称为“不生育的惩罚”。关于谢林试图教给我们的框架和税收政策(麦卡弗里和巴伦通过实证的方法对其进行研究)——我先透露一点小线索。实际上,针对每一种特定家庭(子女、房屋所有权、自由创业以及其他在免税代码中的项目)的“税收减免”,都是对那些不符合条件家庭的“惩罚”(因为政府开支的总额是确定的,政府即使去借款也要支付各类公共开支)。
好,下面我们假设有一个年收入为 100000 美元并育有一个子女的家庭应缴税款为 26000 美元;相同收入但没有子女的家庭应缴税款为 27000 美元。也就是说,在这种情况下,少生育 1 个子女所缴纳的罚款是 1000 美元。问题在于,收入为 35000 美元的低收入无子女家庭是否也应该与高收入家庭缴纳相同的罚款?当高收入家庭的赋税由 25000 美元增加至 27000 美元时,低收入家庭的赋税是否也应该由 3000 美元增加至 5000 美元?
多数人会本能地感觉到这样做有失偏颇。他们会认为,对于低收入家庭来说,2000 美元的惩罚实在太过严厉了,针对低收入无子女家庭的罚款应低于高收入家庭。但是,人们对高、低收入家庭不生育税收罚款与对高、低收入家庭生育子女税收减免的态度完全不一致。人们希望高、低收入家庭享受相同的生育红利,却不希望他们接受相同的不生育惩罚。这是一种不合逻辑的想法,因为红利和惩罚实际上都是一回事儿——只不过名称和人们关注点的引导方向有所不同罢了。这就是本章想要说明的观点,认知吝啬鬼允许他人来决定自己的关注点。认知吝啬鬼俯首甘让环境框架来决定他们的思考方式,他们接受问题的各种表述方式,并不假思索地开始对其进行加工,却从未意识到不同的表述方式可能会让人得出不同的结论。
在认知科学领域,人们往往会对本质相同但表面看起来不同的问题给出不同的答案,这种现象称为“框架效应”。框架效应违背理性的选择。在决策理论的技术性文献中,对这种违背的指责被称作“描述性不变原则”,即人们的选择不应该因为问题的表述方式发生变化而改变。在框架实验中,当给被试呈现同一问题的不同表述方式版本时,他们中的绝大多数人都认为问题的不同表述方式不应该影响他们的最终选择。如果被试的选择判断会被那些他们自认为不相关的问题特征改变,那么可以说,这样的被试还没有形成稳定的、有序的偏好。如果一个人的偏好因为无关紧要的问题措辞变化而发生逆转的话,那么这个人则不具备最大化预期效用的能力。因此,是否违反描述性不变原则在判断一个人是否理性时有着重要意义。
税收政策是一个很好的用于检验框架效应的议题。因为,虽然在这个议题中更换框架是一件很容易的事,但是人们却从未想到要这么做。对于绝大多数人来说,“降低赋税”是一件无可争议的好事情,任何有关减税的政策通常都会得到支持。但是,甚至连经济学家都很少注意到这样一个问题:对一部分群体的减税,对于不符合减税条件的其他人来说,相当于是变相惩罚。诚如两位经济学家对这种情况的描述:“由于补助金的来源是增加赋税,那么,补助金政策可谓是对未能领取人的变相惩罚……减税通常会很受百姓的欢迎,因为它们被冠以“减少赋税”的美名,但需要注意的是,这些减税政策是不可能孤立存在的。”通过上面的引文希望大家注意到,无论你认为政府应该提供怎样的公共服务(国防、医疗保障、公路、养老保险等),可以肯定的是,政府早晚需要筹集到一定数额的钱去为这些公共服务买单。因此,对特定群体的减税政策,必定意味着那些不符合减税条件的人将缴纳更多的税款。
让我们再来看看购房贷款利息的减税政策。表面上看来,这似乎是一件好事,但如果换一种说法来描述,称为“租房者的罚金”,那么这个政策听起来就没有那么友好了。上面两种说法所表述的含义其实是相同的。不难发现,“房屋抵押贷款应该享受税收优惠吗?”这种措辞方式会影响人们对这个问题的回答。“为了减少买房者缴纳的赋税,应该让租房者缴纳更多的税吗?”这种提问方式又将问题的答案导向了相反的方向。与之相类似,“对资本收益实行低税率”这种说法听起来比“对工薪族收取罚金”更容易让人接受。
根据特沃斯基和卡尼曼的观点,描述不变性指的是“对结果没有实质性影响的形式变化,不应该对个体的最终选择产生影响”。
那些有权选择“框架”的人在一定程度上控制了我们的决定。
框架效应(以及其他认知吝啬鬼思维倾向)是对个人自主性的巨大威胁。该实验以及麦卡弗里和巴伦的其他研究结论提示我们,那些提出问题的人,也就是设置框架的人,才是实际控制你的政治经济行为的一方。
人们的选择偏好多受到外部因素的影响(那些有权力塑造环境,或是决定问题措辞方式的人),而非基于个体内部的心理特征及偏好,这个一直潜藏在我们身边的问题着实让人不安。由于绝大多数情境都可以基于多个框架,这意味着与其说人们有着稳定的个体偏好,不如说是环境的引导方式不同,引导过程决定了所谓的个体偏好!
医学教授彼得·尤贝尔(Peter Ubel)研究了分配稀缺医疗资源时由于过度使用平等启发式加工(equality heuristic)而产生的非理性框架效应。研究者让被试将 100 个活体肾脏分配给 200 个正在等待器官移植的患病儿童。如果将 200 名患儿平均分成两组,每组 100 人,那么,绝大多数被试会将 100 个活体肾脏平均分配到两组中,每组 50 个。平等启发式用于此处看似是合乎情理的。虽然研究中并没有详细说明每组儿童的特征,但有理由认为两组儿童来自于不同区域、不同种族、不同医院、不同性别等,在人口统计学特征属性上存在差异。在尤贝尔与乔治·勒文施泰因(George Loewenstein)合作进行的一项研究中,平等启发式加工似乎带来了更大的麻烦。研究发现,在两组患儿的诊断结果不同的情况下,被试依然会使用平等启发式加工。研究中 A 组患儿进行器官移植手术后的生存率为 80%,而 B 组患儿进行器官移植手术后的生存率仅为 20%。在尤贝尔的研究中,超过 1/4 的被试仍然将活体肾脏平均分配到两组,A 组 50 个,B 组 50 个。这个决策将导致 30 个无辜患儿的死亡(如将 100 个肾脏全部分配给 A 组,则将有 80 名患儿治愈生还;如果使用平等启发式加工,则只能救活 50 名患儿)。
在我们开始谴责平等启发式之前,或许应该先听听实验中的被试是怎么想的,没准他们这么做有自己的理由呢?也许除了获救患儿数字之外,他们还受到其他准则的约束呢?事实上,许多被试在解释自己为何进行平均分配时,都有自己的道理。为平等启发式加工辩护的常见理由有“哪怕机会渺小,也应得到希望”“无论生存概率是多少,只要患者有需要,就应该得到器官移植的机会”。这些听起来有理有据的辩词不禁让我们疑惑,这些辩词究竟代表了被试的理性思考,还是仅仅是为他们使用平等启发式加工寻求一个合理化解释?尤贝尔为此设计了一个实验进行进一步的探索,研究结论支持了后者。研究者将等待器官移植的患者按照病情的严重程度从 1 到 200 进行排序(也就是说列出患者个体的名单,而不是将其分成两组),被试很乐意将器官分给排名前 100 位的患者……但是,如果将排名前 100 的患者称为 1 组,而将排名后 100 的患者称之为 2 组,很少有人愿意彻底“放弃”2 组。从该研究中我们发现,仅仅是“组”这个字即可触发某些被试的平等启发式加工。这个研究结果也暗示被试之前所说的“哪怕机会渺小,也应得到希望”实际上不过是将自己行为合理化的一个幌子罢了,因为当那些“机会渺小”的患者没有被分为一组时,被试压根没有想到“渺小与希望”的伟大道理。总之,启发式的问题在于,它让我们的行为、观点和态度屈从于他人设定的框架,个体的立场会因框架的变化而发生剧变。
关于框架效应的发生机制,丹尼尔·卡尼曼认为“框架的基本原理是对给定表达方式的被动接受”。呈现给被试的框架好比是一个对焦点,被试在之后进行的思考或认知加工都是基于这个对焦点展开的,如果选择其他框架进行重新对焦,会花费更多的心力。
人们需要学会从多个视角思考同一问题,学会习惯性地去打破框架,并由自己来重设框架。从实验后情况说明的结果可见,一旦人们觉察到不同框架下的答案出现了不一致时,就会采取措施试图解决不一致带来的失衡。由此可见,人们似乎意识到了一致性的价值,然而,他们的行为却反其道而行之,习惯性地不断制造视角转移,凸显了思维过程中的不一致性。实验中的被试由于未能做到一致性,致使自己屈从于框架效应,即违反了描述性不变原则,是人类选择模式中的一种常见的非理性行为。
在探索框架效应的早期研究中,同一个问题不同描述版本的等价性非常明显,研究者只需给出一点提示,被试就可以立即意识到这种等价性。当时最引人瞩目的一个研究设计来自于特沃斯基和卡尼曼的早期工作。请看下面的决策 1,阅读后请做出判断。
决策 1:假设,美国正在准备应对一场不同寻常的传染性疾病,疫情导致的死亡人数预计达 600 人。科学家提出了两种会带来不同后果的应对方案。如果采取方案 A,那么 200 人将获救;如果采取方案 B,有 1/3 的概率 600 人全部获救,有 2/3 的概率 600 人无一获救。你更倾向于选择哪一个方案?A 还是 B?
大多数人面临这个选择时都会倾向于 A 方案——选择那个确定可以拯救 200 人生命的方案。这个选择没有任何不妥。但是,当将这个研究与另一个相关研究联系起来看的时候,奇怪的事情就发生了。第二个研究中要求被试(有时是同一组被试,有时是不同组被试,两种条件下结果相似)再回答一个问题。请阅读决策 2,阅读完后你的第一反应是什么?
决策 2:假设,美国正在准备应对一场不同寻常的传染性疾病,疫情导致的死亡人数预计达 600 人。科学家提出了两种会带来不同后果的应对方案。如果采取方案 C,400 人会因疾病而丧生;如果采取方案 D,有 1/3 的概率没有人因此而丧生,有 2/3 的概率所有人会丧生。你倾向于选择哪一个方案?方案 C 还是方案 D?
当给被试呈现决策 2 中的阅读材料之后,多数人会选择方案 D。由此可见,针对上述两个问题的解决方案最受欢迎的是方案 A 和方案 D。然而,我们不难看出,决策 1 和决策 2 在本质上实际是相同的,它们是针对同一个问题的两种不同描述方式而已。方案 A 和方案 C 是等价的。方案 C 中 400 人死亡也即意味着 200 人获救——与方案 A 完全相同。同样的,方案 D 中 2/3 概率所有人会死亡与方案 B 中 2/3 的概率 600 人无一获救是同样的意思。如果你在决策 1 中倾向于选择方案 A,那么你在决策 2 中应该选择与之等价的方案 C。但是,很多被试因为问题的提问方式不同而做出了不同的决策。
这个案例表明,被试在损失情境的收益与风险权衡中,是厌恶风险的。在这场生命赌局中,被试认为决策 1 中“确定可以拯救 200 人”这个方案极具吸引力。与之相对应,在决策 2 中,“确定会有 400 人死亡”这个方案看起来就不那么有魅力了。毫无疑问,在决策 2 中备受冷落的“确定失去 400 人”与决策方案 1 中“确定拯救 200 人”两个结果是完全相同的。上述是一个有显著等价性的示例。当同时呈现给被试两种决策方案时,被试认可两个问题的等价性,并认为对问题的不同措辞方式不应左右最终的决策结果。正如我上面所讨论的,由于人们无法严格遵循描述性不变原则,致使人们无法做到效用最大化(utility maximizer),即无法做到认知科学家所定义的“理性”。
卡尼曼和特沃斯基所提出的前景理论解释了框架效应发生的原因,该理论也为卡尼曼赢得了 2002 年的诺贝尔经济学奖。在上面提到的传染性疾病案例中,被试基于当前所处的既无损失也无收益的零点对后果进行编码,这是前景理论的重要假设之一。另一个关键假设是,损失比收益的效用函数更为陡峭(朝负方向)[2],这就解释了人们为何会在预期盈利的赌局中通常做出风险厌恶的行为。假如你我玩抛硬币游戏,人头朝上你给我 500 美元,字面朝上我给你 525 美元,你愿意与我赌一局吗?由于潜在的损失,多数人都会拒绝这个有利于自己的赌局,虽然这场赌局的收益会更多,但在心理上损失被放大了。
让我们来看看尼古拉斯·艾普利(Nicholas Epley)及其同事所做的一系列研究。在他们的研究中,被试在到达实验室时会收到一张 50 美元的支票。在向被试解释为何会收到这张支票时,一组被试得到的答案是“额外津贴”,而另一组被试得到的答案是“学费退款”。艾普利团队预测,“额外津贴”会在心理上被编码为从当前状态发生的正向改变,而“学费退款”会被编码为过去财富状态的改变。研究者认为,相对于学费减免框架来说,额外津贴框架会导致被试做出更多的即时消费行为。事实正如预料一样,在一项实验中,研究助手一周后再次联系被试询问这笔钱的去向时,“额外津贴”组的被试报告这笔钱已经花光,甚至超支。在另一项实验中,拿到支票后的被试可以以特惠价在大学书店(也售卖零食)内进行消费,与上一个实验结果相类似,“额外津贴”组在店内消费金额更高。
身为芝加哥大学商学院教授的艾普利,在 2008 年 1 月 31 日的《纽约时报》上发表了一篇与这些研究相关的时事专栏文章。2007~2008 年的次贷危机之后,美国总统和国会议员想尽各种办法去刺激摇摇欲坠的经济。为了刺激消费,政客一度想到实施退税政策(退税政策曾被用于 2001 年,当时也是作为刺激经济的一种手段)。艾普利在他的专栏文章中指出,如果政府的目标是希望民众增加消费,那么这笔钱应该被称之为“税收红利”,而非“退税款”。一个“退”字,意味着曾经属于你的钱回来了,你的财务停留在“维持现状”的状态。而前景理论预测你在“维持现状”时,花钱的概率较小。但是,“税收红利”的说法意味着这笔钱是“额外增加的”,即在当前状态的基础上增加了。相比之下,人们更乐意花掉这部分“额外增加的钱”。通过对 2001 年减税政策的研究发现,人们仅仅消费了退税金额的 28%,如此低的消费比率,部分原因应归咎为“退”字的使用。
艾普利的文章表明,政策分析师应该熟识框架效应及其可能带来的后果。与政客相比,广告商们充分意识到了框架的重要性。我敢肯定某商品的广告会标明“95% 脱脂”,而不会说“含有 5% 的脂肪”。框架制定者对其效用心知肚明。问题就在于你,作为框架的消费者,是否能够理解框架的重要性,并且让自己成为一个更加独立自主的决策者。
经济学家理查德·塞勒(Richard Thaler)讲述了若干年前信用卡行业就现金和刷卡支付之间的手续费差额该如何称呼展开的激烈讨论。经过讨论,最终决定使用“现金消费享有打折”,而不是“刷卡收取额外费用”的说法。他们隐隐地意识到,任何额外收费都会使消费者在心理上编码为损失,进而带来负面效应,而“打折”则会被编码为收益。由于收益的效用函数比损失的效用函数更为平缓,从心理上放弃折扣比接受额外收费更容易一些。当然,两者从经济效益的角度来看是完全一样的。信用卡行业让人们将额外收费视为常态,进而使得信用卡收费更容易被接受。
框架能够轻易地改变人们的选择,这一事实有着巨大的社会应用价值。詹姆斯·弗里德里希(James Friedrich)及其同事进行了一项人们对大学录取过程中采取平权措施 态度的研究。研究者就在多所高校中取消平权措施并采取种族中立录取政策的后果,向两组被试呈现了不同的统计描述方式。实验中所使用的这些统计数字都是真实存在并准确无误的。一组被试是“比率组”,他们接收到的信息是:如采取种族中立的录取政策,黑人学生的录取率将由 42% 下降至 13%,而白人学生的录取率将由 25% 上升至 27%。另外一组被试是“频次组”,他们收到的信息是:如果采取种族中立的录取政策,黑人学生的录取数量会减少 725 人,而白人学生的录取人数会增加 725 人。两组被试所接收到的统计数字是等价的,只是使用了不同的表述方式来描述同一件事情的同一个结果(设置不同的框架)。“比率组”中两个比率之间的差异(黑人学生 29% 的降幅,白人学生 2% 的增幅)则说明了高校申请者中白种人远远多于黑种人的事实。
研究结果发现,“比率组”对平权措施的支持率远远高于“频次组”。在“比率组”中,种族中性政策给黑人学生带来的损害(录取率由 42% 降低至 13%)似乎远远高于白人学生的收益(录取率由 25% 增加至 27%)。而在“频次组”中,强调“一一对应”这一事实,在平权措施的影响下,每多录取一个黑人学生,即意味着有一个白人学生落榜。两个实验条件实际上是从不同的角度来看待相同的事实,选择不同的视角势必会影响对政策的选择。
许多政见上的分歧实际上就是不同框架之间的抗衡,其实所有政党都心知肚明,能够设置框架的一方,可谓不战而胜。许多改革者的战术就是向公众说明传统的观点通常是所有人都接受的默认框架。认知心理学家乔治·莱考夫(George Lakoff)对隐含在政治术语中的框架进行了许多颇具影响力的分析。他注意到乔治·布什第一任期内的白宫行政团队一直在坚持使用“税收减免”一词。莱考夫指出,一旦这个术语被大众所接受,围绕着征税制度的争论就可以画上句号了。我们先来看看“减免”这个词。莱考夫注意到,“既然有‘减免’的需要,则必然存在着重负,减免者为大家移除了这个负担,因此成为大英雄。如果有人试图阻止这个英雄行侠仗义,那么这些人必然就成为带来苦难的恶霸。当减免被冠以‘税收’二字之前时,结果的隐喻是:征收税款是负担,消除这个负担的人是英雄,而任何试图阻挠英雄的人都是坏人!”大家众所周知的另一个例子是遗产税。民主党希望人们称之为“不动产税”(多数人不认为自己拥有不动产),而共和党则希望人们称之为“死亡税”(意味着所有人在去世时都会被课税)。
平权措施即依据宪法的平等保障原则保护黑色人种公民权利的行为。——译者注
无框架效应的政治,换句话说,就是在决定所有事务时都完全基于真正的是非曲直,在近期来看似乎只是一个美好的愿望。但是,从个人角度来看,不受框架效应制约,个人充分实现自主性的决策却是我们自己可以掌控的。
框架效应是理性障碍的主要来源之一,因为人们被动地对给定框架做出反应的倾向性是独立于智力水平的。这里,有必要简单介绍一下此类研究的方法论。框架实验以及大多数关于理性思维的实验,可以是被试间研究设计,也可以是被试内研究设计。比如我们前面讨论过的流行性疾病框架问题,就是一个被试间研究设计,一组被试看到的文字资料是收益版本(200 人获救),另外一组被试看到的则是损失版本(400 人死亡)。研究将被试随机分配到两个情境中以确保两组被试的同质化,以及结果具有可比性。而被试内研究设计,则是所有被试都需要对同一个问题的两个情境作出自己的反应。通常这两个版本的情境是间隔一段时间呈现给被试的,因此两个情境之间的关系并非显而易见。在被试内实验设计中,需要进行平衡处理,即一半被试先看到收益版本,而另一半被试先看到的是损失版本。
毫无疑问,上述两种研究设计比较来看,被试间实验中的框架效应更为明显,因为在这种设计中,没有任何线索表明一致性正面临威胁。有趣的是,在这种研究设计中,框架效应的大小与智力水平毫无关系。当没有线索提示被试应该注意一致性问题时,实验中的高智商被试与低智商被试一样都受到了无关情境框架的影响。而被试内实验设计的结果有所不同。被试内实验中的框架效应虽然不及被试间实验那么显著,但依然存在。另外,在被试内实验中,框架效应的大小与智力水平之间存在着显著性相关,高智商个体表现出的框架效应较小。
简而言之,当实验中有线索提示一致性受到威胁时(同时呈现同一问题的两个框架版本),会在一定程度上减少高智商被试受到非理性框架效应的影响;但是,当没有线索提示时,他们就难逃框架的影响了。在这里我们稍作停顿,请随我想一想上述关于智力水平的被试间 / 被试内研究带来的启示。通俗点说,认知科学家得到了一个令人震惊的结论,这个结论的重要应用价值值得我们单独列出:
聪明人只有在被告知要怎么做的情况下,才会表现优异。
上面这句话非常适用于理性思维与行为领域。如果你告诉一位聪明人何为理性,也就是说,告知他们理性思维所需遵循的特定规则(如避免框架效应、不要对已有知识过分自信、避免非可迁性等),然后再让他们完成一个涉及该规则的理性任务,高智商人群比低智商人群在该任务的表现上更加优秀。但是,如果在布置任务的时候,没有事先提醒被试该任务将涉及的理性思维规则,也就是说,需要他们自己去发现问题中隐藏的理性思维陷阱,在这种情况下,高智商人群与低智商人群的表现无异。
在被试内实验中,智力水平与框架效应规避之间确实存有具有统计学意义的显著性相关,但是这种相关性较小,给理性障碍留下了大量施展拳脚的空间。这就好比上一章中讨论的认知吝啬鬼特征——属性替换、生动性效应、完全析取推理失败,这些特征无一和智力水平之间存在高相关。本章与上一章讨论过的这些认知特征对于理性思维和行为至关重要,但是,任何智力测验都没有对其进行测量。如果现有的智力测验中纳入了对理性思维的测量,那么人们的智力水平会出现不同程度的提高或下降。为何会这样呢?我们前面列出的实证研究证据表明——智力水平与理性加工特征之间的相关性极小。认知吝啬鬼的另一个标志性特征也具有相似的智力无关性,即下一章将要讨论的——“我方立场信息加工”(myside processing)。
我方立场偏差”,也就是说,人们倾向于仅仅基于自我的视角对情境进行评价。在评估证据、道德评判、评价他人时,人们常常会受到偏向自己的立场偏差影响。比如,在上述案例中,美国被试认为,相对于在德国马路上行驶的危险美国汽车,在美国行驶的危险德国汽车更应该受到禁令的制裁。
人们不仅会心怀偏见地去评价已有的论据,有时还会带着偏见去制造论据。我和同事玛姬·托普莱克等人在一项研究中让被试为一些公共政策同时寻求支持和反对的论据。结果发现,如果研究者指示被试要消除偏见,尽量平衡正反两方,或者被试对某个论题事先没有太过强烈的主观立场(例如,是否应该允许个人出售自己的内脏器官),他们提供的正反两方论据在质和量上都基本均衡。但是,当被试(大学生)对某问题有着明确、强烈的个人主张时(例如,大学学费应该上涨,高等教育成本全部由个人承担),即使研究者在实验过程中告诉被试要尽量避免已有立场偏见的影响,被试提供的己方论据仍然远远多于反方论据。
我方立场信息加工不仅会损害我们客观评价证据的能力,对我们产生证据的能力也有负面影响。在保罗·克莱辛斯基和他的同事合作完成的一系列研究中,研究者给被试呈现了一些有设计缺陷的假设性实验,实验得出的结论与被试之前的立场观点有可能一致,也有可能不一致。被试群体年龄跨度较大,涵盖了各年龄段的成年人。随后,研究者让被试评价实验设计中存在的缺陷(通常都是非常严重且明显的缺陷)。此时,强大的我方立场偏差效应出现了——当实验结论与被试之前的观点立场不一致时,被试能够发现更多的实验缺陷,而当实验结论与被试自己的观点一致时,这些实验设计缺陷仿佛忽然隐身了一般,被试看不到了。
从他人立场考虑问题是一件很耗费认知资源的事情,这一点我们早已熟知。因此,人们不愿意从他人立场出发去考虑问题也情有可原,我方立场信息加工是认知吝啬鬼的基本属性。然而,采用我方立场信息加工方式所需付出的代价,有时会超出我们的预期。我们没有意识到,这竟是很多非理性想法和行为的根源所在。另外,拥有高智商并不能让个体对我方立场信息加工方式成功免疫,详情请看下文分解。
单一事件的概率判断是无法评估的。比如,你说你的外甥今年有 95% 的可能性会结婚,我们怎么能判断这个概率估计是否正确呢?但是,概率判断的集合却是可以被评估的,因为该集合必须遵循特定的统计标准。
举例来说,气象预报员说明天的降水概率是 90%,而实际上明天却是一个艳阳天。虽然天气预报不准确,但我们也不能说预报员的判断错误。气象预报员也许已经充分分析了所能获取的所有数据,并对数据进行了正确的处理。根据现有的气象数据来看,降水概率很大,只不过今天刚好没有下而已。但是,如果天气预报员预测降水概率 90% 的所有日子里,其中有一半都是晴天,那么我们就有理由质疑天气预报的准确性了。在天气预报员预报降水概率是 90% 的所有日子中,你会期望有 90% 的时间会下雨。虽然气象预报员不能确定 10% 的晴天会发生在哪一天(不然的话就可以说是 100% 的降水概率了),但是,如果天气预报员有 50 天预测“降水概率 90%”,那么 50 天中至少应该有 45 天是下雨的。
在很多不同种类的知识标尺实验中,我们都可以看到过分自信现象的身影。这些实验发现,人们的主观概率估计始终都高于实际的答题正确率。比如说,当被试认为自己有 100% 的把握可以正确回答问题时,实际正确率往往只有 88%;当被试说他们有 90% 的把握能够回答正确时,实际正确率大概是 75%。在判断正误题中,通常来说,当被试对自己的答案有七八成的把握时,他们的实际表现和瞎猜差不多,正确率只有 50% 左右。
对于知识标尺的过度自信效应,部分源自于我们对首先跳出脑海的念头的执着。我们会对这个念头是哪儿来的稍作思考,之后,本着节省认知资源的原则,我们会快速得出答案:这个想法是“我自己思考后得出的”。被试会将这个首先跳出的答案作为焦点假设(类似于我方立场偏差),并将注意力着重放在这个焦点假设上,进而忽视了其他的非焦点答案。简而言之,“导致过度自信的原因之一,是未能找到自己错误的理由”(Baron,2000)。对最终答案的信心,来自于排除其他答案的证据,但是被试并没有意识到提取证据的过程是存在偏差的——只有首选的答案才有机会获得认知资源的垂青,为其寻找支持的证据,那些非焦点答案只有少得可怜的认知资源可供使用。这种做法的结果就是被试对于他们的答案信心爆棚。
过度自信现象不仅仅只出现在实验室中,在现实生活中也非常常见。比如,人们会高估自己对体育比赛结果、行为后果、经济走势等未来事件的预测准确性。过度自信在称为“计划谬误”的现象中表现得淋漓尽致。所谓计划谬误,是指人们常常会低估自己完成某项任务(比如完成一篇优秀论文、完成当年的税务表格、完成一项基建项目等)所需的时间。诺贝尔获奖者丹尼尔·卡尼曼曾经讲述过一个有趣的故事,告诉我们计划谬误有多么棘手,甚至连决策研究领域的专家也难免中招。数年前,卡尼曼加入了一个由决策研究专家组成的委员会,该委员会致力于开发一门适用于高中生的决策与判断课程。这个委员会成员每周定期开会以商讨课程内容并完成教科书的写作。在一次会议上,卡尼曼让大家估计课程设计和教科书写作全部完成所需要的时间。包括教务长和卡尼曼在内的专家给出的答案是最短为 18 个月,最长为两年半。当时正值 20 世纪 70 年代,很多课程和教科书都处于重新设计阶段。卡尼曼问教务长,他负责过多少门课程的开发工作?那些和当前课程相似的课程大概用了多久才能全部完成?教务长想了一会儿,面带羞愧地说,他负责的课程中,大概有 40% 的课程建设半路夭折,从未完成。听闻教务长这句话,房间里立刻弥漫着尴尬的气氛。卡尼曼觉察到这一点,为了缓和氛围,问教务长:“那些完成的项目呢?用了多长时间?”教务长再次陷入尴尬,告诉课程编撰委员会,那些已完成的项目,用时全部是 7 年以上!
对知识标尺过度自信的认知偏差带来了很多严重的现实后果。那些自认为懂得很多、实则并非如此的人,继续学习或修正错误的动机和意愿较弱。那些自认为拥有卓越的动作与知觉技能的人,常常会对他人的表现吹毛求疵,但对自己的错误却浑然不知,也不愿意接受批评。举例来说,很多调查表明,绝大多数人认为自己的驾驶技术处于中上游水平。加拿大安全委员会的一项调查表明,75% 的驾驶员承认他们曾经有过驾车时打电话、吃东西、刮胡子或化妆的行为。奇怪的是,同一批被调查者中有 75% 的人报告说,当他们看到其他驾驶员一边驾车一边吃东西或打电话时,会因此而抓狂和害怕。成千上万的驾驶员过度自信地认为,自己开车时打电话对驾驶行为不会造成干扰。这些“自信”的驾驶员为自己缺乏知识理性所付出的代价是惨重的。数据表明,由于驾驶环境中增加技术性干扰而导致的交通事故在逐年增加。缺乏精确的概率标尺是人类缺乏知识理性的一种表现形式,它无处不在,往往会带来深远的后果。例如,医生群体中的过度自信现象就是广泛存在且非常危险的。
人们对自己的驾驶技术标尺失准和社会心理学研究中的自我评价偏差有着密切的联系。人们常常会扭曲对自我的知觉,虽然并非每一次的扭曲方式都相同,但绝大多数时候,扭曲的结果倾向于自我提升。在一项以参加 SAT 测试的 800000 名学生为调查对象展开的评估中,仅有不到 2% 的学生认为自己的领导能力低于同龄平均水平。有超过 60% 的学生认为自己与人交往的能力位居同龄人中的前 10%。贾斯汀·克鲁格(Justin Kruger)和大卫·唐宁(David Dunning)的研究发现,在一项逻辑思维测试中,得分为倒数 25% 的学生的自评成绩平均是年级前 38%,也就是说,即使是得分最低的学生也认为他们的测验成绩高于平均水平!
最后,为大家介绍我方立场信息加工的螺旋循环。普林斯顿大学的心理学家艾米丽·普罗宁(Emily Pronin)通过调查研究发现,人们的自我评估偏差还表现在对自我评估偏差程度的评估。普罗宁对研究社会和认知心理偏差的文献进行了总结归纳,比如光环效应、自我服务归因偏差(成功时归因于自己,失败时逃避责任)等。在这些研究中,让被试对自己受到各种偏差影响的易感性进行了自我评估,同时,也评估了他人的易感性。普罗宁和她的同事发现,在 8 类社会认知偏差研究中,人们一致认为他人对认知偏差的易感性高于自己,也就是说,认为他人比自己更容易受到认知偏差的影响。简而言之,人们承认认知偏差的存在,但却坚信自己是不受影响的特殊个例。
为何会出现这种称为“偏差盲点”的现象呢?根据普罗宁的推测,当估计他人的认知偏差程度时,人们依赖的是对通俗心理学理论的肤浅了解。可是,当评估自己的认知偏差时,他们却栽在了对意识层面内省过程的监控上,这也是我方立场信息加工的一部分。现代通俗心理学理论的传播让人们对各类认知偏差略知一二,认为自己可以预测他人的认知偏差。可是,绝大多数社会和认知偏差是在被试对偏差毫无意识的情况下发现的。因此,当人们在意识层面寻找自己的认知偏差时,会一无所获。在预测他人的认知偏差行为时,我们依据的是心理学理论;而在预测自己的认知偏差行为时,使用的却是内省法,因此会得出他人更易受认知偏差影响的结论。
我方立场信息加工的另一个重要方面是人们对事件控制力的不合理自信。心理学家艾伦·兰格(Ellen Langer)对“控制错觉”(illusion of control)现象进行了研究。所谓控制错觉,是指个体相信通过个人的能力和努力,可以控制随机事件的结果。在一项研究中,两名员工在两家不同的公司向同事兜售彩票。他们卖给一部分人的彩票号码已随机选好;而卖给另一部分人的彩票则可以自选号码。毫无疑问,在一个随机抽奖的奖池中,自选号码和随机号码的获奖概率没有任何区别。第二天,这两名员工告诉那些买彩票的同事,他们希望买回昨天卖出的彩票。结果发现,自选号码被试开出的价格比那些分配到随机号码被试的价格高出 4 倍!朗格通过一系列类似的实验设计进一步验证了她的理论假设,即人们误以为自己的能力、技巧可以决定随机事件结果。
那些屈从于控制错觉的人,常常会基于错误的因果关系理论而采取行动,最终导致差强人意的结果。在马克·芬东-欧克里夫(Mark Fenton O 扖 reevy)及其同事的一项研究中,为我们充分展现了如果依控制错觉行事,会产生怎样的实际后果。他们对伦敦 4 家投资银行的 107 位交易员进行了研究。首先,研究者让交易员完成一项实验室任务,以评估他们的控制错觉特点。在该任务中,交易员被告知按键行为也许会对一个即时变化的指标产生影响。而实际上,按键并不会影响任何指标的变化。被试认为按键对指标变化的影响程度,即代表了该名被试的控制幻觉特征。芬东-欧克里夫发现,被试的控制幻觉特征与他们的绩效指标之间存在着密切的联系。交易员的控制幻觉水平越高,年度收益越少,控制幻觉水平每增加一个标准差,平均年收益减少高达 58000 英镑。
开车时使用手机,无论是手持手机还是使用耳机,都会使个体的驾驶能力下降,增加车祸的发生风险。
我方立场信息加工:沟通与知识假设中的利己主义 我方立场信息加工会干扰我们的沟通意图,在特定场合中尤甚。克鲁格(Kruger)及其同事对电子邮件沟通中的利己主义进行了研究。众所周知,由于缺乏音调、表情和着重音等沟通线索,任何形式的书面沟通都需要一定的我方立场信息加工。从这个角度来讲,电子邮件尤其危险,因为它的便捷、非正式和互动性可能会让我们误以为它与面对面沟通很相似。在他们的第一个研究中,克鲁格让第一组被试给第二组被试发电子邮件,并询问第二组被试如何对邮件内容进行解读。这些邮件中有一半是用讥讽的口吻(例如:“我真的好喜欢约会啊,因为我喜欢自己局促不安的样子”),而另一半电子邮件则是非讥讽口吻。收信人需要判断这封邮件是否含有讥讽的意思,发信人则需要预估收信人将邮件成功归类的准确率。研究结果发现,发信人的预估非常乐观,认为收信人的分类准确率能达到 97%,而事实上,收信人的分类准确率只有 84%。发信人如果不调整自己的我方立场观点,很难理解对方在没有表情线索和音调的情况下,成功辨认出讥讽口吻是一件很困难的事情。
人们难以认识到使用电子邮件进行沟通有可能会造成误解,究其原因是自我中心主义在作祟,克鲁格等人通过实验研究证实了这一点。在这个实验中,要求发信人大声地读出他们即将发送的电子邮件内容。不过,这个音频版邮件内容并没有发给收信人。同上个实验一样,收信人需要独自解读这封电子邮件的内容是否具有讥讽意味。之所以要让寄信人读出邮件内容,目的是要减少部分寄信人的自我中心主义倾向。实验要求一组寄信人读邮件时使用与邮件内容相符的语气。也就是说,如果邮件内容含有讥讽意味,则使用讥讽的语气;如果不是,则使用较为严肃的语气。另一组寄信人被要求使用与邮件内容相反的语气大声朗读。克鲁格研究团队这样解释他们的实验设计:“我们的设计原理很简单,如果人们高估自己使用电子邮件能力的原因之一是由于难以站在收信人的角度考虑,那么,通过迫使被试站在与自己观点截然不同的立场进行思考,可以降低被试对电子邮件有效性的过度自信。也就是说,邮件内容与朗读语气不一致的被试的过度自信程度应该会弱于内容与语气一致的被试。”
实验结果发现,邮件内容与朗读语气一致的被试表现出了较强的过度自信效应。这一组对应的收信人对邮件的判断正确率仅为 62.2%,而寄信人预估有 81.9% 的人可以准确地解读他们的电子邮件。反之,邮件内容与朗读语气不一致组的被试就没有前一组那么乐观了,他们对应的收信人对邮件的判断正确率为 63.3%,而这一组寄信人认为只有 62.6% 的收信人可以准确地解读邮件内容。
克鲁格的研究为我们展现了人们将自己头脑中的想法投射到他人头脑中的自动化过程。克鲁格的系列研究受到了伊丽莎白·牛顿(Elizabeth Newton)博士论文的启发。在伊丽莎白的研究中,人们的自我中心倾向展现得更为淋漓尽致。伊丽莎白让实验被试用敲打的方式打出一首大家耳熟能详的歌曲的旋律,并预测如果有一群人听到这个旋律,大概有多少听众可以识别出这首歌。被试估计大概有 50% 的听众可以正确识别出歌曲的名称,而实际上只有 3% 的听众可以听出这是哪首歌。这种现象我们并不陌生。一曲熟悉的旋律在我们头脑中异常清晰,我们坚信其他人可以通过听我们哼曲儿或者打击旋律很容易地识别出这首歌。人们常有这样的错觉,认为自己头脑中的影音能够原样重现在他人的头脑中,这种错觉的力量是如此强大,即使在知道了存在我方立场偏差的情况下,人们也难以对这种错觉免疫。
我方立场信息加工与电子设备消费行为研究中的“特征蔓延”(feature creep)和“功能疲劳”(feature fatigue)现象有着密切的联系。研究发现,随着电子设备的功能越变越复杂,这个设备反而越来越无用了,人们不愿意花费太多的时间去学习如何使用这个复杂的设备。飞利浦电器公司对退回商品进行了一项调查,结果发现有一半的退货商品本身并没有任何质量问题,消费者之所以退货是因为他们没有掌握正确的使用方法。
很多公司都致力于让他们的商品拥有更多的功能,而这样做的结果却是让商品变得越来越无用。作家詹姆斯·索罗维基(James Surowiecki)曾以微软文字处理软件(Word)为例来说明这种现象,在 2003 版 Word 软件中,总共有 31 个工具条和超过 1500 个操作指令。为什么会出现特征蔓延现象?缘由在于产品设计者陷入了我方立场信息加工的泥潭无法自拔。认知科学家奇普·希斯(Chip Heath)曾经描述过一个出现在设计师身上的我方立场偏差的经典例子:“我注意到自己家中的 DVD 遥控器上竟然有 52 个按键。之所以有那么多的按键,是由于某个工程师知道该如何使用这些按键,并且坚信我会和他一样想使用复杂的遥控器。但是,产品设计师是这方面的专家……他们意识不到我这样的电器菜鸟会和他们的想法完全不同”。
需要谴责的并非只有电器设计师。当人们在选择电子产品时,他们并不知道使用什么样的产品可以让他们感到愉快(Gilbert,2006)。索罗维基的研究发现,人们通常认为电子产品的功能越多,用起来越满意舒心,但事实上并非如此。当把商品买回家后,消费者才发现他们真正需要的其实是“简单”二字。通过对那些因为商品太过复杂而退货的顾客进行研究发现,他们在决定退货之前,平均的尝试时间只有 20 分钟。
在我们的研究中,智商高于中数水平的被试与智商低于中数水平的被试表现出了相似程度的我方立场偏差。比如说在制造论据研究范式中(“大学学费应该上涨,高等教育成本应该全部由个人承担”),被试无论智商高低,制造的我方立场论据均多于对方立场论据。克莱辛斯基及其同事的研究发现,高智商被试与低智商被试在评估实验中的证据时,会采取相同的偏差方式。
研究,采用的是被我和韦斯特称为“自然我方立场偏差”的实验范式。这种范式是人们在没有任何明显的指示或线索提示需要谨防我方立场偏差的情况下,从自己的视角出发对情境进行评估。需要注意的是,在这种范式中,被试在实验前不知道自己即将面临我方立场偏差的挑战,研究者也没有告诉他们思考问题时采用多种视角可以降低犯错的概率。如果有这些提示的话,高智商被试更有可能遵循这些提示的建议,减少思维偏差的出现。
在这方面,我方立场偏差的研究发现与上一章框架效应相似,即聪明人只有在被告知该如何做的情况下,才会表现得聪明。如果你告诉一个聪明人对其理性思维有哪些方面的要求——比如你告诉他们要小心我方立场偏差或是框架效应的影响,然后让他们完成一个会涉及这类理性思维的任务,与低智商的个体相比,高智商的个体会更好地遵循并执行这些理性思维要求。
值得引起注意的是,教育领域中有大量的文献资料都在强调批判性思维的重要性,在一定程度上,其实就是在关注如何避免自然我方立场偏差。根据我们的观察,包括大学生在内的很多人在完成批判性思考任务时常常会失败。这些大学生都是经过了层层的测试筛选才进入高校,但是,这些考试工具并没有涉及对批判性思维的测量。理论上讲,批判性思维和理性水平是可以通过考试测量出来的。我在本章中所提到的这些任务,仅仅是用于测量我方立场信息加工的诸多任务的冰山一角。除此之外,还有大量可用于测评的任务,它们为测量被智力测试工具所忽视的理性思维提供了可能。我方立场偏差,是被智力测验忽视的一个重要认知方面。
1999 年 7 月的一个夜晚,小约翰·肯尼迪(John F.Kennedy Jr.)与妻子及妻姐乘坐一架小型飞机前往玛莎葡萄酒庄园,在距离目的地仅有几英里时,飞机因在夜晚的薄雾中迷失方向而坠入深海。记者马尔科姆·格拉德威尔(Malcolm Gladwell)认为肯尼迪的这次失误是压制失败的一个典型例子。肯尼迪未能让类型二思维战胜并取代类型一思维,也就是说,他未能让自己在飞行学校学习并掌握的仪表引导飞行技术战胜思维倾向。给他带来致命一击的是,当他找不到标记水平线的灯光时,全然没有意识到飞机正沿着海岸飞行,在这种情况下没能保持机翼平衡,最终导致飞机陷入死亡螺旋,俯冲入海。
当地平线不可见时,飞行员无法通过重力感判断河岸的位置,也无法感知到飞机的非水平状态。在这种情况下,大脑的无意识子系统会发出一个只能够勉强应对当前情境的劣质指令,意识需要察觉到这个指令,并用后天获得的知识技能取代这个无意识的自动化反应。在肯尼迪的案例中,这个劣质指令就是操控飞机上下翻飞,试图飞离云雾,寻找到地平线。而后天习得知识所教的正确做法是使用仪表数据来保持飞机水平,慌乱之中的肯尼迪未能做到这一点。根据格拉德威尔的说法:“在那种情况下,肯尼迪需要打破在能看到水平线时所依赖的直觉飞行思路,将注意力集中于仪表引导上。”联邦运输安全委员会对这起飞行事故进行了深入调查,公布了飞机在失事前最后几分钟的飞行路线,揭示了飞机不顾一切地寻找可视地平线的各种尝试和努力。寻找地平线是一种人类本能,但是,夜间飞行需要的并非是依赖直觉和本能,而是要执行后天学习到的飞行知识与技巧。
在前面几章,我们讨论了由于认知吝啬鬼未能做到有意识地加工信息,不假思索地使用默认信息加工方式,进而导致了对某些情境的非理性反应。然而,上述理论不能为肯尼迪的坠机事件提供合理的解释。他既没有被动地受到给定框架的影响(第 7 章),也没有像解决第 6 章的莱维斯克难题(杰克正看着安妮,而安妮正看着乔治。杰克已婚,乔治未婚)一样,轻率地对新异问题做出反应。从是否进行主动的思考这个角度来看,肯尼迪在面对当时的情境时,并不是认知吝啬鬼。另外,他知道正确处理危机的方法。肯尼迪学习过在当时那种情境下的处理方法,当他和另外两位乘客命悬一线时,很显然,他的顾虑太多了。在某一瞬间,正确的应对方式也许曾闪现在肯尼迪的脑海中,但是,正确的行为模式最终还是输给了错误的行为模式。那一刻,肯尼迪进行着紧张的思考,但是,正确的思路却已惨败出局。这让我们不由得想问,输给了谁?考虑到我们所有的想法都源自于同一个大脑,正如第 3 章中所提到的三重加工心智模型理论,大脑中可能有若干种不同的心智。大脑中的无意识子系统经常会打败反省的、有意识的心智。在肯尼迪的例子中,他输给了古老的关于平衡、知觉和方向定位的进化适应模块。这种现象很常见。然而,日常生活中更为我们熟知的,是与情绪管理有关的进化适应模块战胜理性反应的行为倾向。
想一想如何杀掉一个人。别恐慌,这是一起完全出于善意的杀人预谋。这是一个在道德哲学领域中得到广泛讨论的假设性情境——电车难题。电车难题在学术文献中有很多不同的变式,它的基本形式是这样的:假设,你看到一辆因刹车失灵而失控的电车正从山顶上往下急速行驶。这时,不远处山下的电车轨道上站着五个人,如果他们被这辆电车撞到,将必死无疑。唯一可以避免这场悲剧的做法是你扳动一个开关,使电车驶入另外一条轨道,而在这条轨道上仅有一个人,也就是说,将有一个无辜的人遇难,而另外五个人获得了生存机会。你是否会扳动这个开关?这样做对吗?
大多数人认为应该扳动开关,牺牲一个人而拯救五个人的生命是值得的。
现在我们来看一种电车难题的变式,这是由哈佛大学心理学家约书亚·格林研究设计的,用认知神经科学视角研究道德判断。该变式称为人行天桥难题。与电车难题的基本形式相同,一辆刹车失灵的电车正冲下山,站在前方轨道上的五个人命悬一线。此时,你站在横跨轨道的人行天桥上,天桥的位置刚好处于电车与行人之间。在你的身边,站着一位膀大腰圆的陌生胖子。如果你将他推下天桥(没有人会看到),他的身体可以阻止电车继续前行,而他也将命丧车轮下,但是,前方轨道上的五个人却可以因此获救。你是否会将这位陌生人推下去?多数人说他们不会这样做。
我们都心知肚明为何在第二种情境中人们拒绝将这位陌生人推下去。人们普遍认为第二种情景让人为难、很讨厌,而第一种情境就不会给人带来不愉快的困扰。人们普遍对这两种情境有相似的直觉判断,这是可以理解的。问题在于,有些人试图去论证这两种直觉反应的合理性,也就是说,认为在第一个情境中牺牲一个人去拯救五个人的做法是对的,而在第二个情境中牺牲一个人救五个人的做法是错误的。正如格林所说:“每当有人试图为这两种直觉反应提供前后一致的原则性辩护理由,这些辩词通常是漏洞百出的……这些直觉反应难以评判……如果这些结论并非是基于某些公认的道德准则得出的,那它们一定是基于直觉。问题是,这些直觉源自何处呢?”
为了解决这个问题,格林和其同事开展了一系列神经科学领域的研究。研究人员让被试尝试解决各种两难问题,例如电车难题(亲身难题,涉及较少的个人困境)、天桥难题(非亲身难题,涉及较多的个人困境),等等。在被试解决问题的同时,对他们的大脑进行扫描。扫描结果显示,被试在解决亲身难题时,与情绪和社会认知有关的脑区(后扣带回、杏仁核、内侧前额叶皮质和颞上沟)会被激活。与之相对应的,当被试解决非亲身难题时,更多地激活了大脑的两个认知脑区,即与工作记忆功能息息相关的顶下小叶和背外侧前额叶皮质。这两个脑区与压制人的无意识决策密切相关。
在研究天桥难题的过程中,研究者还发现了一个有趣的现象。那些不按常理出牌,决定要把无辜胖子推下天桥的被试,也就是在亲身难题中决定牺牲一个人去拯救五个人的被试,他们在做决策之前的思考时间格外得长。格林和同事对这一现象进行了更为深入的研究,比较了在解决天桥难题时艰难给出肯定答案(拯救五个人)和快速给出否定答案(不做任何反应,不救那五个人)的两组被试的脑成像结果。通过比较后发现,当被试做出肯定回答时,大脑中压制情绪脑的部位,即顶下小叶和背外侧前额叶皮质,表现出更多的激活。这说明肯定答案组的被试在决策过程中使用了类型二信息加工,压制了与情绪调控密切相关的类型一信息加工。这些被试意识到,如果通过扳动开关改变轨道的方式拯救五个人牺牲一个人是正确的事情,那么,把身边的陌生胖子推下天桥以拯救五个人的做法也同样正确。
当无意识心智左右了被试的行为反应时,个体常常觉察不到,反之,他们还常常为此而争辩,认为他们做出的决定是经过审慎思考的、有理有据的选择。我们倾向于为自己的各种行为寻求一个前后连贯如一的解释,全然不顾多数决定与选择其实是由大脑无意识的信息加工过程所产生的这一事实。这种做法导致的结果就是,我们会为无意识行为编造出虚构的理由,以证明它们是在有意识的情况下做出的理性选择。这种现象已被大量研究报告所证实。人们为无意识行为虚构解释理由的倾向,在一定程度上可能会阻碍认知方式发生改变。因为,只有当人们意识到大脑正在使用自动化子系统时,认知方式才有发生改变的可能。
战败“冷”启发式思维倾向 心理学家区分了有情绪负荷和相对来说无情绪负荷的想法,认为压制情绪对思维的污染效应是“暖加工”的一个例子。但是,即便在没有情绪卷入的情况下,即心理学家所谓的“冷加工”,有意识思维也常常会被无意识思维所取代。事实上,即使是在我们清晰地意识到何为最佳答案的情况下,依然有可能让无意识信息加工过程肆意控制行为。举个例子来说,你会选择 10% 的概率赢得 1 美元,还是选择 8% 的概率赢得 1 美元?不需细致的计算也知道这个问题的答案!但是,如果你身处在西摩·爱泼斯坦(Seymour Epstein)等人的研究中,你很有可能会选择 8% 赢钱概率的赌局。
没错,爱泼斯坦发现,在某些特定情况下,人们会倾向于选择 8% 概率获得 1 美元的机会,而非 10%。下面,就让我们一起来了解一下他们的实验。在研究中,被试看到两只装有橡皮糖的碗。在第一只小碗中,有 9 颗白色橡皮糖和 1 颗红色橡皮糖。在第二只大碗中,有 92 颗白色橡皮糖和 8 颗红色橡皮糖。接下来,被试可以选择任一只碗,从中随机摸出一颗糖。如果拿到的是红色橡皮糖,那么,被试将赢得 1 美元。虽然两只碗的赢钱概率显而易见,第一只是 10%,第二只是 8%,但是,依然有很多被试选择从装有 100 颗橡皮糖的大碗中抽取,人为地降低了自己的赢钱概率。虽然多数被试做出了理性的最佳选择,但依然有相当数量的被试(30%~40%)选择了 8% 赢钱概率的大碗。绝大多数选择大碗的被试都意识到,从统计角度来看,选择 100 颗橡皮糖的碗意味着较低的赢钱概率,但是,这只大碗中却有更多的红色橡皮糖啊!这 8 颗诱人的红色糖果迷惑了他们的心智,很多人在明知道赢率较低的情况下,仍然无法抗拒地选择了盛有更多红色糖果的大碗。在实验结束后,有一位被试说:“我选择了盛有更多红色橡皮糖的碗,因为它看起来有更多的获胜机会,虽然我意识到它同时也盛有更多的白色橡皮糖,赢的概率较小。”也就是说,在明知道哪一个是最佳选择的情况下,被试对绝对数量的偏好战胜了理性规则(选择有最佳赢钱概率的碗)。
也许,你认为自己会选择那只小碗,做出正确的选择(也许你是对的,实验中多数人都选择了小碗)。也许,你认为这个冷认知问题并没有难倒你。那就请随我一起看看下面这个例子,在这场认知战役中,你也许会为之抓狂,没准儿还会输掉。
请看下面这则三段论推理。你认为该推论是否成立?也就是说,根据给定的两个前提,得出的结论是否符合逻辑?
前提 1:所有的生物都需要水。
前提 2:玫瑰需要水。
因此,玫瑰是生物。
怎么样?在继续往下读之前,请先判断上述结论在逻辑上是有效的,还是无效的呢?
70% 的大学生认为这个结论是合乎逻辑的,没准你也是其中一员。如果你认为“玫瑰是生物”的结论在逻辑上是有效的,那么你就犯错误了。前提 1 说所有的生物都需要水,但是并没有说所有需要水的东西都是生物。因此,仅凭玫瑰需要水这一条,我们无法得出它是生物的结论。如果这样解释还不清楚的话,让我们再来看下面这组具有相同结构的三段论推理,看过之后,也许你就明白上述结论为何是不符合逻辑的了。
前提 1:所有的昆虫都需要氧气。
前提 2:老鼠需要氧气。
因此,老鼠是昆虫。
现在,我们可以很明显地看出,根据给定的两个前提,所得出的结论在逻辑上是无效的。
逻辑结构上相同的“老鼠”三段论和“玫瑰”三段论,为何在解决时一个易如反掌,而另一个却令人困惑呢?原因有以下几点。首先,玫瑰三段论的结论(玫瑰是生物)是符合情理的,在现实世界中是真实存在的。难点就在这里,逻辑的有效性并非等价于结论的可信度,而是根据前提得出的结论判断是否符合逻辑推理规则。使得玫瑰三段论难度升级与老鼠三段论难度下降的原因是相同的。“老鼠是昆虫”在现实世界中是错误的,这使得我们很容易判断出这个结论不符合逻辑推理规则。
在上述两个三段论推理问题中,人们关于自然世界的已有知识(玫瑰是生物,老鼠不是昆虫)理应独立于待解决的问题,即对逻辑有效性的判断,但事实上,却对问题解决产生了干扰。在玫瑰问题中,已有知识阻碍了问题的解决;而在老鼠问题中,已有知识对问题解决产生了促进作用。玫瑰三段论是涉及自然反应与基于规则的反应发生冲突的冷认知的一个典型例子。即使你正确地回答了这个三段论问题,你依然会感受到这种冲突。如果你回答错误,那么,你所经历的正是这种情况:经过深思熟虑,但却输给了更为自然的加工倾向,即基于可信性而非逻辑有效性做出反应。
逻辑有效性与既有知识发生冲突的三段论推理可以用于评估一种重要的思维技能,即在解决问题的过程中专注于理性推理,抵抗加工简单线索的诱惑(甘当认知吝啬鬼的先天倾向)的能力。这些问题探测了人们在指导语告知要避免属性替换的情况下,依然依赖它去解决问题的倾向。解决这些问题时,最简单的线索是直接评估结论在现实世界中是否正确。相对来说,对逻辑有效性的评估较为困难。但在解决三段论推理问题时,人们必须专注于此,与此同时,忽视或压制对结果现实真实性的评估。
值得引起重视的是,在智力测试中没有涉及“玫瑰”三段论这一类问题,这种类型的三段论推理问题更有可能会出现在评估思维倾向和认知风格的批判性思维测试中。这一类焦点开放式问题(焦点在结论的真实性或是推论的有效性上)在批判性思维测试中很受欢迎,因为这类测试的主要目的就是判断个体的思维过程更依赖于推理还是语境。然而,这种开放式问题在智力测试中就不那么受欢迎了,因为智力测试关注的是人在解决毫无争议的问题时的原始推理能力。在智力测试中(或者其他任何的认知能力倾向测试),但凡涉及三段论推理题,都会把题目和语境剥离开来,比如,题目会以这种形式呈现:“所有的 A 都是 B”。或者使用陌生的语境,比如与“玫瑰”三段论相类似的题目会以如下形式呈现:
前提 1:所有 Hudon 类的动物都很凶猛。
前提 2:Wampets 非常凶猛。
因此,Wampets 是一种 Hudon 类动物。
“玫瑰”三段论推理的标志性特征是“多重心智冲突”,而这一类题目将心智冲突从三段论推理问题中剥离开来。不涉及心智冲突的三段论推理问题仅仅可以用来评估算法心智,而不能对反省心智进行评估。例如,有研究发现个体在“玫瑰”三段论推理问题中的表现与智力水平之间仅有微弱的相关。但是,思维倾向可以预测人们在冲突性三段论推理问题中的表现,而智力水平则不能。认知灵活性、思维开放性、语境独立性等都是思维倾向的表现形式,是反省心智的重要组成部分。
虽然“玫瑰”三段论推理问题看起来有些小儿科,但它却是现代社会中一种日益重要的认知能力的风向标。这种能力就是根据给定信息进行推理,并且在思考过程中,暂时摒弃过去已掌握的信息,不受其影响。例如,现代司法系统在对证据进行评估时,十分重视将已有的信念知识与当前的证据评估剥离开来。那些与法庭上呈现的证据无关,而是根据已有的背景知识和个人经验所做出的离奇判决,势必会引起人们的公愤。20 世纪 90 年代发生的两起经典案件为此提供了绝佳的例证。社会调查数据显示,大多数美国公民对于陪审团做出的辛普森无罪判决感到愤怒。同样,人们也因警察殴打罗德尼·金案件的初审结果而感到震怒。在这两起案件中,陪审团成员都未能将自己的既有信念与评估当前证据剥离开来。
现代社会的很多工作场所都需要员工具备将已有知识经验与当前工作行为剥离开来的能力。比如,在零售服务行业有一句箴言,“顾客永远是对的”。这句话被理解为,哪怕顾客对员工有不合理的言语侵犯时,服务人员也应该秉承“顾客是对的”这一理念。员工必须要遵循这种奇怪的零售行业逻辑,将常识所认为的顾客行为失范置之一边,依然提供高质量的服务,不然他就有可能面临被解雇的风险。服务行业从业者被认为应该谦恭有礼地提供服务,并且应该意识到这种行为模式是基于市场经济交换的社会建构。服务人员必须意识到,他们与顾客之间所发生的互动并不是严格意义上的人际社会互动,而是处于一种非自然的特殊互动领域,在这个领域中需要遵守特殊的交往规则。
我并不是在宣扬在任何情况下都应该完全无视自己的已有知识。很显然,在多数情况下,为了解决问题,我们需要积极调动已掌握的知识技能。在这里,我仅仅是想指出一个现象,即现代化社会创造出了越来越多的非自然、去情境化情境。基于现代科技社会的科学研究常常要求人们“忽视已有知识和信念”。比如,在你认为控制组的表现一定会弱于实验组的情况下,依然对控制组进行严格检测,这就是忽视已有信念的一种形式。对摒弃已有知识的需求,并非仅局限于科研和法律领域。现代社会通过日益强调公平公正、遵守规则、“一碗水端平”、制裁任人唯亲、消除偏见、普世主义、包容、契约制强制性平权和消除家族、种族、信仰歧视等理念,以要求个体剥离既有的以个人化为中心的认知,达到去情境化。
我们在进行信息加工时,通常并不知晓自己有着吝啬使用认知资源的倾向。当个体面临一个待解决的问题时,他们常常想不到这个问题可以有不同的呈现框架。人们往往没有意识到自己在思考时并没有尽力而为。当人们深陷于我方立场思维时,常常并没有察觉到自己也可以基于其他的立场去思考问题。当我们使用锚定和调整策略,或是思维方式受到信息生动性的影响时,我们对其他可能的处理方式毫无觉察。这一点很好理解。认知吝啬鬼之所以选择走认知捷径,其目的在于不占用意识资源的情况下提供答案。
然而,本章所讨论的情境有所不同。如果你在爱泼斯坦的橡皮糖任务中选择了有 8% 赢钱概率的那只碗,你多多少少都会意识到 10% 赢钱概率的碗也许是一个更好的选项。在天桥任务中,如果你认为把身边的无辜胖子推下天桥是一件错误的事情,想必你一定经历了一番思想斗争,因为你能够意识到由于保全了一个人的性命,多牺牲了四条生命。在玫瑰三段论问题中,如果当你看到“玫瑰是生物”时,仅仅根据大脑对这句话的第一反应,就做出了“有效”的判断,你也许能够觉察到自己的大脑此刻有些偷懒,并没有对给定的两个前提进行审慎的思考。在上述这些问题情境中,人们能够意识到在“深思熟虑”和“不假思索”之间所存在的认知冲突。人们在解决这些难题时,或许能够觉察到“深思熟虑”和“不假思索”正在将你的思维拉向两个截然相反的方向。
在有些情境中,人们可以很清楚地意识到多重心智的存在。实际上,个体在不同心智之间挣扎犹豫是这些情境所共有的显著特征。在这些情境中,人们必须抵抗住认知捷径的诱惑。这就好比早上虽然很想赖床,但必须起床做早餐;很想花三美元喝上一杯午后咖啡,但由于本月预算捉襟见肘而必须放弃;减肥期间应该吃胡萝卜作为零食,而非薯条;虽然周末有密歇根-圣母橄榄球对抗赛,但知道自己必须利用周六的时间将车库清理干净;周末有两个聚会邀请,但自己必须为即将到来的期中考试做准备;在赌场给自己定下的止损额度是 100 美元,现在已经输掉了 107 美元,实在是该立即收手了,但是……
中的“意志力”是指延迟满足或是压抑本能反应的能力,使得我们在做决策时不短视,能够着眼于长远利益。缺乏评估即时奖励与延迟奖励的能力,是导致很多人非理性行为的来源,这些非理性行为阻碍了目标的最大化实现。很多成瘾行为背后的逻辑都充分说明了这一观点,比如酗酒、暴饮暴食、透支购物等。从长远角度来看,个体毫无疑问应该更喜欢适度饮酒、节食、保持较低数额的信用卡欠费账单。
心理学家使用延迟满足实验范式对这个问题进行了研究。在这种实验范式中,人们常常会表现出一种称为“跨时间偏好翻转”的非理性行为。这是一类关于偏好的非理性行为模式,它阻碍了个体获得自己从长期视角来看最想要的东西。举例来说,假设你现在面临两个选择,一是立即可以获得 100 美元,二是一周后获得 115 美元(假设这笔钱由联邦政府作为第三方机构暂为保管,延迟收款不存在任何风险)。当面临这个选择时,并非所有被试都选择了一周之后获得 115 美元这个选项。不知是基于什么原因,有些人倾向于立即获得 100 美元。接下来,同一批被试面临着第二个选择:52 周后获得 100 美元或是 53 周后获得 115 美元。无论在第一题中做出了怎样的选择,几乎所有的被试都选择了多等一周获得 115 美元。对于那些在第一题中选择即刻获得 100 美元的被试来说,存在着两个题目中偏好排序不一致的情况。52 周之后,他们所面临的情境与第一题完全一致——即刻获得 100 美元或是等待一周后获得 115 美元。
为何一周的等候时间在一种情境中是至关重要的(重要到可以为此损失 15 美元),而在另外一种情境中(提前一年做决策)又似乎变得无关紧要了呢?人们之所以表现出这种前后不一,可以用双曲线贴现曲线(hyperbolic discount curves)来解释。该双曲线是决定预期收益打折速度的函数,它的存在具有深远的进化意义。问题在于,虽然这种功能有利于基因适应,但对于一个试图将个人效用最大化的个体来说,不应该让理性也同时大打折扣(最理想的人类选择函数应该是指数曲线)。双曲线函数会让人们高估近在眼前的奖励,而忽视长期目标。它还会让人们的偏好随着时间变化而变化。对于任何项目或行动的策划人来说,这样的做法都会让人抓狂。前期做的项目计划,可能会在实施中途被推翻或放弃,而随着时间的推移,又有可能会后悔当初的决定!
双曲线贴现曲线可以用来解释我们为何会屈服于非理性的诱惑。深夜临睡前,我们设定了早上七点钟的闹钟,因为第二天要做的事情很多,早起一会儿可以保证一整天工作任务的顺利完成。但是,当七点钟闹钟准时响起时,我们在迷迷糊糊之中按下了“再睡一会儿”的按钮,反悔了昨晚的决定,再过一会儿,又会因刚刚“再睡一会儿”的新决定而后悔万分。我们会在冰箱里装满减肥食物,预期未来一段时间将瘦身成功,然而,当快餐店的收银员询问:“请问您需要加大号套餐吗?”我们几乎都会本能地点头,脱口而出“好”!在以上这些情境中,我们必须抑制住自己想要满足眼前欲望的冲动,如果未能做到这一点,就会被大众心理学贴上“缺乏意志力”的标签。
让我们看一则《新闻周刊》刊出的有关意志力的例子。在一篇描写参议员乔治·爱德华的妻子伊丽莎白·爱德华的文章中,作者向读者讲述了爱德华夫人参加 2004 年总统选举期间的一则轶事。当时,爱德华夫人正在艰难地实行南滩减肥法。在机场转机时,空乘人员端着一只装满甜点的托盘走过,询问爱德华夫人是否想要来一块布朗尼蛋糕。爱德华夫人回答道:“我的答案是‘好的,来一块’。但是,如果你端着它们走开,从长远来看,我会感到更开心。”在这个情境中,爱德华夫人使用了她的意志力。另外,这个例子也是使用认知工具的一个例子,在这个故事中,爱德华夫人使用了支持理性思维的心智程序(mindware),即“捆绑策略”。心理学家乔治·安斯理(George Ainslie)和霍华德·拉查林(Howard Rachlin)对捆绑策略进行了这样的描述。我们想要达成一个长期目标(例如,通过节食减肥),但是,眼前有个小奖励在诱惑着我们(一块布朗尼蛋糕)。我们心里清楚地知道,在节食期间每天吃一块布朗尼蛋糕是绝对不应该发生的事情,这种行为势必会阻碍我们长期目标(节食减肥)的实现。另一方面,我们发现,在决策前的那个时刻,对当前即时奖励的本能反应占据了绝对支配地位。他们甚至还有为自己开脱的说辞:为何不先把这块布朗尼蛋糕吃掉,明天再开始减肥?然而,算法心智和反省心智主导下的类型二信息加工过程告诉我们为何不能明天再开始减肥:明天,你将面临与今天相同的挣扎,到那时,你依然会选择吃掉眼前的布朗尼。日复一日,都将如此。
现在,让我们来认真思考一下这件事情。我们可以制定一条规则,以重新定义“今天吃一块布朗尼蛋糕”这件事情:今天吃一块布朗尼蛋糕,意味着未来的每一天我都会吃一块蛋糕。依据这个规则,事情就很明朗了。“今天吃一块蛋糕”这件看似不起眼的小事情,实际上威胁到了我们的长远减肥大计。如果我吃了这块布朗尼蛋糕,会毁了整个减肥计划。如果能够这样想的话,就放大了吃一块布朗尼蛋糕带来的损失,放大后的损失可以与被高估的强烈即时欲望满足感相抗衡。
为了增强长期目标的动机性力量,我们对问题进行了重述,使得它有实力与短期的本能欲望搏斗一番(并不是说重述后的规则必将胜出,而是仅仅增强了长期目标的力量,使得这成为一场势均力敌的竞争。使用体育术语来说,试图让长期目标和短期目标之间进行一场加时赛,而非一上场长期目标就全线失守)。我们可以用语言为工具来设定规则,以将未来可能做出的所有行为都“捆绑”在一起,进而使个体可以获得足够强大的动机性力量,以压制当前可能对长期目标产生威胁的行为。
这个例子也引出了我们在下一章中将要深入讨论的一个重要话题。压制无意识心智做出的反应,其实是使用语言内容的过程。在压制过程中,大量使用了陈述性知识和策略性规则(这些策略都是语言编码的)。这种心智程序是基于语言形式的论点或主张,具有可以启动反应系统的动机性力量。这些信息通常是朗朗上口、易于理解的,以名言警句的形式口口相传,比如“少花一分,就相当于赚了一分”“美貌只是皮囊”,这些是为了阻拦由本能或情绪模块启动的反应。
问题在于,假如个体还没有掌握与某个情境相关的心智程序,除本能反应之外的备选控制系统就不可能对当前的行为产生影响了。因此,在有些情境中,个体想要压制自动化的反应,但苦于还未加载适用于当前情境的心智程序。这是导致非理性行为发生的一个心智问题,我称它为“心智程序缺陷”。
“心智程序”是指个体可以从记忆中提取出的规则、知识、程序和策略,以辅助决策判断和问题解决过程。除了认知吝啬鬼,心智程序出现问题也是导致不良决策的重要原因。有时,个人是因为没有安装足够的心智程序,即心智程序缺陷,如忽略备择假设、不擅长寻求证伪焦点假设;有时,是安装了污化的心智程序,如相信占星术和笔迹学。
英国律师萨利·克拉克曾因谋杀自己的两个婴儿而被捕入狱,2003 年,她的判决被推翻而释放出狱。5 个月后,英格兰梅登黑德的药剂师特鲁珀提·帕特尔谋杀亲生子女的案件也得以昭雪。克拉克夫人和帕特尔夫人的案件存在很多共同点。她们的家中都不只一次发生过婴儿死亡事件;她们都被指控谋杀自己亲生的婴儿;用以给她们定罪的证据含混不清。最后一点,她们之所以被判有罪,都是由于法官、陪审团尤其是专家证人的心智程序缺陷。
在两起案件中出庭作证的专家证人是一名儿科医生。据他推测,两位母亲都患有“代理型孟乔森综合征”,具体症状是父母亲让健康的子女接受没有必要的医学治疗,这是一种很残忍的儿童虐待方式。比儿科医生的说辞更能打动陪审团的,是这位儿科医生作证时出示的一组概率数据。这位儿科医生作证说,同一个家庭中两个婴儿都死于“摇篮猝死症”的概率是 1/73000000。这个夸张的数据让陪审团印象深刻,使得他们认为这种事情几乎不可能在非人为的情况下发生。但是,这位儿科医生在计算概率时误用了一条最基本的规则。他只是简单地把发生一次摇篮猝死的概率进行了平方,进而得到了 1/73000000 这个数据。但是,在进行概率计算时,只有当两起事件完全独立时,才可以使用这种算法。而在婴儿猝死的案例中,并不满足两起事件完全独立的假设,已有很多研究表明,由于共享很多基因和环境因素,在发生过婴儿猝死的家庭中再次出现婴儿猝死症病例的概率会升高。
就在克拉克夫人被定罪不久,英国医学杂志发表了一篇题为《因数据错误而定罪?》的文章,指出了儿科医生的法庭证词中出现的概率逻辑错误。就某种意义来说,儿科医生所犯的错误,是一个很小的概率推理错误。一旦被指出来,多数人都可以理解他错在哪里。相信所有的概率入门课程老师在讲授“概率平方”的使用规则时,都会强调事件独立性是它的基本使用原则。但是,从另一个角度来看,这个小错误又是一个大问题。关于基本概率理论的心智程序并非人人具备,这位儿科医生没有,法官、陪审团成员也都不知道。多数人在高中毕业时搞不懂概率的操作规则,只有少数选修了统计相关课程的大学生才有机会获取这一类知识。智力测验更是不会对这些方面进行测量。认知心理学家发现,当处理这一类概率信息时,人们并不能通过自然思维倾向(认知吝啬鬼即依赖于此)得出正确的估计。多数人的心智程序中并没有存储一些重要的概率理论规则,因为这些知识无法通过基础教育获得。简而言之,缺乏概率理论知识是一种心智程序缺陷,也是很多非理性思维和行为的根源。
18 世纪,来自英格兰坦布里奇维尔思的教士托马斯·贝叶斯(Thomas Bayes)提出的定理为这个问题提供了理论性答案。贝叶斯公式基于两个基本概念:待检验的焦点假设(称为 H),以及与假设相关的数据集合(称为 D)。在下面我将要给大家展示的公式中,你将看到这样的符号:H(非 H)。这个符号代指备择假设,即如果焦点假设为假,则备择假设一定为真,两者是相互排斥的。因此,按照惯例,备择假设为真的概率等于 1 减去焦点假设为真的概率。例如,如果我认为鱼竿另一端咬钩的鱼是鲑鱼的概率为 0.6,那么,这只鱼不是鲑鱼的概率就是 0.4。H)表示进行数据收集之前,备择假设为真的概率。另外,接下来的计算中还牵扯到一些假定概率(条件概率)。例如,P(H/D)代表在对数据(D)模式进行分析之后,焦点假设为真的概率;P(
接下来的章节是本书中技术性最强、对数学要求最高的一部分。但是,此处的重点与难点并非在于数学公式,而是概念。即使你有数学恐惧症,想要忽视所有的数字和公式,也应该对理念有清晰准确的把握,这是关键所在。掌握贝叶斯思维方式,除了一些词汇规则之外,你并不需要学习太多其他的知识。正规的贝叶斯统计肯定包含计算,但是,为了避免犯概率相关的思维错误,你只需要掌握正确进行概率计算思维方式所需的概念性逻辑即可。
在接下来出现的公式中,P(H)表示在收集数据之前估计焦点假设为真的概率,P(H/D)代表备择假设的后验概率。P(D/H)表示在焦点假设为真的情况下,观察到特定数据模式的概率;P(D/H)(下文中将要提到,这是一个非常重要的值)代表在备择假设为真的情况下,观察到特定数据模式的概率。需要引起重视的是,P(D/H)与 P(D/H)并非是互补的(两者相加不为 1)。数据有可能同时给定焦点假设和备择假设,也有可能不给定焦点假设和备择假设。H)],常常会忽略掉分母 [P(D/
接下来,我们将聚焦于贝叶斯公式中理论性最强的一种变形形式,该公式以概率形式呈现:
在这个比率等式中,或者说概率形式公式中,从左至右 3 个比率分别表示:在获得新数据(D)的情况下,焦点假设(H)成立的后验概率;焦点假设概率除以备择假设概率,被称为相似率(LR);焦点假设成立的先验概率。具体来说:
该公式告诉我们,在给定数据集的情况下,焦点假设成立的概率等于两个概率的乘积:相似率乘以焦点假设成立的先验概率。即:
焦点假设的后验概率=相似率×先验概率 值得引起大家重视的一个问题是,不知道贝叶斯定理,并不意味着这个人一定是非理性的。普通人其实并没有必要熟记这个公式。问题在于,无论个体的判断是否遵循贝叶斯定理,人们在做出概率方面的决策时,通常是根据自动化加工做出的推测,实验室研究所关注的正是这种自动化推测是否符合贝叶斯定理的限制条件。当我们跌倒在地时,我们的身体倒下的轨迹遵循牛顿定律。当我们跌倒时,我们不会有意识地根据牛顿定律进行计算,但是,我们的行为可以被认为是遵循牛顿定律的。同样的道理,人们在做出判断时也许并不知道贝叶斯定理,但我们仍然可以将他们的行为描述为符合贝叶斯定理的理性推理。哪怕在人们不了解任何贝叶斯公式的有关知识,或是没有进行有意识计算的情况下,人们的概率判断也有可能被认为是遵循贝叶斯定理的。
个体的推理偏离贝叶斯定理的形式多种多样,在接下来的章节中,我将重点关注其中一种。
通常情况下,当人们对证据的可诊断性进行评估时,即评估 [P(D/H)/P(D/H)]。在焦点假设为假的情况下,人们没有意识到评估获得观测数据概率的必要性。H)[如果这是一家很糟糕的餐厅,少于 5% 的客人会投诉的概率]。他 / 她希望告诉你一个很高的 P(D/H),以提高餐厅的吸引力和你光顾的概率,但是你(正确地)意识到,如果要评估后验概率,仅仅有 P(D/H)是不够的,因此你并不会被老板说服。你觉得老板提供的论据可信度不高,并且,由于老板没有提供 P(D/
这是由于没有想到反例而导致严重推理错误的理论性原因。好了,现在让我们回顾一下在开篇中提到的社区餐厅老板的故事。如果你认为老板的回答很棒,那么你跟他犯了相同的错误。原因如下:
根据贝叶斯定理,餐厅老板仅提供了 P(D/H)的信息 [如果这是一家很棒的餐厅,少于 5% 的客人会投诉的概率],而忽视了 P(D/H),你可能还会做出一些其他的假设。在这个简单的例子中,你能够认识到获取 P(D/H)的必要性。换句话说,如果这家餐厅很糟糕,有 5% 的客人会直接向老板抱怨的概率是多少?
上述情况如何用贝叶斯公式表达呢?请大家先来回想一下贝叶斯公式的基本形式:
后验概率=相似率×先验概率 让我们假设你收集数据之前估计这家餐厅很棒的概率是 0.5,那么,估计这家餐厅很差劲的概率也是 0.5。因此,认为这家餐厅很棒的先验概率是 0.5:0.5,即 1:1,用博彩术语来说,就是赌一赔一。
这个例子中的相似率指的是什么呢?根据老板提供的信息来看,95% 的客人从未抱怨过这家餐厅。因此,可以对此处的相似率做如下表述:
假定这是一家好餐厅,很有可能有 95% 的客人都不会抱怨、投诉餐厅。事实上,5% 的投诉率在竞争激烈的餐饮业中是非常高的,这样的餐厅很有可能面临生存危机。因此,95% 的客人用餐后没有任何怨言这一评价指标,超过 99% 的好餐厅都可以轻松达标。餐厅老板所犯的错误在上述公式的分母部分,即 P(D/H)。如果这是一家很差劲的餐厅,超过 95% 的客人不会抱怨的概率是多少?这里问题就多了。多数差劲的餐厅并非一如既往得差。另外,多数餐厅之所以收到差评,并非因为顾客对食物有所怨言(那样的餐厅距离关门不远了),而是由于这家餐厅的各方面一直都差强人意,或是差于周围餐厅的平均水准。这些餐厅并非提供令人反胃的食物,而只是“一般般”的餐厅。再考虑到基于社会化因素,当人们仅仅是轻微不满意时,通常不会公开表示抱怨。也就是说,人们如果在一家很糟糕的餐厅吃饭,虽然心中暗下决心绝对不会再去第二次,但多数人离店时都不会把抱怨挂在脸上或者说出来。这就是为何餐厅老板提供的 95% 满意度的数据并没有很强的说服力。H);
如果这家餐厅很差劲,有 90% 的概率至少有 95% 的顾客离店时不会口头表达不满。当我们把这些数据代入到贝叶斯公式,结果如何呢?
后验概率=相似率×先验概率 后验概率=(0.99/0.90)×(0.5/0.5)
后验概率=1.1 “这是一家好餐厅”的赔率是 1.1 比 1(这是一家好餐厅的概率已由 50% 变为 52.4%)哪怕是最为乐观的估计,这家餐厅值得品尝的概率都不大。
餐厅老板试图诱惑我们犯思维错误。他的伎俩包括以下 3 步:
(1)制造一个已知数 D,以产生很高的 P(D/H);
(2)希望对方忽视 P(D/
(3)仅仅根据高 P(D/H),推测焦点假设的发生概率。
越来越多的研究表明,人们普遍倾向于忽略能够证明非焦点假设为真的证据。例如,心理学家麦克·多尔蒂(Michael Doherty)及其研究团队使用一种简单的范式对这个问题进行了研究。该研究范式让被试想象自己是一位正在给红疹病人做检查的临床医生。研究者给他们提供了 4 条信息,要求被试从中选取一条可以确诊病人患有“Digirosa”的临床证据。这四条信息内容如下:
患有 Digirosa 的人口比例。
没有患 Digirosa 的人口比例。
患有 Digirosa 的患者中,红疹患者的比例。
未患 Digirosa 的患者中,红疹患者的比例。
这些信息对应于贝叶斯定理中的 4 个术语:P(H),P(H),P(D/H)和 P(D/H)。由于 P(H)和 P(H)是互补的,所以在计算后验概率时,实际上只有 3 条信息是必需的。其中,未患 Digirosa 的人群中红疹患者的比率,即 P(D/H),是必选的信息。因为根据贝叶斯定理,它是计算相似率不可或缺的关键部分。然而,在多尔蒂及其同事的研究中,48.8% 的被试没有选择 P(D/H)这条信息。因此,对于很多面临这个问题的人来说,未患 Digirosa 的红疹患者数量与当前问题的解决毫无关系,它被(错误地)认为是一件无关痛痒的事。H)的重要性,这并非是默认安装在大脑中的心智程序,因此,选择它作为解决问题的必需信息看起来有些“反直觉”。人们必须通过学习而得知这条信息的重要性,否则,默认的信息加工过程会选择忽略这条信息。因此,那些没有认识到加工 P(D/~H)重要性的人,可以认为他们存在心智程序缺陷。
能够意识到 P(D/
一个关键的心智程序缺陷:忽略备择假设 未考虑到备择假设,即相似率计算公式的分母,并非是一个无关痛痒的推理错误。关注备择假设下的观察概率,是医学临床诊断和应用科学决策的一个关键步骤。这也是在研究中使用对照组的原因。了解在自变量不变的情况下会发生什么,对于研究来说是至关重要的。对于临床和科学研究推论来说,如果只提供实验处理组的信息,意味着这个研究设计存在致命的缺陷。
未考虑到检验备择假设的必要性,是导致前述自闭症辅助沟通研究案例越错越离谱的诸多原因之一。心理学家做了大量的研究以评估人类忽视关键性对照信息(对照组)的认知倾向,例如,已得到广泛应用的协变关系探测范式。该研究范式给被试呈现了一系列治疗方法和病人反应之间的关系数据。被试有可能被告知以下信息:
200 人接受治疗,病情得到改善。
75 人接受治疗,病情没有得到改善。
50 人没有接受治疗,病情得到改善。
15 人没有接受治疗,病情没有得到改善。
这些数据是对实验结果进行归纳总结的 2×2 矩阵。在协变关系探测范式实验中,要求被试判断这种疗法是否可以有效改善病情。许多被试认为该疗法是有效的。这些被试的关注点在于接受治疗并且病情得以改善的病人数量(200 人)。另外,他们还注意到,接受治疗并且病情改善的人(200 人)远远多于接受治疗但病情没有得到改善的个体数量(75 人)。由于病情改善的概率看起来相当之高(200/275=0.727),这个数据怂恿被试认为该疗法是有效的。这即是一个理性思维错误。
这种思维方式忽略了没有接受治疗但病情得以改善的概率。由于不接受治疗病情改善的概率(50/65=0.769)比接受治疗的概率更高,因此,这种疗法可以被认为是完全无效的。被试忽略非治疗组疗效结果的认知倾向,以及治疗后改善组的数量优势,诱使很多人认为这是一种有效的疗法。令人不安的是,研究发现那些负责进行临床诊断的内科医生,也常常会使用这种非最优化的思维方式处理临床证据。
更多的科学思维心智程序:可证伪性 人们在尝试依据备择假设评估数据时,会觉得这是一件比较困难的事情;同样的道理,人们在寻找有可能会推翻焦点假设的证据,并检验这个证据时,也会感到非常困难。原因在于,人们天然的思维倾向是寻找证实假设的证据,而非证伪的证据。过去 40 年,在推理领域中被广泛研究的一个问题,极具戏剧性地说明了这一点。这个任务是由最具创造性的科学家之一,研究现代人类理性的专家——彼得·华生(Peter Wason)发明的。这个任务在各种研究中被使用了没有几百次,也有几十次了。在继续往下读之前,请先试着回答下面的问题:假设在你面前摆放着 4 张长方形卡片,每张都是一面写有字母且另一面写有数字,这 4 张卡片中有两张是字母朝上,两张是数字朝上,朝上的一面分别是 K、A、8、5。你的任务是选择翻开一张或多张卡片,以检验下述规则是真还是假:如果卡片的一面是元音字母,那么,它反面的数字是偶数。现在请指出哪一张卡片是必须翻开的。
这个任务名为“四卡选择任务”。它受到广泛关注和研究的原因有两点:第一,绝大多数人都会犯错;第二,人们在个问题上犯错的原因令人费解。待检验的规则是:如果卡片的一面是元音字母,那么,它反面的数字是偶数。如果我们想检验该规则,应该翻开 A 和 8。翻开 A——元音卡片,是为了弄清楚它的背面是否是偶数,翻开 8 是为了证实它的反面是否是元音字母。答案看似非常简单,但问题在于:50% 的人选择的答案是错的!排名第二常见的答案是只翻开 A 卡(检查它的背面是否是偶数),研究中大概有 20% 的被试选择了这种做法。这种做法也是错的!还有约 20% 的被试选择翻开其他的卡片组合(比如翻开 K 和 8),这也不对!
如果你的解决方案和上面提到的那 90% 的人相同的话,那么,你和过去几十年研究中的被试一样,回答错误(即使在阅读了前面我对于可证伪性的介绍之后,依然会犯错)!让我们来看看大多数人是怎么犯错的吧。首先,人们不会出错的是 A 和 K 的选择。多数人没有选择 K 这张牌,而是选择了 A。因为待检验的规则并没有提及辅音字母的反面应该是什么内容,卡片 K 看起来和规则毫无关联,而卡片 A 就不同了。卡片 A 的背后可能是偶数,也可能是奇数。如果是偶数,则与待证明的规则相符,如果是奇数,则可以证明这个规则是错误的。简单来讲,为了证明这个规则的真实性,必须翻开卡片 A。这一步,多数人都做出了正确的选择。
但是,究竟是选择翻开卡片 5 还是卡片 8 呢?对于多数人来说,这是难点所在。很多人就在这个问题上犯了错误。他们错误地认为应该翻开卡片 8。之所以会做出这样的选择,是因为人们认为应该翻开卡片 8,以检验它的背后是元音还是辅音。但是,即使卡片 8 的背后是辅音字母 K,这也不能说明待证明的规则是错的,因为规则中虽然提到元音字母卡片背后必须是偶数,但并没有说偶数卡片的反面必须是元音字母。因此,在卡片 8 的反面发现非元音字母,并不能说明任何问题。而被大家所忽视的卡片 5,实际上是解决问题的关键所在。如果卡片 5 的背面是元音字母,由于所有元音字母背面都不会是奇数,那么,就可以说明待证明的规则是错的!简而言之,为了证明规则是错误的,需要选择翻开卡片 5。
总而言之,在判断此类“如果 P,那么 Q”的规则时,只有“P 出现的同时,非 Q 出现”的证据才可以判断规则为假。所以,在检验规则的真实性时,只需翻开卡片 P 和卡片非 Q 即可(在本例中是卡片 A 和卡片 5)。如果 P 和非 Q 同时出现,那么规则为假。如果没有同时出现,那么规则为真。
在解决这个看似简单的问题时,为什么多数人的答案都是错误的呢?有很多理论试图解释这个问题,其中最经典的一个理论认为,人们之所以在这个任务上表现糟糕,部分原因在于人们太过于关注证实、确认规则。这是驱使人们翻开卡片 8(希望确认背面是元音字母)和翻开卡片 A(希望确认背面是偶数)的原因。但很少有人关注有可能会推翻规则的卡片——这种证伪的思维模式能够让人立刻想到翻开卡片 5(背面是元音字母的话,则可推翻规则)。如前所述,还有一些其他理论试图对人们在这类问题上的糟糕表现进行解释。然而,不管这些理论如何解释这种错误倾向,毫无疑问的是,如果人们在解决问题时能够考虑到可证伪性,可以大大减少这种错误的发生。
在推理过程中,寻求可证伪性是一条非常有用的原则。但是,大量证据表明,寻求可证伪性对于绝大多数人来说并非是一种自然而然的优选策略。原因在于,认知吝啬鬼只会根据给定的信息去建构问题解决的框架,而不会自动地从另一视角去思考问题。因此,对于多数人来说,寻求证伪性证据的心智程序需要通过学习来获得。
另一个用于研究人类在证伪时会遇到困难的范式是“2-4-6 任务”。这个著名的研究任务也是由彼得·华生发明的。在 2-4-6 任务中,被试被告知:研究者脑海中存在一个规则,这个规则是将 3 个整数划分为一组的标准。2-4-6 这个数字组合已被证实符合研究者心中的这个规则。接着,让被试猜测这个规则到底是什么。在猜测过程中,被试可以提出数字组,研究者会根据这组数是否符合“规则”而给予相应的反馈,直到被试能够准确地猜出这个规则为止。
在这个“2-4-6 任务”中,研究者心中的规则是“任何 3 个依次增加的数字组合”。被试在探索这个规则时,常会遇到很多挫折。因为他们在最开始的时候形成了一个比这个规则更为严苛的规则假设,比如“依次增加的偶数”或是“等距增加的数字”,并且,他们会依据这些严格的规则创造数字组去检验自己形成的规则是否正确。毫无疑问,被试在检验自己创造出的数字组合时,从实验者那儿得到的都是积极反馈,因此,他们会信心十足地宣布自己已经找到了实验者心中的规则。当他们得知回答错误时,常常会感到十分惊讶。例如,被试会创造出这样的数字组合:8-10-12;14-16-18;40-42-44。在收到 3 次“正确”的反馈后,他们即宣布“规则是依次加 2”!当被告知回答错误后,他们会尝试这样的数字组合 2-6-10;0-3-6;1-50-99。这一次,他们依然可以收到 3 个肯定的反馈,这时,被试又宣布新发现的规则:“规则是挨在一起的两个数字之间的差值是相同的!”毫无疑问,这个答案又是错的。在被试猜测规则的过程中,他们没有想过从“证伪”的角度去解决问题,比如验证数字组合 100-90-80 或是 1-15-2。
被试不愿意做出违反焦点假设的尝试,这个现象在另外一个研究中得到了进一步的验证。在这个研究中,研究者通过人为手段使得被试对假设进行证伪,进而使得他们在猜测规则任务上的表现大大提升。该研究由瑞恩·特韦尼(Ryan Tweney)的研究团队完成。实验中,被试被告知研究者心中有两个规则,规则一适用于 3 个数字组合,被称为 DAX;规则二适用于另一个 3 个数字组合,成为 MED。研究者每公布一个数字组合之后,都会告诉被试这个数字组合是符合 DAX 规则还是 MED 规则。研究中,被试被告知 2-4-6 符合 DAX 规则。DAX 规则和上一段提到的规则相同,即 3 个连续增加的数字,而 MED 规则是:所有不符合 DAX 规则的 3 个数字组合。在这种情况下,被试解决问题的速度更快,他们交替检验 DAX 规则和 MED 规则。由于 MED 规则是“所有不符合 DAX 规则的数字组合”,因此,被试检验 MED 规则的过程实际上也是证伪 DAX 规则的过程。被试之所以会对 DAX 规则进行证伪检验,原因在于有一个近在眼前的焦点假设有待证实(MED 规则)。由于两个规则互补,被试尝试去证实一个假设的同时,也是在证伪另外一个假设。研究者通过这种方法引导被试尝试用他们不常用的思路去解决问题——关注备择假设,证伪焦点假设。在这个研究中,只有通过这种人为诱导的方式,人们才能关注焦点假设证伪,足以证明采用证伪的思维方式是一件多么困难的事情。
综上所述,我们现在有一个坏消息和一个好消息。坏消息是人们不擅长寻求证伪焦点假设的证据,而好消息是这种心智程序是可以通过教育和学习获得的。所有科学家在成长过程中都完成了大量需要证伪焦点假设的练习,因此,他们遇到问题时会自动提出这样的疑问:“我需要考虑哪些备选方案?”
理性思维的另一个重要方面,是在预估未来事件时能够使用正确的基础概率值。有趣的是,研究发现人们很擅长处理“隐含的”概率信息(只需自主心智即可获取的信息),但是,当需要个体进行具体推理时,就破绽百出了。下面,请思考一个医学风险评估的问题。该问题曾出现在很多研究中,其中包括以医疗专业人员为实验被试的研究。
假设某种疾病由 XYZ 病毒引起,该病的发病率为千分之一。假设现在有一种化验方法可以 100% 地检测到 XYZ 病毒,但是,使用这种化验方法的假阳性率为 5%。也就是说,如果一个人携带 XYZ 病毒,通过这种化验一定可以被发现。但是,如果未携带病毒的健康人接受这种化验,有 5% 的可能性被误诊为 XYZ 病毒携带者。现在,从人群中随机选取一人进行检测,化验结果为阳性(阳性意味着受检者可能是 XYZ 携带者)。那么,在完全不考虑个人信息、病史的情况下,这位受检者携带 XYZ 病毒的概率为多少?
在继续往下读之前,请你先估算一下这道问题的答案是什么?结果无需太过精确(如果你可以算出精确的结果,当然更好)。这道题考察的并非是计算能力,而是看你的解题思路是否正确。若想正确地解答这道问题,需要结合抽象的概率信息,但是,多数人在解题时都会过分依赖具体、鲜活的个案信息,给出错误的答案。
在解决这个问题时,最常见的错误答案是 95%,而正确答案约为 2%。人们极大地高估了阳性结果代表个体为 XYZ 病毒携带者的概率。通过贝叶斯法则可以精确地算出正确答案,不过,接下来我们不使用这种方法,而是进行一些逻辑推理,以帮助我们厘清基础概率对概率预估结果产生的巨大影响。我们已知的信息是:每 1000 人中,有一位 XYZ 病毒携带者。如果其他的 999 位未携带病毒者全部都接受化验,由于该化验的误诊率为 5%,所以化验结果会错误地显示这些人中约有 50 位携带病毒(0.05 乘以 999)。因此,在所有化验结果为阳性的 51 位“患者”中,只有 1 位是真正的 XYZ 病毒携带者(约为 2%)。简而言之,这个问题的基础概率是:绝大多数人都并未感染病毒。患者数量极少的事实结合假阳性的概率(5%),结果就是检查结果为阳性的个体中真正患者的绝对数量其实很少。
在解决这个问题的过程中,个案证据得到高估,而统计证据却被低估了。对于绝大多数人来说,个案证据(化验结果)看起来更“具体”、更“触手可及”、更“活灵活现”。相对比来说,概率证据看起来……怎么说好呢,太过概率了!这种只顾个案证据却忽视统计数据的推理方式显然是错的,因为个案证据本身也只是概率而已。别忘了,临床化验方法存在一定的误诊概率。个体若想做出正确决策,必须同时考虑到这个情境难题中涉及的两种概率,一是个案证据的诊断概率;二是先验概率。将两种概率结合计算的方法有很多种,有的是对的,有的是错的。当个案证据给人带来具体性幻觉的时候,人们通常无法正确地利用这两个概率以得到最终的正确结果。
行文至此,我需要格外强调一下:在此处谈论贝叶斯推理,并不是说在面对此类问题时,我们应该随时记起贝叶斯公式,并结合公式进行计算。其实,人们只需要对“贝叶斯”有感性认识,在解决问题时能够有“贝叶斯直觉”就足够了,并不需要把具体的公式背下来。以 XYZ 病毒问题为例,在解题时只要意识到基础概率的重要性就可以了。在化验误诊率很高的情况下,同时考虑到疾病的发生率极低这一基础概率,就能判断出多数结果为阳性的个体其实并未患病。我们需要的仅仅是贝叶斯心智程序中有关基础概率的部分(当然,较强的理解力也很重要)。这种对基础概率的感性认识足以让我们在日常生活中做出接近真相的估计,预防重大错误的发生。这就好比在餐厅老板自荐难题中,优秀的思考者并不需要每次都计算出相似率 [P(D/~H)] 的具体数值,他只需要知道餐厅老板的推销辩词压根不足为信就可以了。
当一个人把球高高抛起,然后又准确地接住时,看起来他好像是通过缜密的计算推测出了球的运动轨迹,而实际上他可能连最基本的运动轨迹计算公式都不知道,但这并不影响他的接球本领。在潜意识层面,一些相当于数学计算的思考过程正不知不觉地发生。”(Dawkins,1976)
有关概率的另外一个谬误是:条件概率倒置。这种思维谬误常见于现实生活中的决策情境中。概率推理过程中的条件概率倒置指的是:在给定 B 的前提下 A 的概率与在给定 A 的前提下 B 的概率,两者是等价的。实际上,这两者并不相同。例如,罗宾·道斯(Robyn Dowes)曾介绍过《加州日报》上的一则新闻标题。这个标题暗示抽大麻会导致个体吸食致瘾毒品。这个标题所暗含的意思是:根据个体之前吸食大麻的情况,调查个体使用致瘾毒品的概率。但实际上文章调查了吸食致瘾毒品的学生抽大麻的概率。这两个概率存在天壤之别。抽大麻的学生吸食致瘾毒品的概率,远远小于吸食致瘾毒品学生抽大麻的概率。原因在于,多数抽大麻的人并不使用致瘾毒品,而使用致瘾毒品的人,绝大多数都曾抽过大麻。
条件概率倒置常常发生在医疗诊断领域。研究发现,病人和医务工作者都经常会错误地将出现某种症状时疾病的确诊概率与确诊后出现某种症状的概率混为一谈(作为病人,更关注的是前者)。
程序管理、信息选择以及信念标尺倾向的差异化,反映了个体不同的反省心智属性,通常使用调查问卷对其进行测量评估。例如,认知需求思维倾向会影响问题解决过程中反省心智的使用。问卷调查通过询问人们是否同意下列这些说法,以测量使用反省心智的倾向性:“抽象思维的想法对于我来说很有吸引力”或是“相对于那些重要、简单、不用思考太多的任务来说,我更喜欢做重要、困难、智力上有挑战性的任务”。我的研究团队对“信念认同”(belief identification)的思维倾向进行了研究。这种思维倾向是指个体以改变信念使其更接近事实为重要目标,还是以坚持当下的信念为重要目标。为了测量这种思维倾向性,我们在问卷中设置了这样的题目:“信念应该根据新的信息或证据不断对其进行修正。”“坚守自己的信念非常重要,即使在有证据与之相悖的情况下。”
只有当高智商个体受到心智程序缺陷的影响时,才能称之为理性障碍。为什么这么说呢?因为心智程序缺陷通常是由于缺乏教育或经验而产生的。因此,当研究发现智商与本章讨论的几种心智程序之间存在正相关时,一点儿也不会让人感到惊讶。
阿尔巴尼亚在过去的几十年间曾经是欧洲最贫穷的国家之一。然而,19911992 年,阿尔巴尼亚开始转型,赋予了人民更多的人身和经济自由,该国经济在 19921997 年迅猛发展。在这一时间段,阿尔巴尼亚的市场开放程度提高,国内生产总值(GDP)持续增加,通胀有所缓解,预算趋于平衡,外国投资也大幅增加。国际货币基金组织对该国在这一时期所取得的进步大加赞扬。然而,在 1997 年初期,经济和社会发展戛然而止。经济陷入崩溃,法制惨遭践踏,军队仓库被民间武装集团肆意掠夺,政府对大部分地区失去控制。阿尔巴尼亚于 1997 年分崩离析,究其原因,主要是由于大规模群体性的理性障碍。
导致阿尔巴尼亚社会崩溃的主要原因是庞氏骗局(Ponzi schemes)。据查,当时该国一半以上的人民卷入了这个骗局。1997 年年初,庞氏骗局全面崩溃。在庞氏骗局中,经营骗局的人实际上没有任何资产(因此,从骗局开始的第一天起,他就无力偿付债务)。庞氏骗局为早期投资者提供的回报率非常之高,事实上,早期投资者得到的钱是后来的投资者投进骗局的钱。早期投资者得到的高额回报催生了(通常是通过口口相传)一大批新的投资者,这批新投资者又引发了更狂热的投资热潮。这个骗局在自我强化的基础上持续了一段时间。当然,在数学计算的帮助下,人们最终识破了骗局。终于,到达某个临界点,骗局瓦解了——而这通常发生在发起人携带骗得钱财成功潜逃后。
通常情况下,潜在投资者会得到关于为何有高回报的复杂解释。一些在阿尔巴尼亚制造骗局的人向他们的投资者解释道:高回报率是源于外汇投机;另一些人则声称利润的背后是复杂的采矿计划;有一个人甚至宣称回报是来自于对加利福尼亚旅馆的投资。在庞氏骗局中,通常的情况是:所谓的盈利计划越复杂、越和国外联系密切,那么对于潜在投资者而言,这个计划就更诱人。
庞氏骗局在世界各地都有,但正是由于在阿尔巴尼亚的骗局规模如此之大,才会引起我们的关注。骗局每个月为投资者提供 30% 的利率,而当时实体银行和公司提供的投资回报率与骗局利息相比根本不值一提,高额利润使骗局风靡一时。骗局一旦变得深受欢迎,就会有许多经营骗局的竞争者接踵而至。为了诱惑投资者,新的骗局不得不提供更高的利率。在 1996 年年底,许多庞氏骗局(当然他们都披着看似合法的公司的外衣)提供每月 50%~60% 的利率,有一家公司甚至打出了提供百分之百利率的招牌。当然,回报率越高,骗局瓦解得就越快。随着雪球越滚越大,终有一天无法募集到足够的新资金以偿还承诺给早期投资者的利润回报。
到了 1997 年,将近一半的阿尔巴尼亚成年人卷入了类似的骗局!人们拿出了房子的抵押贷款,有些人甚至还把房子卖了变现以获取资金参与其中。许多人把毕生的积蓄都投到这个骗局中。在高峰时期,相当于阿尔巴尼亚 GDP 一半的资金投进了庞氏骗局。在骗局瓦解之前,骗局经济开始和工资收入竞争并扭曲经济。例如,一位老板的员工数量很快地从 130 名减少到 70 名,因为人们认为他们可以通过把钱投入庞氏骗局的方式实现盈利,而无须工作以获取报酬。
金字塔骗局中,每个人都招募 15 名新成员,以此类推,当这一循环进行到第 7 次时,卷入骗局的人数将超过美国全部人口数量的一半!)
人们之所以会忽视数学原理是因为他们被污化的心智程序所奴役。庞氏骗局和金字塔传销骗局背后的潜在逻辑本质上是相同的:心智程序受到污染的人开始认为他们每天都在身边见到的、他们一辈子都在经历着的经济规律可以被违背。他们开始认为,这种新型的投资方式的投资回报率远远高于传统的金融工具,并且毫无风险。骗局的策划人通常会给出一个极其精明的解释,以让整个运作过程显得合情合理。
骗局瓦解后,成千上万的阿尔巴尼亚人损失了毕生积蓄,也没了家。接着暴乱发生,国家陷入了混乱。政府无力为人民的投资提供担保,因为在骗局瓦解时,5 家最大的操控着庞氏骗局的公司只有 4900 万美元的资产,但却要偿还价值 47500 万美元的债务——债务额是国家 GDP 的两倍。如同其他的此类诈骗一样,大多数的实际资金都已经被存进国外的银行,像消失了一样,而这些犯下诈骗罪的人要么逃之夭夭,要么被关进监狱,声称自己和其他投资者一样也破产了。
人们之所以常常获得污化心智程序,原因在于它通常被包裹在引人入胜的故事中,并且,这个故事常常很复杂。那些低智商的人对这类复杂的故事往往并不买账。然而,复杂的心智程序对中等智商或高智商的人而言,却很有诱惑力。在互联网上对阴谋论、逃税计划、暴发户计划、“玩弄”股票市场计划和彩票中奖方法的相关案例稍加搜索,你很快就发现这些案例都有一个共同的特点,那就是极具诱惑力的复杂性。例如,许多暴富计划都涉及不动产交易,而与这些交易相关的税收制度非常复杂。许多彩票中奖“秘籍”中都涉及使用复杂的数学和概率进行解释(这些解释都是错的!)。“玩弄市场”股票投资建议常常涉及数学和所谓的技术分析图表。
被欺诈性投资计划欺骗的人可能并非低智商,这一直觉在全国证券交易商协会(National Association of Securities Dealers)委托进行的一份研究结果中得到了证实。这份研究调查了 165 名在欺诈性投资计划中损失超过 1000 美元的人的想法和人口统计学特征,并把他们和另一组没有受到过金融欺诈的人的想法和人口统计学特征进行比较。研究结果表明:投资诈骗受害者的受教育程度要比对照组高很多——在投资诈骗受害者组中,68.6% 的人至少拥有文学学士学位,而在对照组中这一比例仅为 37.2%。在投资诈骗受害者组中,收入超过 3 万美元的个体比例是 74.1%,而在对照组中这一比例是 56.4%。从受教育程度和收入数据中我们可以推断出,投资诈骗受害者不可能是低智商人群。若是非要找出什么不同的话,只能说这种污化心智程序对于那些智商较高的人更具有诱惑性。
社会中常见的不理性行为背后那些制造麻烦的心智程序大多是由中等或高智商人群编造的,影响的对象也是中、高智商群体。结果导致很多以聪明才智著称的名人频频做出不理性行为。哲学家马丁·海德格尔(Martin Heidegger)是举世闻名的思想家,但他却是一名纳粹的辩护人,还用看似有理实则空洞的逻辑为自己的信念辩护。他组织了学生准军事营,常常在信上署名“希特勒万岁”。著名的科学家威廉·克鲁克斯(William Crooks)是铊元素的发现者,同时也是英国皇家协会会员。尽管他不断被“通灵者”欺骗,但他从来没有放弃对唯灵论的信仰。阿瑟·柯南·道尔(Arthur Conan Doyle)同样也因受“通灵者”欺骗而名誉受损。诗人埃兹拉·庞德(Ezra Pound)精于语言文字的使用,但在“二战”中,他将大部分时间都用于通过意大利广播为法西斯做宣传。类似的例子不胜枚举。
许多极端邪恶的观念传播者都是智商很高的人。在纽伦堡接受审判的战犯中,很多人的 IQ 测试得分都高于 125 分;在 14 名策划最终解决方案的人中,有 8 人拥有博士学位。对否认犹太人大屠杀的关键人物所做的调查表明,这些否认者的名头包括:印第安纳大学欧洲史硕士学位获得者、知名“二战”人物传记的作者、里昂大学文学教授、常春藤大学所用教科书的作者、斯克兰顿大学的英语教授和西北大学教授等。当然,神创论倡导者的身份也包括许多拥有大学学位的人。
认知科学家已经揭示了聪明人的观念与事实严重不符的部分原因。一种解释就是“知识投射倾向”(knowledge projection tendencies)。这个观点认为,在一个自然生态环境中,我们以前绝大多数观念都是正确的,用已有观念作为过滤器来处理新的数据,能够使知识积累的速度更快。这个观点被用来解释演绎推理中的信念偏差效应。认知科学家乔纳森·埃文斯(Jonathan Evans)及其同事认为,由于信念修正与大脑中的很多信念网络存在交互效应,因此它的计算成本很高。所以,他们断定,认知吝啬鬼可能倾向于接受未经任何逻辑推理但又看似可信的结论。只有当人们在面对难以置信的结论时,认识主体才会对假设进行逻辑推理。他们认为,当人们身处一个绝大多数信念都为真的知识领域中时,这个策略是非常有效的。
在上述理论中前提假设的满足至关重要,即只有个体身处多数信念都是正确的某一知识领域中,才可以用当前的知识结构帮助自己更快地吸收新的知识。然而,如果个体使用的信念子集含有大量错误信息,知识预期就会耽误对正确信息的吸收。理解神创论或大屠杀否认者的关键点就在于此。尽管知识投射倾向在多数情况下都行之有效,但是,它也会将一些在“错误信念之岛”上的人隔离开来,使得他们无法逃离此岛。简而言之,当在错误的情境中使用知识投射时,有可能导致“知识隔离效应”。因此,尽管知识投射可能会使人们快速地吸收新的正确信念,但它也可能是一个陷阱。当人们不断地调用错误观念集合,使用这些错误信念对证据进行评估时,他们会迅速地积累更多错误信念,并为未来进一步的知识投射做好了错误知识储备。
绝大多数人都认同这样一个观点:我们的信念一定会有利于实现某个目的。然而,如果这个“目的”不是我们真正想要的目的呢?文化复制子理论(culturalreplicator theory)和模因学(science of memetics)帮助我们认识到了这种可能性。文化复制子一词指的是通过非基因手段传播的文化元素。文化复制子的替代词——模因(meme)由理查德·道金斯(Richard Dawkins)于 1976 年在其著作《自私的基因》中提出。模因一词有时候也用于指代所谓的模因组——一组共同复制的、同时适应的模因,最终形成一串相互联系的观点(例如,民主的观点就是一组复杂而又相互联系的模因,即模因组)。
人们可能会问,既然已经有了诸如文化人类学等各种学科用以解决文化传播问题,为什么又要用这个新词作为文化的单位呢?有这样的疑问是合乎情理的。我之所以认为模因一词很有用是因为:①不熟悉的新术语可以起到去中心化的作用,从而使我们更容易理解污化心智程序的概念。它在一定程度上有助于移除“信念就是财产”的隐喻,而我们在诸如“我的信念”和“我的观点”等短语中都可以看到该隐喻的身影。由于“我的模因”的用法没那么熟悉,因此它并没有以同样的方式通过代理行为表明所有者的身份;②由于它与基因一词的相似性,它建议我们用广义达尔文主义的观点来理解信念习得和改变。更确切地说,广义达尔文主义强调发展有机体是为了促进基因(复制)的利益,而不是为了有机体本身的任何利益。通过类比,该观点催生了这样一种见解,即模因复制有时候会以牺牲宿主利益为代价而自我复制。
因此,模因这一概念所引发的基本观点是:能够传播的信念,未必正确,也未必有利于传播者。模因学理论家经常使用连锁信的例子:“如果你不把这个信息传递给 5 个人,你就会遭遇不幸。”这就是模因(即一个观点单位)的一个例子。被复制和存储于大脑的是行为指令。它是一个合理的、成功的模因。然而,这个模因有两个值得注意的方面。第一,它是不对的,没有传递该信息的读者不会因此而遭遇不幸;第二,存储了该文化基因又把它传递出去的人也不会得到任何好处——他不会因为传递了信息而变得更富有、更健康或更聪明。但是,这个模因还是存活下来了。它活下来是因为它自身的自我复制属性(该模因的根本逻辑就是:它几乎什么都不做,就只说“复制我——否则后果自负”)。简言之,模因不一定是为了帮助它们所寄生的宿主而存在的。它们存在的原因在于:在模因进化过程中展现出了绝佳的多产性、长寿性和复制的忠诚性,而这些正是成功的复制子所具有的决定性特征。
模因理论对推理信念的形成具有深刻的影响,因为它颠覆了我们思考信念形成的方式。社会心理学家往往会问,究竟是什么导致人们产生了某些信念。在这个因果关系的模型中,人决定了产生什么信念。然而,模因理论会问,模因中的什么要素让它们为自己找到了许多“宿主”?问题不是人如何获得信念(社会和认知心理学长期以来的传统),而是信念如何俘获人!
倘若你觉得颠倒传统的思维方式似乎有些奇怪,那么就请想想政治运动参与者。人们发现,决定参与某次政治运动最为主要的原因并非参与者的心理因素,而是他们对同一事物所持有的共同信念。同理,地理相邻性是预测人们选择皈依什么宗教的最佳预测因素,而非特定的心理特征。
关于信念为什么会传播这一问题,人们的常识是:“信念 X 会传播是因为它是正确的。”然而,这难以解释那些正确但却不流行的观点和那些流行但不正确的观点。模因理论告诉我们,在这类例子中,我们要注意另一种原理。观点 X 在人群中传播是因为它是一个优质的复制子——它擅于找到宿主。模因理论使我们把注意力放在作为复制子的观点的特性上,而不是放在产生这些观点的人的特性上。这是模因概念独一无二的显著功能,也是一个关键的功能。
有了模因理论提供的重要见解后,我们现在就能更全面地对为什么心智程序会存活下来进而得以传播的原因进行分类。前三种原因分类反映了行为和生物科学的传统设想。最后一种分类反映了模因理论的新观点。
寄生心智程序模仿有益观点的结构欺骗宿主,还让他们认为自己能从中得到好处。广告商很善于构建寄生信念,这些寄生信念依赖于其他信念和视觉形象的支持。狡猾的广告商把信念和形象放在一起,努力创造出诸如“如果我买了这辆车,我就能得到这位漂亮的模特”等未经分析的有条件的信念。其他的一些自我保护模因策略涉及改变认知环境。例如,许多宗教会启动人们对死亡的恐惧,以期让他们承诺的来生更加诱人。
当涉及污化心智程序时,人们总是为了自己的利益行事(或为了自己在乎的人的利益)这一默认假设就不再适用了,它此时是自己的利益至上——它的利益就是复制。这一观点是现代广义达尔文主义自然发展的结果,只不过最近才被社会完全接受。和它类似的观点还有:基因不一定就服务于它们的人类宿主。但是,这种观点直到理查德·道金斯将其整合到他 1976 年出版的那本经典著作中时,才引起公众的注意。文化复制子(心智程序)可能同样不服务于个体利益的观点,更是在最近才引起人们的注意,对某些人来说,它仍然是违反直觉的。
这一观点的反直觉性质反映在人们试图解释行为时难以丢弃的默认理性假设。发生于 21 世纪的一起非常重要的事件为我们提供了一个典型案例。在 2001 年 9 月 11 日纽约世贸大厦被撞毁不久之后,美国第一夫人劳拉·布什被要求对该事件进行评论,在回答过程中,她提到教育在防止此类悲剧中的重要性。有趣的是,大约在同一时间的一个采访中,英国前首相的夫人切丽·布莱尔同样提到教育作为类似“9·11”事件的预防措施。然而,当时的评论员和 3 年后有关“9·11”事件更全面的报道都指出一个令人不安的事实,即“9·11”事件的劫机者绝不是没有受过教育的人。例如,在劫机后驾驶着美国航空 11 号班机撞向纽约世贸大厦北塔,导致许多人被烧成灰烬的穆罕默德·阿塔就有城市工程和规划专业的学位。
人们很难接受这些行为竟是出自受过良好教育和聪明的人之手这一事实。人是理性的,按照这种思路,必定有某些重要的东西他们不知道——某些教育或信息缺陷才导致他们做出此种行为。污化心智程序这一概念为我们开启了另一种可能性——或许恐怖分子的心智程序不是太少,而是太多。更确切地说,种种有害的寄生模因影响了恐怖分子,例如殉道模因和来生会得到慷慨回报的模因。纽约世贸大厦的摧毁帮助许多人理解病毒模因会以牺牲人类为代价进行自我复制这一可怕的逻辑。它引发人们对变成武器的模因的危险性展开更为广泛的讨论,因为模因完完全全控制着宿主。
有时模因组没有丝毫想要服务于人类理性的意思。相反它们可被称作“破坏协议的模因”——这些模因不能容忍在自己的复制策略上有任何妥协。这种属性为什么会促进观点繁殖,其原因来自于广义达尔文主义的原理。一个复制子复制频率增加的同时,它的多产性、长寿性和复制的忠诚性也同时增加。文化复制子的复制忠诚性比基因要低得多。文化复制子的片段在它从一个大脑跳到另一个大脑中时,不断地发生混合和匹配。破坏协议的模因通过拒绝融入人类文化大染缸的方式,保证了自身复制过程的纯结性。在复制频率的基础上,破坏协议的模因总会找到适合自己的位置。本节讨论的关键点是,这种心智程序不会为了满足人类在变幻莫测的世界中的利益而展现出灵活性。因此,破坏协议的模因是污化心智程序的主要候选者。
除了可证伪性之外,还有另外一种情况值得引起我们对心智程序的怀疑,即罗列出代价和利益,将降低销毁心智程序的可能性。这种情况被称为“信念陷阱”。让我们来看看麦凯引用的这个例子:
实施阴部封锁(割礼的一种方式)的女性落入了信仰陷阱。马里的班巴拉人认为在性交过程中,如果女性的阴蒂接触了阴茎,男人就会死去。尼日利亚的一些人认为,在接生过程中,如果婴儿的头部碰到了阴蒂,婴儿就会死去。我把这些称之为“自我强化的信念”,即一种无法被改变的信念,因为验证信念真伪的代价实在太高了。(1996)
这个例子和可证伪性的例子有所不同。从原则上讲,这一信念的真伪是可以验证的,是可以被证伪的。但是,验证真伪的代价太高了。请注意,基于预期的价值,即使你认为这个信念只有 1% 的可能性是正确的,但由于风险太大,你也不会去验证它的真伪。这个心智程序一旦存在于人们的脑海中,再想移除它就很困难了。
除了可证伪性和代价太高之外,如果心智程序具有反意属性,这也可成为质疑它的理由。如果一个观点或策略是正确的或是对宿主有益的,为什么它要去抵抗其他心智程序呢?对于与另一个模因(可能是没用的模因)之间展开的对比测验,有益的心智程序对此不应该持欢迎态度吗?因此,反意属性的存在(除了禁用评估策略之外)是污化心智程序可能存在的另一线索。
需要提醒大家注意的是,复制活动的拟人化描述仅仅是生物学写作中的一种速记手法。例如,“复制子为蛋白质提供保护性涂层以抵御攻击”这样的说法比“建立带有涂层的交通工具的因子复制在人群中越来越常见”更容易被理解。我将继续使用这种拟人化的描述方式,比如,说复制子有“目标”或是它的“利益”,我相信读者可以理解这种说法只是为了便于理解的写作技巧。道金斯(1976,1989)曾经说过:“当我们用拟人化的方式讨论基因,把它们看作具有有意识目标时,时刻谨记,要确保自己具备随时将这些不准确的俚语转化为科学严谨专业术语的能力”。这一观点也适用于描述模因。自我复制次数最多、忠诚度最高、寿命最长的模因会有更多的后代。
几年前,加拿大门萨俱乐部的成员接受了一份关于超常信念 的调查,调查结果令人深思。门萨俱乐部是一个只接纳高智商个体的组织,要想成为该俱乐部的成员,必须通过严苛的智力测验。然而,调查结果显示,俱乐部成员中有 44% 的人相信占星术、51% 的人相信生命节奏、56% 的人相信有外星访客——所有这些信念都没有一丝实证证据支持。
所谓压制功能,是指类型一加工即将触发个体反应时,类型二加工对其加以制止,并用更优化的反应取而代之。压制功能属于算法心智的一部分,在图 12-1 中用箭头 A 表示。发起压制的更高级别认知功能是反省心智的倾向性属性(dispositional property),与理性关系密切,如图 12-1 箭头 B 所示。用机器智能(machine intelligence)的术语来说,就是算法心智使类型一加工过程断线,进而达到压制的目的。箭头 B 所指代的心理功能与压制功能本身(箭头 A)存在本质性差异,两个功能的评估指标截然不同。对类型一加工压制能力(箭头 A)的评估可通过测量流体智力实现;发起压制操作认知倾向(箭头 B)的评估指标是思维倾向,比如反省和认知需求。
图 12-1 更为完善的三重加工模型 图 12-1 还展现了计算备择反应以确保压制“物有所值”的模拟过程,以及源于反省心智的模拟这两个过程。具体来说,去耦化操作(箭头 C 所示)是由算法心智和反省心智下达启动模拟的命令(箭头 D)共同执行的。个体在下达启动命令和去耦化操作两方面的个体差异亦不相同,前者与理性思维倾向有关,后者则与流体智力有关。
除了压制类型一加工和通过去耦化过程启动模拟之外,图 12-1 所示模型还定义了算法心智的第三个关键功能,即连续性联结认知(serial associative cognition,箭头 E)。这个功能提醒我们,并非所有的类型二加工都包含去耦化认知模拟,还有一类速度较慢的连续性认知没有涉足模拟备择世界并对其进行地毯式搜索。
现在,我们回忆一下类型一加工的主要组成部分:情感化反应、习得的自动化反应、条件化反应以及由进化过程塑造的适应性组块。这些反应模式足以应对绝大多数情境,但是,现代生活制造了很多上述反应模式无法顺利解决的难题。回想一下我们讨论过的彼得·华生四卡选择任务:
每张卡片都是一面是字母,另一面是数字。规则是这样的:如果卡片的一面是元音字母,那么,它的反面就是偶数。现在,有两张卡片是字母向上,两张卡片是数字向上。被试的任务是决定翻开哪一张或是哪几张卡片即可检验规则的真伪。被试面前的四张卡片分别是 K、A、8、5。
正确答案是卡片 A 和卡片 5(唯有同时翻开这两张卡片方可证明规则是错误的),但是,多数被试给出的答案是 A 和 8(错误答案)。有研究让被试在解决过程中出声说出思考过程。通过对这些思考过程进行分析后发现,多数被试使用的是慢速、连续性分析加工。这种加工方式存在很多疏漏。我们节选出一则非常具有代表性的被试思考过程:“让我想想,我会翻开 A 来看一下它的背后是不是偶数。然后,我会翻开 8 来验证一下它的背面是否是元音字母。”
然后,被试停顿了一下。似乎哪里有些不对劲儿?
有几个问题是显而易见的。首先,被试在解决这个问题时采用的是类型二加工,多数类型一加工在解决这个问题时毫无用武之地。这个问题不涉及情感化处理,所以情绪管理是没有任何用的。除非被试曾经受过专业的逻辑训练,否则他也不会有自动化的逻辑推理过程。再者,人类进化过程中并未出现过此类问题,所以达尔文适应性行为组块也帮不上什么忙。
类型一加工依赖不上,被试只好进行类型二加工。上面列举的被试思考过程是一个漏洞百出的加工过程的典型范例。被试并没有对备择模拟世界进行彻底搜索,他所使用的是连续性联结认知。备择模拟世界应该包括规则为假的所有情况。该问题中的伪命题案例是:一面是元音字母、另一面是奇数的卡片。然而,被试并没有考虑到这些。被试也没有系统地检视每一张卡片是否是元音字母 / 奇数的组合。答案:K(否)、A(是)、8(否)、5(是)。如果被试遵循检验伪命题案例处理程序的话,便能够得出正确答案——A 和 5。但被试并没有这么做,他仅仅是以假设规则真为出发点,沿着规则为真的思路进行思考(如果卡片的一面是元音字母,那么,它的反面就是偶数),没有构建包含了所有真伪规则可能性的模拟世界。被试从给定的焦点规则出发,沿着规则为真的思路展开联结思维,这种处理信息的方式就是连续性联结认知。
虽然这个任务使用了类型二加工,但是却没有建立起对备择世界模型完善的认知模拟。在这种思维过程中,认知被禁锢于给定模型起始点的联结模式,着实是一种较为肤浅的思维形式。在选择任务中,被试全盘接受了给定规则,包括对给定的规则形式也没有试图进行修改,即假设它为真。然后,他们基于这个焦点模型展开推理,从这个焦点模型中系统地产生联结,却完全没有考虑到其他的情境建模方式。我把这种思维方式称为“带有焦点偏差的连续性联结认知”。
有焦点偏差的连续性联结认知的主要特征可以用认知吝啬鬼的第二阶段策略来加以概述。传统的双加工理论只强调了认知吝啬鬼的规则之一:在一切可能的情况下,都默认启用类型一加工。但是,在很多情况下,默认使用类型一加工并不可行,特别是在新异情境中时,既没有相应刺激的进化适应模块,也没有机会可以通过过度学习和练习掌握自动化思维。此时,就有必要使用类型二加工了。但即使在这种情况下,认知吝啬鬼模式还是有可能会开启。认知吝啬鬼的规则之二:当必须要使用类型二加工时,默认使用连续性联结认知,而非完全去耦化认知模拟。
我提出的焦点偏差概念与认知科学领域的已有观点不谋而合。它们的共同主题是:人类会想尽一切办法以减轻认知负荷,达到加工更少信息的目的。焦点偏差的基本理念是信息加工器倾向于加工结构最简单的认知模型。所谓结构简单的认知模型有很多种表现形式,比如:只表征一件事情;全盘接受命题或模型为真的形式;忽略调节变量(把调节变量纳入考量是备择世界建模的必要条件,而这正是焦点加工希望我们极力避免的)。基于认知科学领域中大量的信念偏差研究文献,以及关于我方立场偏差推理的研究成果,那些结构最简单的模型其实就是个体已有信念或是曾经有过的相关建模经验(我方立场偏差和信念偏差)。
讨论过连续性联结认知之后,现在让我们回到图 12-1,看一看反省心智的第三个功能——发起对连续性联结认知的中断(箭头 F)。中断信号改变了下一步将直接指导思维的连续性联结序列。中断信号有可能会带来多种不同的结果。它有可能会使连续性联结认知全部中断,以启动模拟(箭头 C)。或者,它会通过改变临时焦点模型以改变思维起点,开启一个新的连续性联结链(箭头 E)。最后,算法心智常常会通过前注意加工收到来自自主心智计算后的信息输入(箭头 G)[2]。
由反省心智发起的“去耦化”共有三种类型:(1)解耦自主心智发起的反应,使其得到压制;(2)拷贝和解耦次级表征,以执行仿真模拟;(3)解耦当前的连续性联结认知过程,并启动新的连续性联结。
认知吝啬鬼的三个特征,依据认知卷入度排列前后顺序。排在第一位的是默认自主心智加工反应,该过程完全没有类型二加工的参与,是最肤浅的一种信息加工方式。认知吝啬鬼的第二个加工倾向特征是带有焦点偏差的连续性联结认知。该特征指的是进行类型二加工时的过度节省倾向。具体来说,过度节省认知资源致使备择世界模拟或是完全析取推理(详见第 6 章)过程失败。
认知吝啬鬼的第三个特征是压制失败。压制失败的吝啬倾向最小,因为在此过程中有类型二认知去耦化的参与。该特征是指类型二加工试图压制并取代自主心智的类型一加工,结果却失败了。虽然压制类型一加工的尝试失败,但认知去耦化过程确有发生。
如图 12-2 所示,心智程序问题分为心智程序缺陷和污化心智程序两类。在心智程序缺陷这一类别中,图中的方框代表缺少的知识库。此处,我并没有对这一类心智程序进行详尽分类。与之相反,该图仅选取了概率推理、因果推理、逻辑和科学思维领域中的一小部分,它们的缺失会导致非理性思维和行为。图中所示的两种心智程序问题对应的是启发式和偏差研究的两条传统路线:有关概率和概率推理策略的知识缺乏以及验证假设时忽略备择假设。图中仅选取了行为决策领域研究提出的诸多心智程序缺陷中的几个。“特定领域的知识结构”这一方框代表了未提及的内容。
最后,图最下方是污化的心智程序。同上,方框代表存在问题的知识库和策略。此处只列出了研究文献中讨论较多的问题,并没有穷尽所有的问题知识库和策略(污化的心智程序太过多样化了)。第一个子分类是评估失效,该问题得到了广泛的研究和讨论。帮助心智程序寄宿在宿主中的评估失效属性包括:如果质疑心智程序,则会受到惩罚;如果不质疑心智程序,则会获得奖励;通过使心智程序具有不可证伪性以妨碍评估意图。
污化心智程序的第二个子分类是鼓励自利思维的“自我”。有些学者认为,“自我”是焦点偏差发生机制的重要组成部分。也就是说,人类倾向于从我方立场视角对世界进行建模。自我的自利倾向无疑是具有进化适应意义的。然而,现代社会与人类进化过程所经历的环境已不可同日而语,环境对人的要求自然也发生了天翻地覆的变化。比如,现代社会提倡无偏见,拒绝任人唯亲,打击种姓、种族、信仰歧视,这些问题在人类的漫长进化过程中从未遇到过。在面对现代与历史进化的巨大分歧时,自利倾向的思维方式就不再是最佳选择了。污化心智程序的最后一个子分类是适应不良的模因与特定类别的信息。与心智程序缺陷分类相似,除了上述几个子分类之外,还有大量由错误信息构成的心智程序案例,正是这些程序导致了非理性思维和行为。
在图 12-2 中,通俗心理理论(lay psychological theory)同时隶属于污化的心智程序和心智程序缺陷。通俗心理理论是人们基于对自己心智的认识而产生的理论。心智程序缺陷是我们所不了解的心智,比如,我们需要多长时间适应突然发生的悲剧或特别幸运的事情?还有一些通俗心理理论是对自身心智的错误认识,这些误解则是污化心智程序的典型代表。其中一个常见例子就是,我们错误地认为:每个人都对自己的心智情况了如指掌。该污化心智程序很好地解释了以下现象:①我们错误地认为自己知晓自身行为的真正原因;②虽然认为别人在思考问题时会受到思维偏差的影响,但坚信自己对这些思维偏差极具免疫力,在面临相同情境时可以免受影响。
最后,请注意图中连接压制失败和心智程序缺陷的双箭头弧线。当压制失败发生时,必定意味着有冲突性信息或是习得规则试图挑战自主心智发起的反应。如果个体已习得与类型一加工反应不同的备择信息或是备择规则,但依然犯了错误,这种情况就是压制失败。如果由于相关的心智程序还没有习得,所以未能使用的话(或是已经习得,但是还未达到维持压制功能的必要水平),那么,这种情况下发生的错误就是心智程序缺陷而非压制失败。
根据压制失败和心智程序缺陷之间的关系,我们可以得出一个有趣的推论:心智缺陷越少,他所犯的错误归因于压制失败的可能性越大。拥有大量心智程序的人犯了错误,那么,这个错误多半要归咎于压制失败,而非心智程序缺陷。当然,压制失败和心智程序缺陷之间的界限并不明晰。一个已经学会的规则在需要时却没有派上用场,这种情况就是压制失败。随着规则的掌握程度不断下降,到达某个临界点时,个体所掌握的规则不足以压制类型一反应,这时候所犯的错误就该归咎于心智程序缺陷了。还记得第 9 章开篇介绍的小约翰·肯尼迪飞机失事事件吗?假设肯尼迪熟知夜间飞行的各种规则,但却没能在紧急事件中使用这些规则以战胜本能的生理和动作反应。我们将这种行为归类于压制失败。如果肯尼迪并不了解夜间飞行的规则和技术,那么他在飞机即将坠落时所做出的那些无用的挣扎之举就属于心智程序缺陷了。
据图 12-2 的分类,我把本书中已讨论过的思维加工方式和思维谬误列于表 12-1 中。例如,第一列的三个 X 表示默认使用自主心智,分别是:生动性效应、情感替代和冲动性联结思维。默认加工最为生动的刺激是认知吝啬鬼回避类型二加工的一种常用方式。与之相类似,在有某种显著情绪的情境中,个体会默认使用情感效价。情感替代(affect substitution)是认知吝啬鬼的惯用伎俩——属性替换的一种特殊形式,即用一个简单的问题替换掉一个复杂问题。请回想一下第 6 章中提到的“球拍与球问题”(一个球拍和一个球共计花费 1.1 美元,球拍的价格是 1 美元,请问球的价格)以及莱维斯克难题(杰克正看着安妮,但是安妮正看着乔治)。人们在这两个问题上所犯的错误,就是冲动性联结思维吝啬倾向的典型例证。在这类错误中,被试致力于寻找任何可以避免类型二加工的简单联结(比如在莱维斯克难题中,被试把安妮的状态未知与“无法判断”这个答案之间建立了联结)。
表 12-1 列出的第二类思维谬误是过度依赖带有焦点偏差(倾向于简单结构模型倾向的偏差)的连续性联结认知。这一类谬误常常发生于个体处于新异情境中,必须使用类型二加工时。框架效应(“框架的基本原理是个体被动地接受给定形式”,卡尼曼,2003a)是其中的一个典型示例。被试以呈现给他 / 她的框架作为思维焦点,以此为出发点展开接下来的思考,而不是考虑以备择框架为思维出发点,因为后者需要有更多的认知资源。
表 12-1 列出的第三类思维谬误是压制失败。这一类思维谬误在第 9 章充分讨论过,包括:信念偏差效应(“玫瑰是生物”三段论推理)、忽略分母(爱泼斯坦设计的橡皮糖任务)、自我控制难题(延迟满足)。另外,电车难题所体现出的道德判断困境也属于这一类思维谬误。
表 12-1 还列出了两种由于缺乏概率相关知识而导致的心智程序缺陷,包括联结谬误(conjunction errors)和非因果关系的基础概率使用。接下来列出的是偏差盲点。所谓“偏差盲点”是指个体认为自己与他人相比,更不容易受到思维偏差的影响。偏差盲点出现的原因主要在于人们持有不正确的通俗心理学理论。他们错误地认为,通过有意识的内省,可以觉察到自己的思维偏差。事实上,多数社会和认知偏差都是在无意识中发生的。
由多因素共同决定的理性思维谬误 表 12-1 列出的好几个理性思维谬误都不是由单一因素决定的,而是在多种因素的共同作用下发生的。举例来说,华生四卡选择任务就是一个多因素共同作用难题。导致这个任务最终失败的原因有多种可能的情况。第一,被试也许是未掌握备择思维的心智程序,他们不知道此时应该考虑到命题为假的情况,或是根据已知命题提出新的假设,而不是被动地根据给定的命题形式展开思考。第二,被试有可能受到了焦点偏差的影响,他们聚焦于给定的模型(元音字母背面必须是偶数)展开推理,而未能考虑到建构其他模型的可能性。以上两种原因在表 12-1 中由相应位置的 X 表示。
另一个由多种因素共同决定的思维谬误是我方立场偏差。造成这种偏差的首要原因毫无疑问是污化心智程序(“自我”概念使人们倾向于以有利于自己的方式思考周围的世界)。不过,焦点偏差在这个谬误的发生过程中也起到了一定的作用。焦点偏差的基本原理是基于最容易构建的心智模型进行信息加工,那么,还有什么比基于自己的经验和信念构建心智模型更为容易呢?焦点偏差有别于自利心智程序。从动机角度来看,焦点偏差产生的初衷并不是为了提升自尊或是提高个人价值。焦点偏差只不过是想节省一些认知资源和计算能力。然而,在绝大多数情况下,达到节省资源目的的主要方式就是鼓励从我方视角构建心理模型。由于我方立场偏差是在自利动机驱动下的“自我”心智程序和计算能力驱动下的焦点偏差的共同作用下发生的,因此,我方立场偏差也是多因素共同决定的思维谬误。
情感预测谬误也是由多因素共同决定的思维谬误。情感预测是指人们准确预测哪件事情可以让我们变得高兴的能力。过去十几年的研究结果表明,人们的情感预测能力出人意料得差。预测哪一件事情会让我们变得开心是非常困难的,因此,人们常会做出让我们变得不快乐的决定。另外,人们还常常会低估自己对幸运或不幸运事件的适应能力。导致人们会高估不幸事件带来负面心情的原因之一是他们的通俗心理理论(个体解释自己行为的个人化理论)存在缺陷。他们没有考虑到不幸事件发生之后的合理化和自卫性思维(“我其实不想要这个工作”,“同事告诉我说领导对年纪大的员工有偏见”)。关于自己心理的通俗理论没有给这些因素足够的权重,因此,人们没有料到自己的保护性心理机制会将不幸事件带来的不愉快一扫而光。
另一个导致情感预测谬误的重要原因是焦点偏差。情感预测领域的研究者研究了锚定干扰对乐观预期的影响。例如,球迷会高估他所支持的球队获胜后两天自己的快乐程度。他们做预测时,通常会先聚焦于焦点事件——赢得比赛,并对自己赢球后的心情进行模拟,再把这种心情投射到未来两天。然而,比赛后两天会发生很多很多事情,这些事情可能会以多种方式减少人们的快乐(绝大多数事件都不可能像赢球事件一样令人高兴)。由于在想象中构建这些事情需要耗费大量的认知资源,所以认知吝啬鬼干脆把这些事件从想象模型中排除掉了。在一项被大量引用的研究中,大卫·施卡德(David Schkade)和丹尼尔·卡尼曼发现,来自密歇根和加利福尼亚这两个不同地域的人生活满意度基本一致。可是,研究者让他们预计另外一个州被试的生活满意度时,密歇根和加利福尼亚的被试都认为加利福尼亚人民的生活满意度会更高一些。在进行比较判断时,被试把生活的一个方面——天气视作焦点。但实际上,天气并不是生活满意度的重要影响因素(工作前景、经济状况、社交生活以及另外 5 项因素对生活满意度的影响力均排在天气前面)。诚如施卡德和卡尼曼所说:“你关注的重点,并没有你想象的那么重要。”如表 12-1 中所示,情感预测谬误是焦点偏差和通俗心理理论共同作用下的产物。
斯波克先生难题:来自自主心智的输入缺失 神经学家安东尼奥·达马西奥(Antonio Damasio)在他的著作《笛卡尔的错误》中,提到了一位著名的患者——艾略特。艾略特年轻有为,事业成功,是同龄人中的佼佼者。他的婚姻生活也非常幸福,在家中他是一个好丈夫、好爸爸。艾略特一帆风顺的生活在某一天戛然而止。他开始受到头痛的困扰,工作时无法集中注意力。经过医学检查后发现,导致他头痛的罪魁祸首是脑中的肿瘤。后经手术将肿瘤成功切除,但在手术过程中他的额叶皮层腹正中区不幸受到了损伤。
手术后,艾略特在智力测试中依然成绩优异,一系列的神经心理学测试结果也均在正常范围内。简而言之,大量证据表明艾略特的算法心智功能完好。然而,唯一的坏消息就是:他的生活犹如一团乱麻。
痊愈出院后艾略特重返工作岗位,但他在工作上的表现和手术前判若两人。做事情分不清主次,收到了无数次来自上司的警告,但他却不能根据领导的批评调整自己的行为,最终丢了工作。被解雇之后,艾略特投身于各种商业冒险中。艾略特将自己的所有存款都投资到某个项目中,最终投资失败,艾略特宣告破产。他的婚姻生活也状况频出。与老婆离婚后,他与一位刚刚建立恋爱关系的女性闪婚,之后又迅速离婚。艾略特在申请社会保险残障补偿失败后,来到了达马西奥医生的办公室。
为何经过了大量神经心理学测试,历经了如此漫长的时间,艾略特的问题才被发现呢?达马西奥做出了如下解释:“之前,我太过关注艾略特的智力水平了。”实际上,艾略特的智力并无大碍,而是情绪方面出现了问题。“他具备正常生活工作所必需的知识、注意力和记忆;他的语言能力与正常人无异;可以进行数学计算;能够厘清抽象问题的逻辑。导致他频频做出重大决策失误的只有一点:体验情绪的能力发生了改变。”艾略特的一系列表现是斯波克先生难题的典型案例。斯波克是电影《星际迷航》的男主角之一,他在电影中被塑造成一个情绪冷漠迟钝的人。艾略特在决策方面遇到的问题源于他缺少自主心智情绪模块的调控信号(regulatory signals)。考虑到艾略特的智商较高,因此他缺少理性的表现可被认为是理性障碍,但与我们已讨论过的几类思维谬误有所不同。
基于对艾略特等类似病患的观察,安托万·贝沙拉(Antoine Bechara)和达马西奥的研究团队开发了一项评估此类问题的实验室任务,即艾奥瓦赌博任务(Iowa gambling task)。该任务模拟了背侧前额叶受损患者在真实世界中所面临的困境,即在涉及奖励与惩罚又充满了不确定性的环境中,对无法进行精确计算的情境进行概率估计并做出决策。
达马西奥认为,背侧前额叶受损的个体似乎缺乏用评估性效价标记积极和消极后果的情绪系统,另外,他们在相似情境再次出现时,无法再次产生类似的情绪效价。自主心智参与的理性管理有两种可能的犯错方式。第一种是之前讨论过的压制失败。在压制失败情境中,行为主要受到来自自主心智的信号控制,类型二加工未能发挥作用。第二种涉及自主心智的行为管理出现错误,其背后的原理与第一种截然相反。在这种情况下,自动化、快速的目标管理缺失,由于自动化模块(比如情绪)的约束功能缺失,类型二加工面临着概率信息大爆炸。行为管理缺少原始但高效的自动化信号协助,无法按照轻重缓急为后续行动排出先后顺序。这一类行为管理失败的原因并非是自主心智的参与太多,而是太少。
艾略特案例中展现的斯波克先生问题是理性障碍的典型案例。如果一个人从未有过因肿瘤或突发性事故导致的脑损伤,也会受到斯波克先生问题的困扰吗?越来越多的证据表明,斯波克先生类型的理性障碍不仅仅存在于临床案例中(可观测到的背侧前额叶皮层损伤)。很多智力测试正常但存在行为管理问题的人在艾奥瓦赌博任务上的行为管理表现都差强人意。例如,与相同智商水平的普通人相比,海洛因成瘾者在艾奥瓦赌博任务上做出了对自己更不利的选择。我的研究团队深入研究了存在行为适应问题的青少年(多次被停学)非临床样本在艾奥瓦赌博任务上的表现,结果发现,多次接受学校停学处理的学生在智商方面与控制组学生并不存在显著性差异,但他们在艾奥瓦赌博任务上做出了更差的选择。另有一些研究发现了没有明显脑损伤但却在艾奥瓦赌博任务上表现糟糕的被试群体,比如病理性赌徒。神经心理学的研究表明,很多心理障碍都是由自动化监控活动缺陷导致的,而这种缺陷与个体的智力水平毫无关联,比如述情障碍(难以识别情绪)和精神分裂症。
现在为大家介绍更为完整的理性思维谬误分类。如图 12-3 所示,6 个分类分别对人类的非理性思维和行为提供了解释。每一类都在一定程度上与智力相互独立,都可能是导致理性障碍发生的原因。
在解决完全析取推理问题时(比如莱维斯克问题),需要个体进行认知表征去耦化,并通过去耦表征(算法心智的重要操作,也是智力测验的核心内容)对所有可能的情况进行计算。不过,为了保证答案的正确性,个体需要准确识别使用完全析取推理的情境。在此过程中,个体必须避免启发式反应,比如:“哦,既然我们不知道安妮是否已婚,那么这个问题的答案是无法确定的。”
热压制和冷压制讲起。前者指的是对情绪、本能驱力和短期诱惑的压制(对应“热”认知的类比)。后者指的是对内化的规则、达尔文进化模块、类型一加工倾向等驱力的压制(对应“冷”认知的类比)。
在热压制领域,最有名的莫过于对儿童延迟满足的研究。心理学家沃尔特·米歇尔(Walter Mischel)首创了延迟满足的研究范式,该范式有很多种变式,其核心程序如下:研究者提供与年龄相匹配的奖励物(玩具、零食等),儿童被告知他有可能获得小奖励(一块棉花糖)也有可能获得大奖励(两块棉花糖)。实验房间中有一个可以用来呼叫实验员的铃,实验员离开房间后,儿童可以选择一直等待,直到实验员再次返回房间,获得大奖励;儿童也可以选择按铃呼叫实验员,但中途按铃的儿童只能获得小奖励。此研究的因变量是儿童的等待时间。
罗德里格斯、米歇尔的研究发现,儿童的智商与等待时间之间的相关仅为 0.39。大卫·丰德(David Funder)和杰克·布洛克(Jack Block)使用相似的实验范式,结果表明智商与等待时间的相关为 0.34(该结果与预期一致,即这个任务范式同时涉及反省心智与算法心智,在排除智商带来的变异之后,人格测量结果可以预测等待时间)。成年人在该任务上的表现与儿童研究结果一致。
在现实世界中,压制失败与智商之间仅存在中等程度的相关。例如,人们常常从压制失败的角度对吸烟、赌博、毒品等成瘾行为进行分析。伊丽莎白·奥斯汀(Elizabeth Austin)和伊恩·迪尔瑞(Ian Deary)对爱丁堡动脉纵向研究(Edinburgh Artery Study)的数据进行了深入分析,试图探索智商是否是吸烟和酗酒的长期保护性因素(假设智商有助于保持对自主心智的压制)。结果发现,高智商并不能确保某个人今后不会成为酒鬼。智商与吸烟之间仅有着微弱的相关。
前面我所说的“相关”皆是指具有统计学意义上的显著性,从相关值的绝对量来看,无论使用何种统计评估方法,都仅为中等相关。这就使得智力与成功压制自主心智之间的分离成为可能,智力与“冷”压制失败之间的关系也是相似的状况。第 9 章讨论过的信念偏差任务(“玫瑰是生物”)和爱泼斯坦橡皮糖任务(从两只碗中抽取红色糖,两只碗中红色糖的比例分别是 1/10 和 8/100)是两个典型的冷压制任务。信念偏差任务中成功压制与智力之间的相关值范围在 0.350.45 之间;爱泼斯坦任务中两者的相关在 0.250.30 之间。相关关系具有统计学意义,但是两者之间的相关强度并不大,智力与成功压制两者之间的分离给理性障碍留下了很大的发挥空间。
依图 12-3 列出的顺序,导致理性障碍发生的第 5 个原因是决策时缺乏恰当心智程序(认知规则、策略、知识和信念系统)。由于心智程序缺陷与教育程度低下和经验缺失有关,由此我们推测这一点与智力之间关系较为密切。然而,虽说智商越高学到的知识越多,但是,与理性有关的知识(以及思维倾向)并非全部来自于书本,很多都是源自生活。任何层次的教育系统都没有专门开设心智程序课程。心智程序方面受教育水平不一致,意味着有些聪明人并没有机会学会批判性思维的重要方面。认知能力与概率推理任务之间的相关(绝对值)约为 0.250.35,与假设检验任务的相关约为 0.200.25,与贝叶斯推理之间的相关约为 0.05~0.20。如此低的相关度说明智力与理性思维所需的心智程序缺失之间存在不一致。
图 12-3 列出的第 6 类是污化的心智程序。由于高智商个体的学习能力更强,他们理应获得更多的心智程序,进而产生更多的理性思维。可是,学习能力强并不能帮助高智商群体免受污化心智程序的影响。许多寄生信念系统的概念都很复杂。例如否认屠杀、一夜暴富的金融骗局、伪避税骗局等,都是复杂寄生心智程序的典型案例。鉴于这些心智程序的复杂性,只有足够聪明的人才能够被诱惑。对金融骗局被害者特点进行分析的研究支持了该推测。伪科学信念流行于高智商群体中的现象也支持了这个观点。
需要引起注意的是,有些研究者并不把米歇尔任务中未能完成延迟等待视为压制功能失败,而是将其归为自主心智的奖励折扣机制出现障碍(Sonuga-Barke,2002,2003)。如果这个解释是对的,那么被试在完成米歇尔任务范式时的糟糕表现就应该被视为斯波克先生问题,而不是压制失败。
自主心智思维倾向通常依赖于习得的心智程序进行压制,当压制失败时,主要原因在于缺乏实例化的心智程序。在这种情况下,只是了解但还没有充分掌握的心智程序是造成问题的根源所在。例如,完全析取推理(disjunctive reasoning)指的是在解决推理任务时,当需要做出判断或选择解决方案时,充分考虑到所有可能的选项。
思考备选假设的倾向也是一种具有高度普遍性的心智程序策略。同样地,它的实施方式也很简单。许多研究试图教会人们思考 P(D/~H)(即考虑到备选假设时观测数据发生的可能性)或者给予简单的指导使人们形成思考备选假设的习惯。在相关情境下,人们大量练习对自己说“想一下事物的对立面”。这种心智程序策略不注重计算能力,因而对很多人而言,它是很容易学会的。一些研究表明,练习“想一下事物的对立面”的思维有助于防止许多启发式和偏见文献中提到的思维错误,包括但不局限于:锚定偏见、过度自信效应、后视偏差、确信偏差和自利偏差。
其他具有高度普遍性的策略可能更容易学习,尤其是对低智商人群而言。例如,心理学家彼得·格尔维茨(Peter Gollwitzer)讨论了一个具有极高普遍性的行为策略——使用执行意图。个体有意识地说出某一行为序列的顺序(“当 X 发生时,我就做 Y”),这时执行意图就形成了。通常来说,在语言固定情境属性的帮助之下,哪怕只在少数场合诱发这种思维,也足以使其在自主心智中建立起来。最后,研究表明形成心理目标(无论这些目标是否有执行意图)的认知策略,就算很简单也是行之有效的。例如,人们如果被要求设定一个心理目标(“为自己设定一个具体的、有挑战性的目标”)而不是一般的鼓励性指令(“尽你最大努力”),那么他们在任务中会表现得更好。
因为我们很难预测什么东西会让自己幸福,所以我们常常做出降低自己幸福感的选择。例如,人们常常会低估自己适应幸运和不幸事件的速度。我们的想象力无法预知未来。心理学家丹·吉尔伯特(Dan Gilbert)引用证据表明,在这种情况下,一种干预策略就是使用代理人物(surrogate)——那些正在经历一些事的人,你正在模拟他们的快乐(或悲伤)。例如,如果你想知道自己对“空巢综合征”是什么反应的话,你只要问问那些家里最后一个孩子都外出上大学的人,而不是想象在这种情况下自己会有什么反应。如果你想知道自己支持的队伍在比赛第一轮就被打败你的感受会是怎样的话,你只要问问那些队伍刚刚被打败的人就知道了,而不是独自想象。人们往往不愿意用这一机制,因为他们觉得自己的独特性会使内心的猜测比那些正在经历这些事的人的实际体验更准确。人们只是怀疑别人的经历是否同样也适用于自己。这是一种自我中心主义,类似于我之前讨论过的我方立场信息加工。吉尔伯特告诉他的读者:“如果你和大多数人一样的话,那么和大多数人一样,你不知道自己和大多数人一样。”(2006)
如果认知吝啬鬼容易受框架影响,对最生动的刺激做出反应,接受给定的默认值,那么世界上任何有能力决定这些因素的人都会影响认知吝啬鬼的行为。或许这么说,事态似乎有点严重。但是,事情也许有积极的一面。是的,控制着我们环境的恶人可能会利用认知吝啬鬼。然而,控制着环境的善良人会帮助我们——使我们避免做出非理性行为,又不必改变认知的基本观点。积极的一面是,对某些认知问题而言,或许改变环境比改变人类更容易些。因为在一个民主国家中,我们在一定程度上控制着我们的环境,我们理应决定重建社会环境,使得环境中的人更加理性。
例如,在关于器官捐献率的一个跨国研究中,埃里克·约翰逊(Eric Johnson)和丹尼尔·戈德斯坦(Daniel Goldstein)发现瑞典有 85.9% 的人同意捐献器官。然而,在英国这一比例仅为 17.2%。瑞典人和英国人之间有什么不同之处可以解释器官捐献态度上如此大的差别呢?是不是瑞典是一个集体主义更强的国家,而英国的个人主义更强呢?是不是瑞典人比英国人更无私呢?也许看看美国的器官捐献率我们就能找到引起差异的线索。美国的器官捐献率大约是 28%,和英国的捐献率很相似,比起瑞典就差远了。这种差异会不会是以英语为母语的国家和不以英语为母语的国家之间的差别呢?
想必现在你已经在猜测这个问题的答案了。这些国家器官捐献率的差异与各国人民之间的心理差异无关。瑞典、英国和美国之间的差异与对捐献器官的态度也无关。这些差异是由于不同国家关于捐献器官的政策差异造成的。瑞典、比利时、法国、波兰、匈牙利同意捐献器官的比例高达 95% 以上——器官捐献的默认选项是“同意”。在制定了这种政策的国家里,人们预先假定同意捐献自己的器官,但也可以采取一些行动选择退出器官捐献(通常是在驾驶证上做个标记)。相反,在美国、英国、德国、丹麦与荷兰,同意捐献器官的比例不足 30%,在这些国家器官捐献的默认选项是没有明确同意即不捐献,要想在身故后器官捐献必须做出明确的说明。
简言之,瑞典和英国之间的巨大差异不是由人民造成的,两国人民都是认知吝啬鬼,或许认知吝啬的程度都差不多。最大的差别是政策形式的差异。作为认知吝啬鬼,两国人民在很大程度上都受到默认启发式的影响。默认的选择黏性很大,因为它具有巨大的影响力。约翰逊和戈德斯坦得出结论:人们认真考虑过这个问题,又没有受到政策默认选择的影响时,大约 80% 的人更愿意成为器官捐献者,这一比例非常接近瑞典和其他预先假定同意捐献器官的国家的比例。1995 年以来,美国有超过 45000 人死于等待获得器官移植的过程中。我们只需要对捐献者做决定的环境进行一些不伤害任何人的改变(默认同意的国家人民都可以选择不参加器官捐献),就能拯救成千上万人的性命。认知吝啬鬼的倾向已经造成上万人丢失性命。然而,这种悲剧是可以预防的。在这种情况下,最佳的预防措施就是改变环境而不是改变人,因为改变环境更容易些。
正是许多和器官捐献类似的例子促使法律理论家卡斯·桑斯坦(Cass Sunstein)和经济学家理查德·塞勒(Richard Thaler)提倡一种他们称为“自由专制”(libertarian paternalism)的新政策。他们认为的专制是政府应该努力引导人民做出对自己有利的选择。自由指的是确保任何政策变化都保留了完全的选择自由。怎么可能做到既引导人民的选择又不干预选择自由呢?答案就是利用认知吝啬鬼的倾向。更确切地说是控制环境中操纵认识吝啬者行为的那些因素——默认选项和框架。
现在让我们看看一则实施了自由专制的案例。美国人并没有为他们的退休准备好充足的资金,他们没有存储足够的钱。许多人没有参与现有的 401(k)和其他的退休储蓄计划。塞勒和同事什洛莫·贝纳茨(Shlomo Benartzi)推广了一系列养老金计划改革,可以拯救数百万人退休后的生活——否则退休生活很可能被早年因理性障碍做出的决定毁掉。他们的改革正在走向立法阶段,许多企业也开始采用他们的改革计划。
塞勒和贝纳茨的改革包括几个步骤,每个步骤都涉及绕过人们做 401(k)决定时常犯的思维错误。第一个步骤是针对大多数大型企业的员工必须要先选择参不参加养老金计划这一情况。如果他们什么也没做(没有填相关的表格)的话,那么他们就没有参加这个计划。问题首先出在这儿,许多员工没有报名参加。然而,在塞勒 / 贝纳茨的计划中,所有员工都默认参加这个计划,如果要退出的话,必须选择填一份表格。因此,他们的计划利用了认识吝啬鬼的默认偏差。
员工在做 401(k)决定时犯的第二个错误是他们(和雇主)出资额的分配。塞勒 / 贝纳茨计划再次利用了默认偏差,该计划自动平均分配共同基金里雇员的出资额,从而确保了初期分配的多样化。塞勒和贝纳茨建议的另一种改革涉及让员工增加他们在 401(k)计划中的出资额,他们要求员工提前同意把未来工资上涨的部分作为额外的 401(k)出资额。这个策略确保了员工不会因为多交了钱而损失了什么,因为他们的工资不会减少。当然,在两种情况下出资额都是一样的,但是根据前景理论,这种方法让员工不那么厌恶该计划。
塞勒和贝纳茨推出了一项名为“明日多储蓄计划”(Save More TomorrowTM,简称 SMarT),该计划把文中讨论的许多改革方案都付诸实施了。惠普和飞利浦等大公司已经采用该计划。我们讨论的关键意义在于,该计划表明可以通过改变环境而不是改变人,进而预防不理性行为。SMarT 计划说明因认知吝啬鬼倾向而产生的一些难题可以通过改变环境加以解决。
即使是在缺少某种心智程序的案例中,我们有时候也能通过改变环境使得有严重心智程序缺陷的人觉得轻松点。
只要对环境稍作改变就能预防理性思维出问题。需要环境帮助的一类更广泛的问题是人们的自制力问题。人们饮食无节制、超支、喜欢拖延、抽烟和酗酒。解决这些自制力问题的办法有两种:改变人和改变环境。人们努力增强自己的“意志力”——也就是内在的自我控制力;或者,试图改造环境,使得对自制力的需求减少了(自动化系统压制)。一个常见的策略就是事前承诺。人们加入自动储蓄计划,那么他们就不会超支。他们提前把饭打包,那么就不会多吃。他们牢记最后期限,那么就不会拖延。事前承诺代表了我们有意识地重建环境,从而使其更有助于我们的自制努力。
有证据表明事前承诺的方法是成功的——人们反省时会认为用这种方法产生的结果更理性。大量证据表明事前承诺对省钱很有效。在其他领域也有一些证据提示这种方法的有效性。丹·艾瑞里(Dan Ariely)和克劳斯·韦滕布罗赫(Klaus Wertenbroch)发现,自愿为自己设定最后期限的学生比那些不愿设限的学生在学习上的表现更好。但是有趣的是,外部强加的最后期限比起自愿接受的更能促进学习。
为什么控制体重那么棘手?原因之一就是人们找到各种方式不让自己事前承诺一定会采取最有效的减肥方法之一,即摄入更少的卡路里(另一种当然是锻炼)。减肥食品业通过不断暗示除了吃得少一点还有其他方式可以减肥,助长了这种趋势。例如:只吃蛋白质不吃糖类食品;吃正确的碳水化合物食物而不是错误的碳水化合物食物;避免食用高血糖食物;食用索诺玛减肥餐中最有营养的食物中的前十种;只吃寿司,等等。所有这些方法都偏离了问题的关键:问题在于吃下去的每份食物的大小,傻瓜!正如《消费者报告》(Consumer Reports)(2007 年 6 月)给出的忠告:“减肥的准则没有变,就是要少摄取卡路里,多消耗卡路里。”
在吃这方面,没有人强迫我们,也和自由意志无关,只是外部环境让我们陷入了病态。这一点正是保罗·罗赞(Paul Rozin)和同事在尝试研究法国悖论时所要重点说明的。尽管法国人的胆固醇水平更高,他们的饮食中也含有更多的脂肪(饱和的和不饱和的),但是法国人的心脏病死亡率却远远低于美国。美国人心脏病死亡率更高的原因可能是美国人更肥胖。的确,尽管法国人饮食中的脂肪含量比美国的要高,但相比美国 22.3% 的肥胖率,法国的肥胖率仅为 7.4%。罗赞和同事认为美国人尽管食用更少的脂肪但却更胖,原因之一就是每一份美式食物的尺寸都更大。
罗赞和同事从许多资料中找到证据证明事实就是如此。他们研究了两国都有的连锁店中每份食物的大小。例如,他们发现美国麦当劳的每份食物要比法国的大 28%。美国必胜客的每份食物要比法国的大 42%。在 11 种用于对比的食物里,美国每份食物要比法国的大 25%。罗赞和同事研究了美国《烹饪乐趣》和法国《我会烹饪》杂志中相同 7 道荤菜的菜谱。《烹饪乐趣》中菜谱配料比《我会烹饪》中的平均要多 53%。他们还调查了家庭中每份食物的大小,发现美国晚餐中的烤宽面条要多 19%。美国雀巢 Crunch 巧克力比法国的大 41%,一瓶酸奶的容量要多 82%。在参与调查这些食品中,美国每份食物要比法国食物平均大出 37%。显而易见,在美国,我们在减肥这件事上应该提供更多环境上的帮助。
罗赞和同事对单位偏见进行了研究:人们往往会吃掉某种食品的一份,不管这一份有多大,或者人们往往会吃掉某种食品的一个单位,不管这个单位有多大。在一些不同的研究中,研究人员在公共场所放了一些小甜点(如巧克力豆、爱心糖果、椒盐脆饼干)。当甜点份量增至 2 倍或 4 倍的时候,人们并没有根据食物份量减少摄入量。相反,单位尺寸更大时,人们吃得更多。一个简单的环境解决方案——每份食物都小点——就能在很大程度上帮我们解决美国的肥胖难题。
知识理性和非理性的方方面面。例如:不一致的概率评价倾向;知识评价中的过度自信倾向;忽视基础概率倾向;不对假说进行证伪的倾向;试图解释随机事件的倾向;自利性个人评价的倾向;用我方偏见评估证据的倾向;忽视备选假设的倾向,等等。
对工具理性和非理性的方方面面进行研究的。例如:决策过程中的完全析取推理能力;由于框架效应而体现出的不连贯偏好(inconsistent preference);表现出默认偏见倾向;用情感替代困难评价的倾向;过分看重短期利益而忽视长期利益的倾向;选择容易受到生动刺激影响的倾向;决策容易受到不相关情境影响的倾向,等等。
·心理学家找到呈现统计信息的不同方法,从而使我们在医疗问题上和在任何涉及统计学的情况中,做出更理性的决定。
·认知心理学家发现根据默认偏差对呈现信息的方式稍作改变,就能大大增加器官捐献率,从而拯救上万人的生命。
·美国人每年花数百万美元咨询如何投资股市,然而遵循决策理论的一些简单原则就能获得更高的投资回报。这些原则有助于人们避免会减少他们的投资回报的认知偏见,例如对概率事件过度反应、过度自信、痴心妄想、后视偏差、误解概率。
·研究决策的科学家发现,人们很不擅于评估环境风险。这主要是由于生动性偏见在很大程度上主导了人们的判断。人们可以做出改进,小改进能够带来大变化,因为差劲的评估有可能会影响国家政策。例如,导致决策者实施政策 A(每救一条性命耗费 320 万美元),而不选择政策 B(每救一条性命只需 22 万美元)。
·不同专业领域的心理学家开始清楚地指出支撑病态赌博行为的认知幻想:伪科学信念得出的结论、信念固着、对概率事件过度反应、认知冲动、对概率的误解——这些行为每年破坏了成千上万人的生活。
·认知心理学家研究了人类在判断时的过度自信效应——人们常常由于过于乐观而错误地估计自己今后的表现。心理学家研究了可以帮助人们在自我监控过程中避免这些问题,从而使人们更从容地规划未来(过度自信的人会遇到更多令人不悦的意外事件)。
·社会心理学研究发现,控制生活中选择的数量是获得幸福的关键之一,限制选择常常使人们更幸福。
·对养老金计划的组织和管理方式稍作改变就能使数万人的退休生活更加舒适。
·在决策领域中,概率推理或许是最常被探讨的问题,科学家研究了许多认知改革(如减少忽视基础概率)对优化法庭决策过程的作用。对概率的欠佳思考,已经阻碍了司法公正。