- 本书所获赞誉
- 序言
- 关于判断与决策的有趣研究
- 快思考,慢思考
- 主要内容
- 第一部分 系统 1,系统 2
- 第 1 章 一张愤怒的脸和一道乘法题
- 第 2 章 电影的主角与配角
- 第 3 章 惰性思维与延迟满足的矛盾
- 第 4 章 联想的神奇力量
- 第 5 章 你的直觉有可能只是错觉
- 第 6 章 意料之外与情理之中
- 第 7 章 字母 B 与数字 13
- 第 8 章 我们究竟是如何作出判断的?
- 第 9 章 目标问题与启发性问题形影不离
- 第二部分 启发法与偏见
- 第 10 章 大数法则与小数定律
- 第 11 章 锚定效应在生活中随处可见
- 第 12 章 科学地利用可得性启发法
- 第 13 章 焦虑情绪与风险政策的设计
- 第 14 章 猜一下,汤姆的专业是什么?
- 第 15 章 琳达问题的社会效应
- 第 16 章 因果关系比统计学信息更具说服力
- 第 17 章 所有表现都会回归平均值
- 第 18 章 如何让直觉性预测更恰当有效?
- 第三部分 过度自信与决策失误
- 第 19 章 知道 的错觉
- 第 20 章 未来是不可预测的
- 第 21 章 直觉判断与公式运算,孰优孰劣?
- 第 22 章 什么时候可以相信专家的直觉?
- 第 23 章 努力养成采纳外部意见的决策习惯
- 第 24 章 乐观主义是一柄双刃剑
- 第四部分 选择与风险
- 第 25 章 事关风险与财富的抉择
- 第 26 章 更人性化的前景理论
- 第 27 章 禀赋效应与市场交易
- 第 28 章 公平性 - 经济交易的参照点
- 第 29 章 对结果可能性的权衡
- 第 30 章 被过分关注的罕见事件
- 第 31 章 能带来长远收益的风险政策
- 第 32 章 心理账户是如何影响我们的选择的?
- 第 33 章 评估结果的逆转
- 第 34 章 善用框架效应,让生活更美好
- 第五部分 两个自我
- 第 35 章 体验效用与决策效用的不一致
- 第 36 章 人生如戏
- 第 37 章 你有多幸福?
- 第 38 章 思考生活
- 附录 A 不确定性下的判断:启发法和偏见
- 附录 B 选择、价值以及框架
- 致谢
偏离预测方向的直觉
让我们再来看看下面这个老问题:
朱莉现在是一名州立大学 4 年级的学生。她 4 岁就能流畅地进行阅读。她的平均绩点(GPA)是多少?
熟悉美国教育体制的人很快就能得出一个数字,且这个数字通常在 3.7 或 3.8 左右。为什么呢?原因在于,系统 1 的几个机制共同参与了预测。
·人们会探寻证据(朱莉的阅读能力)与预测目标(她的平均绩点)之间是否存在因果关系。这种关系可能不是直接的。在这个例子中,很小就能阅读与较好的平均绩点都是学术天分的表现,必然会存在某种联系。你(你的系统 2)可能会否定朱莉在高中曾经赢得钓鱼比赛或是在举重比赛中表现良好的说法。这个过程被有效地一分为二。系统 1 能够摒弃那些无关或是错误的信息,但却无法弥补证据中相对较小的瑕疵。因此,直觉性预测对证据的实际预测结果几乎毫无感觉。一旦发现某种关联,例如朱莉很小时就能阅读,眼见即为事实原则就会发挥作用:你的联想记忆会快速自动地运用可利用信息编出最恰当的故事。
·另外,证据的评估与相关规范联系紧密。4 岁时阅读能力就很强的孩子早熟吗?什么样的名次或者说百分制下得多少分才能与这样的能力相符?与这个孩子作比较的人群(我们称之为参照人群)也没能明确说明这一点,但与我们平时说话所遵循的规则相同。如果即将毕业于这所大学的某个人被赞为“相当聪明”,你几乎不必问:“当你说他‘相当聪明’时,脑子里想到的是哪些参照人群呢?”
·下一部分包括替代和快速配对。对于儿童时期认知能力这个并不周密的证据进行评估的问题被替换成关于她大学平均绩点问题的答案。朱莉的平均绩点和她小时候就能阅读这项能力的百分比值是相同的。
·这个问题明确规定答案必须在平均绩点的范围内,这也就要求另一个强度匹配的运作,即将你对朱莉的学术成就的总体印象与能证明她本人天赋的平均绩点这一证据匹配起来。最后的步骤是转化,将你对朱莉学术水准的印象转化为相应的平均绩点。
通过强度匹配得到的预测结果与支持这个预测的证据一样极端,会导致人们面对两个不同的问题却给出相同的答案:
朱莉的早期阅读能力成绩是多少(百分制)?
朱莉的平均绩点是多少(百分制)?
到目前为止,你应该很容易就能看出所有这些运作都是系统 1 的特点,我按照不同步骤依次将它们列在这里,当然联想记忆的大量激活并不遵循这一顺序。你应该将这种记忆大量激活的过程想象为以下几步:由信息和问题激发起联想记忆,然后自我反馈,最后选定最具连贯性的合理性方案。
我与阿莫斯曾经在一个实验中要求受试者对 8 位大学新生的相关描述作出判断,这个描述是由一名辅导老师根据对新班级的访谈而写成的。每个描述由 5 个形容词组成,如下例所示:
聪明、自信、笃学、勤奋、好问
我们问了受试者下面两个问题:
这个描述对你关于学术能力的想法有多大影响?
你认为这些关于新生的描述令你印象深刻的可能性有多大(百分制)?
这两个问题要求你根据自己的标准对新生进行描述,将自己的描述与辅导老师的描述进行对比,进而评估上述描述。你自身的评判标准存在着重大影响。虽然你根本不知道自己如何形成这一评判标准的,但你对这条描述承载的热情程度非常清楚:辅导老师认为这个学生是优秀的,但还算不上是最棒的,因为我们还有很多比“聪明”程度更深的形容词(杰出、有创造力),也有很多比“笃学”程度更深的词(博学的、渊博的),更有许多程度超过“勤奋”的形容词(积极的、力求完美的)。由此可以推测,(该生)成绩很有可能在前 15%,但不太可能在前 3%.人们在类似的判断中得到的结果出奇地一致,至少在相同文化背景的人群中是这样。
我们问了实验中另一组受试者不同的问题:
你估计这个学生的平均绩点是多少?
新生中取得较高平均绩点的学生占多大比例?
你需要再三思考才能看出这两组问题的微小差别。这种不同本该很明显,但事实却并非如此。第一组问题只要求你作出评估,第二组问题则与第一组不同,包含了很大的不确定性。这个问题指的是在大学一年级期末的真实表现。自访谈后,这一年发生了什么呢?你怎样才能以 5 个形容词来预测这个学生在大学第一年的真实表现呢?如果这只是辅导老师本人通过与该生的访谈而作出的平均绩点预测,那么她的预测会准确无误吗?
这项研究旨在比较两个判断结果(百分比成绩):受试者通过评估一个案例中的描述做出的判断结果(百分比成绩)和另一个案例中的最终预测结果。结论很明显:两个判断结果完全相同。尽管两组问题不同(一组关于该生的描述,另一组关于该生未来的学术表现),但受试者将这两个问题看成了一个。与朱莉的例子相同,受试者并没有将对未来的预测和对当前信息的估测区别开来—预测与估测相匹配。这也许是我们得到的能证明替换存在的最佳证据。当人们按要求预测时,他们总会将预测替换为对所描述问题的估测,而且没有意识到他们回答的问题并不是那个被问到的问题。这个过程证明预测时会存在系统偏见;他们完全忽略了一点,即应该回归到平均值上来。
在以色列国防军队服役期间,很长时间我都待在一支部队里,这支部队通过一系列面试及实战测试来挑选后备实训军官。成功预测的特定标准为这些人在军官学校的最终成绩。这些等级评定的效度非常低(我会在后面的章节详细说明)。若干年后,这支部队仍旧存在,而彼时我已成为一名教授,并且正与阿莫斯合作研究直觉性判断问题。我一直与这支部队的工作人员保持着密切联系,于是便请他们帮个忙。除了他们通常使用的评估候选人的评分系统以外,我还让他们猜测每个学员将来在军官学校中可能得到的分数。他们搜集了几百份这样的预测。所有作出这些预测的军官都知道学校给学员评分时用的是字母评分系统,也知道所有学员得到的 A、B、C 各等级的近似比例。实验结果令人惊讶:预测出来的 A 和 B 的频率几乎与学校的结业成绩中的 A、B 等级的频率等同。
这些发现提供了一个引人注目的例子,这个例子涉及替代和强度匹配两个方面。作出预测的军官完全将这两个任务混淆在一起了:
·他们平时的任务是对候选人在该部队的表现作出评价。
·我让他们执行的任务是对候选人的未来成绩作出切实预测。
他们运用强度匹配将自己的评级简单地转换为军官学校的评分结果。由于无法解决预测中存在(相当大)的不确定性,他们的预测又一次完全无法回归(平均值)。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论