- 本书所获赞誉
- 序言
- 关于判断与决策的有趣研究
- 快思考,慢思考
- 主要内容
- 第一部分 系统 1,系统 2
- 第 1 章 一张愤怒的脸和一道乘法题
- 第 2 章 电影的主角与配角
- 第 3 章 惰性思维与延迟满足的矛盾
- 第 4 章 联想的神奇力量
- 第 5 章 你的直觉有可能只是错觉
- 第 6 章 意料之外与情理之中
- 第 7 章 字母 B 与数字 13
- 第 8 章 我们究竟是如何作出判断的?
- 第 9 章 目标问题与启发性问题形影不离
- 第二部分 启发法与偏见
- 第 10 章 大数法则与小数定律
- 第 11 章 锚定效应在生活中随处可见
- 第 12 章 科学地利用可得性启发法
- 第 13 章 焦虑情绪与风险政策的设计
- 第 14 章 猜一下,汤姆的专业是什么?
- 第 15 章 琳达问题的社会效应
- 第 16 章 因果关系比统计学信息更具说服力
- 第 17 章 所有表现都会回归平均值
- 第 18 章 如何让直觉性预测更恰当有效?
- 第三部分 过度自信与决策失误
- 第 19 章 知道 的错觉
- 第 20 章 未来是不可预测的
- 第 21 章 直觉判断与公式运算,孰优孰劣?
- 第 22 章 什么时候可以相信专家的直觉?
- 第 23 章 努力养成采纳外部意见的决策习惯
- 第 24 章 乐观主义是一柄双刃剑
- 第四部分 选择与风险
- 第 25 章 事关风险与财富的抉择
- 第 26 章 更人性化的前景理论
- 第 27 章 禀赋效应与市场交易
- 第 28 章 公平性 - 经济交易的参照点
- 第 29 章 对结果可能性的权衡
- 第 30 章 被过分关注的罕见事件
- 第 31 章 能带来长远收益的风险政策
- 第 32 章 心理账户是如何影响我们的选择的?
- 第 33 章 评估结果的逆转
- 第 34 章 善用框架效应,让生活更美好
- 第五部分 两个自我
- 第 35 章 体验效用与决策效用的不一致
- 第 36 章 人生如戏
- 第 37 章 你有多幸福?
- 第 38 章 思考生活
- 附录 A 不确定性下的判断:启发法和偏见
- 附录 B 选择、价值以及框架
- 致谢
判断与锚定
在许多情况下,人们都会通过初始值来确定最后的答案。初始值或起始点,可能是从问题形成之时得到的提示,也可能是在稍微计算之后得到的结果。但无论是前者还是后者,其调整都不会太过充分。不同的起始点会产生不同的估测,都会偏向于初始值。我们将这个现象称为锚定。
不充分的判断。在某个证明锚定效应的实验中,受试者需要估测不同的数值,并以百分比来进行评定(例如非洲国家在所有联合国成员国中所占席位的百分比)。在猜测每一个数值的时候,受试者面前一个范围为 0~100 的幸运转盘都会旋转一次。受试者首先需要说明,转盘指针指向的数值比起实际值来说是高了还是低了,然后,再将转盘的指针拨向自己估计的值。不同的小组面对的是不同的初始数字,而这些随机的数值对估计有着巨大的影响。以非洲国家占联合国成员国的百分比为例,转盘指针指向 10 的小组估测的中值是 25,而指针指向 65 的小组估测的中值是 45,其中,10 和 65 就被受试者视为起始点。对于估计要精确的要求也并没能削弱锚定效应的影响。
锚定不只是在受试者被给予相关起始点的情况下发生,当受试者依赖于未完成的计算结果进行估测时,这种情形也会发生。关于直觉性数值估计的研究就说明了这一效应:在黑板上写出一些算式,让两组高中生在 5 秒之内估计结果。其中一组学生估计下面这个算式的结果
8×7×6×5×4×3×2×1
另一组学生估计以下算式的结果
1×2×3×4×5×6×7×8
想要快速回答这样的问题,人们可能会先计算几步,然后再通过外推或调整得出结果。由于判断的根据并不充分,这样的过程就会导致低估。另外,就前几步的计算结果而言(从左到右进行计算),降序序列得到的结果肯定会比升序序列的结果大。那么,你就会认为第一个序列的结果大于第二个序列的结果。这两种判断都得到了证实。对于升序序列中值的估计为 512,对降序序列估测的中值是 2 250,但正确的答案应该是 40 320.
评估连续事件与非连续事件的偏差。在巴希勒最近的一次研究中,受试者需要选两个事件中的一个来打赌。该研究应用了三种类型的事件:(1)简单事件,例如从一半是红球一半是白球的口袋中取出一个红球;(2)连续事件,例如从 90%是红球、10%是白球的口袋中连续 7 次抽取红球;(3)非连续事件,例如从 10%是红球、90%是白球的口袋中连续取球 7 次,至少取出一个白球。在这个问题中,相比简单事件的那个赌(概率是 0.50),绝大多数受试者都更愿意打连续事件的那个赌(概率是 0.48)。而相比不连续事件(概率是 0.52),受试者又更愿意打简单事件的赌。因此,在这番比较中,大多数受试者倾向于打的赌都是相对不太可能发生的事件。这样的选择模式证明了一个普遍的发现。对赌的选择以及对概率的判断的研究表明:人们易于高估连续事件的概率,低估非连续事件的概率。这样的偏见是由锚定效应引起的。基本事件的概率(即任意某个阶段的成功)提供了估测连续事件以及非连续事件概率的自然起始点。因为从出发点进行调整显然不会充分,对于上述两种事来说,最后的估测都会与基本事件的概率相接近。请注意,某个连续事件的整体概率会比其中每个基本事件的概率低,而非连续事件的整体概率会比其中每个基本事件的概率高。由于锚定的影响,在连续的问题中,整体概率会被高估;在非连续问题中,整体概率会被低估。
评估复合事件的偏见在计划的情境中尤其明显。成功完成某个任务(例如推广一个新产品)具有连续的特征:要想某个任务成功,该任务中包含的每一个事件就都必须发生。如果需要发生的事件数量众多的话,即使每个事件都很有可能发生,其整体成功的概率也可能会很低。高估连续事件概率这个普遍的倾向会使人们在评估某个计划成功的可能性或能否按时完成时过度乐观,但却缺乏根据。相反,非连续结构总会遭遇风险性的评估。一个复杂的体系,例如核反应或人的身体,如果其中的某个部分出现问题,整个体系就会出现故障。即使每个部分失败的可能性都很小,但若包含很多部分,那么整体失败的概率也可能会很高。因为锚定效应,人们会倾向于低估复杂系统失败的概率。因此,我们有时可以从事件的结构中推测出锚定偏见的方向。连续事件的链式结构会导致高估,非连续事件的漏斗式结构会导致低估。
评估主观概率分布时的锚定。在决策分析中,专家时常需要以概率分布的形式来表示他们对某个数值(例如某一天的道琼斯指数)的信念。这样的分布通常是根据专家选择的不同数值构建的,而这些数值与其主观概率分布的百分位相对应。例如,判断者可能会被要求挑选出一个数字 X90.这样的话,他认为这个数字将会超过道琼斯指数的主观概率就是 0.90.也就是说,他选择数字 X90,所以愿意接受道琼斯指数不会超过这个数值的比率是 9 ∶1.通过几个这样对应于不同百分位数的判断,我们可以构建出道琼斯平均指数的主观概率分布。
通过搜集多个不同数值的主观概率分布,还有可能测试出判断者的度量或校准是否合适。如果待估量值的真实值有 II%分布在某位受试者规定的 XII 值之下,那么这个受试者就在一系列问题中进行了恰当的(或外部)校准。例如 1%的量值,其真实值应该分布在 X01 之下,即 X99 之上。因此,98%的问题,真实值应该在 X01 到 X99 的置信区间内。
几位研究人员已从大量的判断中观察到许多量值的概率分布。这些分布表明了其与恰当的校准之间巨大且系统的偏差。在多数研究中,30%的问题,其待评估量的真实值或小于 X01,或大于 X99.也就是说,受试者设定的置信区间过小,与他们关于待估量的知识所能证明的相比,反映出了更大的确定性。经验不足与经验老到的受试者都存在这种偏差,而引入合适的积分规则虽能为外部校准提供刺激,但也不能彻底消除偏差。这种效应至少部分是因锚定引起的。
例如,为了选择 X90 作为道琼斯指数,人们会首先想到自己对道琼斯指数最佳的估测,然后将这个数值上调。如果这个调整和大多数其他调整一样是不充足的,那么 X90 就不会是极端的。同样的锚定效应在选择 X10 时也会发生,这时,人们就会将最佳估测向下调整。所以,X10 到 X90 之间的置信区间将会太小,而待估量的概率分布就会更紧密。一种程序能够系统地改变主观概率分布,使最佳估测值不作为初始值,这也支持了这种解释。
某个给定的量(比如道琼斯指数)的主观概率分布可以通过两种不同的方法得以实现:(1)要求受试者选择与自己的概率分布的特定百分位数相符合的道琼斯指数;(2)要求受试者估测出的真实值超过特定数值的概率。这两种方法在形式上是等同的,因此应该产生相同的分布。然而,这两种方法体现出的是不同锚定下不同的判断模式。在方法(1)中,自然的起始点是人们对变量的最佳估测。此外,在方法(2)中,受试者可能将锚定点定在了问题中给定的数值上。或者,他可能将锚定定位在相等的概率上,即 50–50 的概率,因为这是估测可能性通常的起始点。无论哪种情况,方法(2)得到的概率应该不会像方法(1)那样极端。
为了对比这两种方法,研究人员给一组受试者 24 个量值(例如从新德里到北京的空中距离),并要求他们在每一个问题上估计 X10 或 X90.另外一个组的受试者得到的是第一组受试者对 24 个数值中每个评估结果的中值。他们被要求评估每个给定的数值超过相应量值的真实值的概率。在没有任何偏见的干扰下,第二组受试者应该提取出和第一组相同的概率,即 9 ∶1.然而,如果使用 50%的概率或给出的数值作为锚定,第二组的概率也应该更不极端,即接近于 1 ∶1.事实上,第二组给出的所有问题的概率中值都是 3 ∶1.当对两组受试者的判断进行外部校准时,发现第一组的受试者太过极端,这与早前的研究结果相符合。他们估测的发生概率为 0.10 的事件实际上有 24%发生了。相反,第二组受试者太过保守。他们认为平均概率为 0.34 的事件实际发生的概率只有 26%.这些结果说明了校准的程度取决于引导的程序。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论