返回介绍

士兵测评的有效性错觉

发布于 2024-10-13 17:31:49 字数 2806 浏览 0 评论 0 收藏 0

几十年前,我在以色列军队服兵役。当时我已经拿到了心理学学士学位。做了一年的步兵军官后,我被派到部队的心理科,有时候我需要对士兵进行测评,看其是否完成了军官培训科目。我需要在炎炎烈日下站很长时间,观察几组汗流浃背的士兵是如何解决问题的。我们使用的测评方法是英军在“二战”时开创的方法。

其中一项实验名为“挑战无领导小组”,这项实验是在障碍训练场上进行的。参加实验的有 8 个士兵,他们之间互不相识,军衔都被摘掉了,身上只贴数字标签以作鉴别,他们的任务是将地上的原木拖过 6 英尺高的墙。全组所有人都必须翻过墙且原木既不能碰到地也不能碰到墙,而且任何人都不许碰到墙。一旦出现了任何一种违规情况,他们就必须报告并从头再来。

解决这个难题的办法有很多种。其中一个普通的办法就是让几个人像拿钓鱼竿一样按照一个角度把住原木,其他人通过原木攀缘而爬过墙。或者让一些士兵踩着他人的肩膀跳过墙去。到最后一个人时,其他人就要按照一个合适的角度把住原木,此时原木的一端是悬空的。待他跳上原木后,翘起原木,让他滑过去,最后安全地跳到墙的另一面。在这一环节中,失败是常有的事,他们需要不断从头再来。

我和另一位同事看着他们训练,记录下是谁在指挥其他人,是谁想要领导却被断然拒绝,还要关注每位士兵的合作精神对整个小组能力的影响情况。我们发现有人固执,有人顺从,有人自负,有人脾气暴躁,有人执著,而有人其实就是个逃兵。有些人的想法一旦被小组否定了,他们就不再那么努力了。然而,从这些人身上我们有时也能看出些斗志来。我们还观察了这几位士兵面对危机时的反应:有人会斥责那个导致整组沦陷的人,有人在这个精疲力竭的小组还需从头再来时打头阵。在这个测验的压力下,我们感到其中每个人都展现了自己的天性。我们对参加实验的每位士兵性格的印象就如同天空的颜色那样真切、那样深刻。

观察过这些士兵完成的几次测试之后,我们就要对他们的领导能力和决策能力进行总结,而且要用分数表示谁在军官训练中是合格的。我们深入讨论了每一次测试,回顾了我们对他们的印象。这项任务并不难,因为我们感觉自己已经看到了每位士兵的领导能力。有些人像是强势的领导;有些人则比较懦弱,或是自大愚蠢;还有的人虽然平庸但并非无药可救。有几个人看上去非常软弱,只能将他们从军官候选人行列淘汰出去。在将对每位士兵的多角度观察汇集成连贯的情况时,我们对自己的评估很有信心,感觉我们所看到的一定是他们未来的发展。当小组遇到麻烦时,敢于担当并带领团队翻过障碍墙的士兵当时就是整个队伍的领导者。那么,他在训练中或战场上会如何表现呢?显然大家都会猜测他会像在翻墙训练中表现的那样非常高效,其他的推测都不太可能,因为现实情况就摆在我们眼前。

因为对每位士兵表现情况的印象总体来看是清晰且明确的,所以我们在正式预测时也没有任何迟疑,脑海中通常只会出现一个分数,几乎不会有心生疑虑的情况,也极少有自相矛盾的情形。我们很愿意这样断言:“这个士兵根本不行”,“这个比较平庸,但还算可以吧”,或者说“他将来肯定是个人才”。我们觉得没必要质疑自己的预测,也没有必要过低预测或者只说些模棱两可的话。但如果有人对这份测评结果提出质疑,我们也愿意承认,会说“当然了,什么都可能发生”。之所以愿意承认这一点,是因为不管我们对参与测试的每位士兵的印象如何,都十分确信这份预测在很大程度上是无效的。

事实表明,我们根本就无法对参与测试的士兵的表现进行准确的预测。每隔几个月我们就会召开一次反馈会议,会上我们会了解这些新兵在军官训练学校的表现,并将我们(对他们)的评估和管理过他们一段时间的教官的意见进行对比。每次得到的结果几乎总是相同的:我们对这些士兵在军官学校的表现进行预测的能力弱到完全可以被忽略掉。我们的预测也就比凭空猜想强点,但也强不了多少。

得知这个令人气馁的消息后,我们颇沮丧了一段时间。但这里毕竟是军队,无论管不管用,都要按程序办事,都要服从命令。第二天又来了一批士兵。我们把他们带到障碍训练场地,看着他们面对着墙,抬起原木,几分钟后他们的真正本性就暴露无遗,和之前那些士兵一样明显。我们预测的质量虽低,但这个事实对于我们怎样评估士兵完全没有影响,对于我们在判断和预测士兵能力时的信心也影响甚微。

这一切都很令人关注。之前预测失败的主要原因本应动摇我们对士兵进行评判的信心,然而我们的信心并未因此受到影响。这个原因本来也可能使我们适度调低自己的评价,但我们却并未受其影响降低评价。其实我们知道自己的预测只比随意乱猜强一点,一般情况下都是这样,但我们仍然感觉自己所作的每一项预测都是有根据的,而且我们还会按照自己的预测行事。这让我想起了缪勒–莱耶错觉,我们都知道图中的线段是等长的,但一眼看过去仍然觉得它们长度不同。我对这种类推非常感兴趣,所以特意为我们的这种体验创造了一个术语:有效性的错觉。

我曾经发现了自己的第一个认知错觉。

几十年后的今天,我仍能从那个旧时的故事中看到自己思考的许多中心问题,这些问题也是本书的写作主题。我们对这些士兵未来表现的期望是替代问题的一个典型实例,更堪称典型性启发式的经典案例。我们曾经在一个模拟情景下观察一个士兵的行为,一小时后我们感觉自己能判断该士兵在面对军官训练和无领导作战的挑战时会有何表现。我们的预测是完全不能回归的,我们仅仅根据非常薄弱的证据就推测失败或者大获全胜,没给自己留一点余地。这也正是“眼见即为事实”的典型实例。

我们对观察到的行为印象深刻,对最终决定这些人作为军官表现的因素却知之甚少,而且没有什么好办法来体现这种无知。

回顾我们所做的一切,其中最值得注意的就是我们对一般原则的认识,即我们无法作出预测,这种认识对我们对个体案例的信心没有什么影响。现在我明白了,我们的反应与尼斯贝特和博吉达的学生们在得知大多数人不会去帮助疾病发作的陌生人时的反应相似。他们当然会相信自己看到的统计数字,但在判断视频中看到的某人会不会去帮一个陌生人时,基础比率并没有影响他们的判断。就像尼斯贝特和博吉达说的那样,人们通常不愿从一般情况中推断特殊情况。

对某个判断的主观自信并不是对这个判断正确概率的合理评估。自信是一种感觉,它能反映出某条信息和处理该信息时所体现的认知放松的一致性。由衷地承认不确定性乃明智之举,但如果有人声称自信满满,只能说明他在脑海里已经构建了一个连贯的情节,当然这个情节未必是真实的。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文