判断校准
出自 MBA智库百科(https://wiki.mbalib.com/)
目录 |
判断校准是一种效度,用来测量人们对概率的判断值和事实上该事件的发生率之间的一致程度,也就是主观概率与客观概率的一致性,也有不少学者把它归为偏差(bias)范畴。在决策判断任务本身不存在正确答案或难以找到对错的衡量标准时,判断校准往往被作为衡量决策判断结果好坏的重要标准。
判断校准可以通过校准曲线来直观地表示主观判断概率和事实概率之间的关系。如图1所示,校准曲线与斜率为1的对角线越接近,表明判断校准越好。因研究目的和设计的不同,判断校准可能有不同的形式。例如,判断校准研究中常用的自信程度诱发技术,要求被试设定答案的置信区间,判断校准就以决策者所提供的这一系列区间,套住了正确值的次数百分比来表示。另有一些研究是通过某种公式直接计算出判断校准值的,如Wright等计算判断校准的公式为:
其中,N为总的反应次数,rt为在某个特定反应类中的主观判断概率,ct为此特定反应类中的事实概率。
在判断校准的研究中,决策者的行动结果往往是与决策者的能力联系在一起的,这种对自己行动结果的估计,实际上反映了决策者的的自信程度。如果概率判断值普遍比事实概率大,就表现为过分自信(Over-confidence);如果主观概率判断值比事实概率小,就表现为过低自信(Under-confidence)。大量研究表明决策者有过分自信的倾向。Fischhoff等认为,过分自信是概率判断中一种固有的稳定的倾向,它在不同性别、不同知识结构的专家和新手之间都存在,很少受指导语、反应模式等的影响。也有研究发现判断校准是在过低自信和过高自信之间变化的。图1的校准曲线就反映了被试过分自信的倾向。Murphy(1973)给出了一个公式
从以上讨论可以看出,过分自信与过低自信是判断校准的两种表现形式,判断校准和过分自信(或过低自信)都反应主观概率和事实概率之间的偏离,过分自信与过低自信是有方向的向量,判断校准是标量。
以往关于判断校准影响因素(包括任务特征、个体差异等)的研究,往往比较孤立,只在单因素上讨论判断校准的变化,缺乏系统性的研究。例如,判断任务的难度越大,过分自信倾向就越明显;具有未来不确定性导向的判断任务,同那些关于以往或现在知识的判断任务相比,决策者的过分自信的程度要低得多;在对未来不确定性判断中,时间跨度越大,过分自信程度越高,等等。
通过对以往相关文献的查阅和研究,本文提出了准系统模型(见图2)。模型从决策过程的角度,为判断校准的研究提出了一个理论框架,因素之间的关系都是来源于现有的研究结果,具有一定的构思严密性。相对来说,模型是比较注重过程的,特别是提出了目前研究中很少涉及的过程因素,如后果感知、判断策略等。
影响判断校准的因素[1]
从70年代以来,大量研究探讨了各种因素对判断校准的影响,主要围绕这样一个主题:专家和新手的判断校准到底有什么差异,其它因素如任务特征等在其中又起到什么作用。
- 1.专长因素
专长(expertise)对判断校准的影响众说不一。研究发现,气象预报员有很高的判断校准,而医生诊断的判断校准却非常低[。学者们也从不同的角度,试图对此作出解释。Lichtenstein等认为天气预报是一种有及时明确反馈的重复性判断任务,而病情诊断却不是。Christensen-Szalanski、Bushyhead和Keren认为医生和天气预报员面对的是不同的损益矩阵或损失函数。医生所感知的判断后果的严重性显然要比气象预报员所感知的要大得多。这说明决策后果感知对判断校准具有直接的的影响,也许是一个值得深入研究的问题。
许多研究表明,专家判断的质量并不理想,在一般情况下和新手差不多,而且他们的判断校准也很差。然而另有一些研究,如Keren认为专家具有非常好的判断校准,新手却表现出相当高的过分自信倾向。Spence也发现在一定的条件下,专家的判断校准比新手的好,他认为判断校准的质量在很大程度上取决于重复性概率判断的认知过程的相似性。这些结论莫衷一是,各持己见,其实,细细研究便可以发现,这些结论都有其特定的任务背景的,因此我们认为不能离开判断任务特征来简单地讨论专家与新手的差异。
- 2.任务结构特征因素
大量的研究认为,不管是普通知识型的判断任务还是特定知识型的判断任务,人们的概率判断都有过分自信的倾向,而在普通知识型的判断任务中,过分自信表现得更加明显。研究者发现,当任务的难度很低时,判断校准表现为过分自信;当判断任务的难度很高时,判断校准表现为过低自信。Spence发现了一个有趣的现象:当任务难度很低时,新手的判断校准要优于专家,但是随着任务难度的提高,情况就发生了变化,到达了一定难度,专家的判断校准就优于新手了。
任务特征中一个比较重要的概念是项目的关联性(relatedness)。关联性意指各项目都来源于同一数据库,并且先前事件的信息对随后事件的判断有影响作用。Keren认为项目关联性越高,判断校准就越有提高的可能性。他认为关联性着重于认知和诱发过程的特征。如果项目之间是关联的,就有可能建立起推理过程和长远概率概念。而对于非关联的判断任务,每个项目的判断都需要不同的认知过程。关联性与反馈有密切的联系,它直接影响到反馈和判断校准的关系。
- 3.反馈
从现实和动态-多阶段决策的角度出发,就不能不考虑反馈因素。反馈的作用是多方面的,一方面使被评估者更清楚的了解自己的工作状况,另一方面又能促使评估者不断地修正以前的判断。
有的研究认为结果反馈和判断校准之间没有直接的作用关系,Fischer发现反馈对判断校准质量没有显著的影响。也有一些研究支持或部分支持了“结果反馈能提高判断校准”的假设。采用计算机测试的条件下,反馈能降低过分自信倾向,提高判断校准;但在纸笔测试的条件下没有这种效应。Zakay认为通过人与计算机的“交互对话”能使被试更加注意反馈信息,从而有助于不断地调整自己的判断,提高判断校准。
Subbotin对任务特征、反馈等因素综合比较后,发现结果反馈对判断校准的影响与判断任务本身的关联性有很大的关系:在判断任务的项目彼此关联的情况下,如果本来偏差为过低自信,那么结果反馈能减少判断偏差,增强判断校准;如果本来偏差表现为过分自信,则结果反馈既不能减少偏差,也不增强判断校准。在这两种情况下结果反馈所产生的判断校准的增量是有显著差异的,这种现象称为结果反馈的不对称效应(asymmetricaleffect)。
从上面讨论可以发现,只在单因素上研究判断校准往往没有比较一致的结论,然而从人员专长和任务特征的交互作用的角度,却往往会得出令人感兴趣的结果。
Spence曾较系统地研究了专长(专家和新手)与任务特征之间的交互作用。研究结果发现,决策支持或任务难度降低边际地提高了判断校准。一般来讲,专家对准确值的估计比新手要好(以准确值和正确值之间的偏差来表示),但是他们过窄的置信区间又导致其判断校准比新手差。值得一提的是,该研究揭示了一个有趣的现象:如果缺少决策支持或提高任务难度,专家的判断校准就会变得优于新手,任务难度的提高将使专家比新手更为有利。新手明显的低估了任务的复杂性,他们的准确性和置信区间都减少,导致更差的判断校准。而专家的判断校准受任务复杂性的影响不显著,原因在于经验能唤起他们的问题解决策略。
- 4.决策判断策略
在概率判断中,有几种特定的启发式策略,如代表性启发式、可获取性启发式和锚定调整启发式等。“代表性启发式”(representativeness heuristic)策略指人们只是根据事件与心理模型(如例子、分类、角色等)的对应程度来估计概率,如用“A和B的相似程度”来推断A属于B的概率。“可获取性启发式”(availability heuristic)策略是指在信息处理时,只关注那些使人获得强烈印象的信息,而忽略其它信息。“锚定-调整启发式” (an-choring and adjustment heuristic)策略指由于人的信息处理能力的有限性,决策者常常将最先的反应作为一个“判断锚”,然后进行调整,而所谓的调整往往是在这个“判断锚”的附近。在许多情况下,这确实是一种行之有效的策略。然而,这个“判断锚”下在哪里非常关键,直接影响到决策判断的校准度,“判断锚”往往与决策者的知识、经验等密切关联的。有的学者认为专家有可能过分地依赖其锚定值而不太会进行过多的调整,进而影响其判断的校准度。
这些启发式策略,不论专家还是新手,都会在判断中无意识地运用。以往的研究还只是更多地停留在描述决策者(不论其专长水平如何)普遍的启发式策略的问题,而对“在特定的任务特征下,专家或新手会更多地采取什么样的策略,对判断结果(如判断校准)又有什么样的影响”这个问题目前还研究得很少。
人是权变的策略使用者(contingent strategy user),会随着任务的变化而采用不同的策略,以便其信息处理的需要能保持在人的认知资源所能解决的限度之内。显然,知识和经验在此过程中发挥了重要作用,只是目前对这种作用的机理的了解还不深入。从理论上来讲,之所以为“专家”,不仅在于他们具有丰富的专门知识和经验,更在于他们能有效地采取和调整合适的策略来完成任务。在决策中究竟运用何种优势策略,这不仅与决策者的认知风格以及其它个体特征有关,而且在很大程度上取决于决策任务信息特征和整个决策情景,其中,决策任务信息的组合方式,起着关键的作用。比如,任务的关联性、决策支持和反馈将促进和有助于决策者的判断调整;反馈的提供,可能会使新手更多地采用“假设-检验”的策略;等等。
- ↑ 李劲松,严进.判断校准及其影响因素[J].心理学动态,1999,04