全球专业中文经管百科,由121,994位网友共同编写而成,共计435,825个条目

判斷校準

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

目錄

什麼是判斷校準

  判斷校準是一種效度,用來測量人們對概率的判斷值和事實上該事件的發生率之間的一致程度,也就是主觀概率客觀概率的一致性,也有不少學者把它歸為偏差(bias)範疇。在決策判斷任務本身不存在正確答案或難以找到對錯的衡量標準時,判斷校準往往被作為衡量決策判斷結果好壞的重要標準。

  Image:校准曲线图.png

  判斷校準可以通過校準曲線來直觀地表示主觀判斷概率和事實概率之間的關係。如圖1所示,校準曲線與斜率為1的對角線越接近,表明判斷校準越好。因研究目的和設計的不同,判斷校準可能有不同的形式。例如,判斷校準研究中常用的自信程度誘發技術,要求被試設定答案的置信區間,判斷校準就以決策者所提供的這一系列區間,套住了正確值的次數百分比來表示。另有一些研究是通過某種公式直接計算出判斷校準值的,如Wright等計算判斷校準的公式為:

  Calibration = \frac{1}{N} \sum_{t=1}^T n_t (r_t - c_t)^2

  其中,N為總的反應次數,rt為在某個特定反應類中的主觀判斷概率,ct為此特定反應類中的事實概率。

  在判斷校準的研究中,決策者的行動結果往往是與決策者的能力聯繫在一起的,這種對自己行動結果的估計,實際上反映了決策者的的自信程度。如果概率判斷值普遍比事實概率大,就表現為過分自信(Over-confidence);如果主觀概率判斷值比事實概率小,就表現為過低自信(Under-confidence)。大量研究表明決策者有過分自信的傾向。Fischhoff等認為,過分自信是概率判斷中一種固有的穩定的傾向,它在不同性別、不同知識結構的專家和新手之間都存在,很少受指導語、反應模式等的影響。也有研究發現判斷校準是在過低自信和過高自信之間變化的。圖1的校準曲線就反映了被試過分自信的傾向。Murphy(1973)給出了一個公式

  Over/Underconfdence = \frac{1}{N} \sum_{t=1}^T n_t (r_t - c_t)

  從以上討論可以看出,過分自信與過低自信是判斷校準的兩種表現形式,判斷校準和過分自信(或過低自信)都反應主觀概率和事實概率之間的偏離,過分自信與過低自信是有方向的向量,判斷校準是標量。

判斷校準的系統模型

  以往關於判斷校準影響因素(包括任務特征、個體差異等)的研究,往往比較孤立,只在單因素上討論判斷校準的變化,缺乏系統性的研究。例如,判斷任務的難度越大,過分自信傾向就越明顯;具有未來不確定性導向的判斷任務,同那些關於以往或現在知識的判斷任務相比,決策者的過分自信的程度要低得多;在對未來不確定性判斷中,時間跨度越大,過分自信程度越高,等等。

  通過對以往相關文獻的查閱和研究,本文提出了準系統模型(見圖2)。模型決策過程的角度,為判斷校準的研究提出了一個理論框架,因素之間的關係都是來源於現有的研究結果,具有一定的構思嚴密性。相對來說,模型是比較註重過程的,特別是提出了目前研究中很少涉及的過程因素,如後果感知、判斷策略等。

  Image:各因素对判断校准影响关系的准系统模型.png

影響判斷校準的因素[1]

  從70年代以來,大量研究探討了各種因素對判斷校準的影響,主要圍繞這樣一個主題:專家和新手的判斷校準到底有什麼差異,其它因素如任務特征等在其中又起到什麼作用。

  1.專長因素

  專長(expertise)對判斷校準的影響眾說不一。研究發現,氣象預報員有很高的判斷校準,而醫生診斷的判斷校準卻非常低[。學者們也從不同的角度,試圖對此作出解釋。Lichtenstein等認為天氣預報是一種有及時明確反饋的重覆性判斷任務,而病情診斷卻不是。Christensen-Szalanski、Bushyhead和Keren認為醫生和天氣預報員面對的是不同的損益矩陣損失函數。醫生所感知的判斷後果的嚴重性顯然要比氣象預報員所感知的要大得多。這說明決策後果感知對判斷校準具有直接的的影響,也許是一個值得深入研究的問題。

  許多研究表明,專家判斷的質量並不理想,在一般情況下和新手差不多,而且他們的判斷校準也很差。然而另有一些研究,如Keren認為專傢具有非常好的判斷校準,新手卻表現出相當高的過分自信傾向。Spence也發現在一定的條件下,專家的判斷校準比新手的好,他認為判斷校準的質量在很大程度上取決於重覆性概率判斷的認知過程的相似性。這些結論莫衷一是,各持己見,其實,細細研究便可以發現,這些結論都有其特定的任務背景的,因此我們認為不能離開判斷任務特征來簡單地討論專家與新手的差異。

  2.任務結構特征因素

  大量的研究認為,不管是普通知識型的判斷任務還是特定知識型的判斷任務,人們的概率判斷都有過分自信的傾向,而在普通知識型的判斷任務中,過分自信表現得更加明顯。研究者發現,當任務的難度很低時,判斷校準表現為過分自信;當判斷任務的難度很高時,判斷校準表現為過低自信。Spence發現了一個有趣的現象:當任務難度很低時,新手的判斷校準要優於專家,但是隨著任務難度的提高,情況就發生了變化,到達了一定難度,專家的判斷校準就優於新手了。

  任務特征中一個比較重要的概念是項目的關聯性(relatedness)。關聯性意指各項目都來源於同一資料庫,並且先前事件的信息對隨後事件的判斷有影響作用。Keren認為項目關聯性越高,判斷校準就越有提高的可能性。他認為關聯性著重於認知和誘發過程的特征。如果項目之間是關聯的,就有可能建立起推理過程和長遠概率概念。而對於非關聯的判斷任務,每個項目的判斷都需要不同的認知過程。關聯性與反饋有密切的聯繫,它直接影響到反饋和判斷校準的關係。

  3.反饋

  從現實和動態-多階段決策的角度出發,就不能不考慮反饋因素。反饋的作用是多方面的,一方面使被評估者更清楚的瞭解自己的工作狀況,另一方面又能促使評估者不斷地修正以前的判斷。

  有的研究認為結果反饋和判斷校準之間沒有直接的作用關係,Fischer發現反饋對判斷校準質量沒有顯著的影響。也有一些研究支持或部分支持了“結果反饋能提高判斷校準”的假設。採用電腦測試的條件下,反饋能降低過分自信傾向,提高判斷校準;但在紙筆測試的條件下沒有這種效應。Zakay認為通過人與電腦的“交互對話”能使被試更加註意反饋信息,從而有助於不斷地調整自己的判斷,提高判斷校準。

  Subbotin對任務特征、反饋等因素綜合比較後,發現結果反饋對判斷校準的影響與判斷任務本身的關聯性有很大的關係:在判斷任務的項目彼此關聯的情況下,如果本來偏差為過低自信,那麼結果反饋能減少判斷偏差,增強判斷校準;如果本來偏差表現為過分自信,則結果反饋既不能減少偏差,也不增強判斷校準。在這兩種情況下結果反饋所產生的判斷校準的增量是有顯著差異的,這種現象稱為結果反饋的不對稱效應(asymmetricaleffect)。

  從上面討論可以發現,只在單因素上研究判斷校準往往沒有比較一致的結論,然而從人員專長和任務特征的交互作用的角度,卻往往會得出令人感興趣的結果。

  Spence曾較系統地研究了專長(專家和新手)與任務特征之間的交互作用。研究結果發現,決策支持或任務難度降低邊際地提高了判斷校準。一般來講,專家對準確值的估計比新手要好(以準確值和正確值之間的偏差來表示),但是他們過窄的置信區間又導致其判斷校準比新手差。值得一提的是,該研究揭示了一個有趣的現象:如果缺少決策支持或提高任務難度,專家的判斷校準就會變得優於新手,任務難度的提高將使專家比新手更為有利。新手明顯的低估了任務的複雜性,他們的準確性和置信區間都減少,導致更差的判斷校準。而專家的判斷校準受任務複雜性的影響不顯著,原因在於經驗能喚起他們的問題解決策略。

  4.決策判斷策略

  在概率判斷中,有幾種特定的啟髮式策略,如代表性啟髮式、可獲取性啟髮式和錨定調整啟髮式等。“代表性啟髮式”(representativeness heuristic)策略指人們只是根據事件與心理模型(如例子、分類、角色等)的對應程度來估計概率,如用“A和B的相似程度”來推斷A屬於B的概率。“可獲取性啟髮式”(availability heuristic)策略是指在信息處理時,只關註那些使人獲得強烈印象的信息,而忽略其它信息。“錨定-調整啟髮式” (an-choring and adjustment heuristic)策略指由於人的信息處理能力的有限性,決策者常常將最先的反應作為一個“判斷錨”,然後進行調整,而所謂的調整往往是在這個“判斷錨”的附近。在許多情況下,這確實是一種行之有效的策略。然而,這個“判斷錨”下在哪裡非常關鍵,直接影響到決策判斷的校準度,“判斷錨”往往與決策者的知識、經驗等密切關聯的。有的學者認為專家有可能過分地依賴其錨定值而不太會進行過多的調整,進而影響其判斷的校準度。

  這些啟髮式策略,不論專家還是新手,都會在判斷中無意識地運用。以往的研究還只是更多地停留在描述決策者(不論其專長水平如何)普遍的啟髮式策略的問題,而對“在特定的任務特征下,專家或新手會更多地採取什麼樣的策略,對判斷結果(如判斷校準)又有什麼樣的影響”這個問題目前還研究得很少。

  人是權變的策略使用者(contingent strategy user),會隨著任務的變化而採用不同的策略,以便其信息處理的需要能保持在人的認知資源所能解決的限度之內。顯然,知識和經驗在此過程中發揮了重要作用,只是目前對這種作用的機理的瞭解還不深入。從理論上來講,之所以為“專家”,不僅在於他們具有豐富的專門知識和經驗,更在於他們能有效地採取和調整合適的策略來完成任務。在決策中究竟運用何種優勢策略,這不僅與決策者的認知風格以及其它個體特征有關,而且在很大程度上取決於決策任務信息特征和整個決策情景,其中,決策任務信息的組合方式,起著關鍵的作用。比如,任務的關聯性、決策支持和反饋將促進和有助於決策者的判斷調整;反饋的提供,可能會使新手更多地採用“假設-檢驗”的策略;等等。

參考文獻

  1. 李勁松,嚴進.判斷校準及其影響因素[J].心理學動態,1999,04
本條目對我有幫助0
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目投訴舉報

本条目由以下用户参与贡献

Lin,Mis铭.

評論(共0條)

提示:評論內容為網友針對條目"判斷校準"展開的討論,與本站觀點立場無關。

發表評論請文明上網,理性發言並遵守有關規定。

打开APP

以上内容根据网友推荐自动排序生成

下载APP

闽公网安备 35020302032707号