信度繫數
出自 MBA智库百科(https://wiki.mbalib.com/)
目錄 |
信度繫數是指觀測分數中可歸因於被測者的真分數中變動的比例部分;同時,也可定義為兩份平行測驗之間的相關。
信度繫數的意義[1]
信度繫數可以解釋為總的方差中有多少比例是由真實分數的方差決定的,也就是測驗的總變異中真分數造成的變異所占的比例。例如,當信度繫數為0.80時,可以說實得分數中有80%的變異是真分數造成的,僅20%是來自測驗的誤差。在極端的情況下,如有rxx=1.00,那麼表示完全沒有測量誤差,所有的變異均來自真實分數;若有rxx=0,則所有的變異和差別都反映的是測量誤差。應該註意的是,信度繫數的分佈0.00~1.00的正數範圍,代表了從缺乏信度到完全可信的所有狀況。我們可以利用不同信度反應的誤差來源,來推測真分數變異所占的比例。假設對100個應聘者以兩個月的時間間隔先後施測一個創造力測驗的A/B兩個複本,所得的等值性與穩定性繫數為0.70,根據被試對每個複本的反應計算出分半信度為0.80(先計算每個複本的分半相關係數,將二者平均後再用斯皮爾曼一布朗公式校正)。同時,讓另一個評分者隨機抽取50份卷子另外評分,得到評分者信度為0.92。然後,就可以對這三種方法所產生的誤差變異進行分析,如下倆表所示。
信度繫數的標準[1]
一個測驗究竟信度多高才合適,才讓人滿意呢?當然,最理想的情況是信度為1,但實際上是辦不到的。根據多年的研究結果,一般的能力測驗和成就測驗的信度繫數都在0.90以上,有的可以達到0.95;而人格測驗、興趣、態度、價值觀等測驗的信度一般為0.80~0.85或更高些。一般原則是:當rxx<0.70時,測驗不僅不能用於對個人作出評價或預測,並且不能作團體比較;當0.70≤rxx<0.85時,可用於團體比較;當rxx≥0.85時,才能用來鑒別或預測個人成績或作為。另一原則是:新編的測驗信度應高於原有的同類測驗或相似測驗。
信度繫數的應用要求[2]
毫無疑問,信度繫數的作用就是用來評價人員測評工具的穩定性,如果一個人員測評所得的結果不具備穩定性,那麼依據測評結果所做出的人事決策就具有很大的隨機性,達不到科學決策的目的,所以在應用人員測評時必須考慮測評工具的信度,低信度的測評項目絕對不能作為人員測評的測量工具。在人員測評的實踐中,一般要求能力與成就測評的信度繫數應達到0.90以上,性格、人格類的測評應該達到0.70以上。
提高信度繫數的方法[1]
當測驗信度沒有達到所要求的標準時,可以通過增加測驗的長度,提高測驗的信度繫數。一般來說,在一個測驗中增加同質的題目,可以使信度提高。因為測驗越長,測驗的測題取樣或內容取樣越有代表性,被試的猜測因素影響也越小。但是,增加測驗長度的效果應遵循報酬遞減率原則,測驗過長是得不償失的,有時反而會引起被試的疲勞和反感而降低可靠性。假如我們希望用增長測驗的方式提高測驗的信度以達到某種理想值,可以通過斯皮爾曼一布朗公式的導出公式計算最少應增加的題數。
式中:K——改變後的長度與原長度之比;rxx——原測驗的信度;rkk——測驗長度是原來的K倍時的信度估計。
例:一個包括40個題目的測驗信度為0.80,欲將信度提高到0.90,問至少需要增加多少題目?
即要取得0.90的信度,測驗長度應為原來的2.5倍,也就是需增加60個題目。