區分度

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

區分度（discrimination）

什麼是區分度^[1]

　　區分度，是指一個測驗題目能夠在多大程度上區分所要測量的心理品質，反映了測驗題目對心理品質區分的有效性。一個具有良好區分度的題目，在區分被測者時應當是有效的。能通過該項目或是在該項目上得分高的被測者，其對應的品質也較突出；反之，區分度較差的項目就不能有效地鑒別水平高或低的被測者。因此，區分度也叫做項目的效度，並作為評價項目質量、篩選項目的主要依據。

　　區分度的計算以被測者對項目的反應與某種參照標準之間的關係為基礎，其取值範圍是-1.00~+1.00。一般情況下，區分度應為正值，稱作積極區分，值越大則區分度越好；若區分度為負值，則為消極區分，說明這個題目有問題，應刪除或重新修訂；區分度為0，為無區分作用。

　　項目區分度（item discrimination）是指項目對不同水平的被試的區分程度。項目區分度分析可以分為兩種類型：一種是“項目效度”的分析，根據外部校標選取題目，適用於人格測驗；另一種是“內部一致性”分析，根據測驗總分選取題目，適用於教育成就測驗和能力傾向測驗。

[編輯]

區分度的相對性

　　1）採用不同的計算方法，區分度的值也有所不同。因此，在分析一份測驗題目的區分度時，對同一類型的題目須採用同一種計算題目區分度的方法，結果才好相互比較，進而篩選題目。

　　2）一個題目區分度的大小受被試團體異質程度的影響。被試團體越同質，同一題目的區分度值越小；若被試團體越異質，同一題目區分度則越大。因此，在說明題目區分度時總是針對某個具體的被試團體而言，離開具體的被試團體一般地、抽象地談題目的區分度是沒有任何意義的。

　　3）用相關法計算題目區分度的可靠性受樣本大小的影響。一般而言，樣本越大，區分度值越可靠。但樣本太大，反而增加計算量，也毫無實際意義，應適可而止。

　　4）區分度指數D值受分組標準的影響。在編製標準化測驗時，通常用370個被試作為預測樣本的容量，以27%作為分組標準，這樣高分組和低分組恰好各位100名被試，會給後面的計算帶來方便。

　　由於區分度具有相對性，很難確定一個絕對水平作為取捨題目的標準。在根據題目區分度來篩選題目時，總要考慮到測驗的目的和功能。於學科測驗而言，一般要求相關係數達到顯著性水準，或區分度指數D值在0.20以上，國際上優秀題目的區分度要求達到0.40以上。若是一個選拔人才的測驗，題目的區分度要儘量高一些。美國教育與心理測量學家艾伯（L. Ebel）根據區分度指數提出一個評價題目優劣的標準。^[2]

區分度指數（D）	試題評價
0.40分以上	非常優良
0.30-0.39	良好
0.20-0.29	尚可，須修改
0.19以下	劣，必須淘汰

[編輯]

區分度的指標及計算

　　區分度的常用指標為D，取值在-1～1之間，值越大區分度越好。測量學家伊貝爾認為：試題的區分度在0.4以上表明此題的區分度很好，0.3～0.39表明此題的區分度較好，0.2～0.29表明此題的區分度不太好需修改，0.19以下表明此題的區分度不好應淘汰。

　　區分度的計算方法有兩種：區分度指數和相關係數。

[編輯]

區分度指數

　　區分度指數（index of discrimination，D）的具體公式如下：

　　 $D = P H - P L$

　　式中，D為區分度指數，PH為高分組的項目難度，PL為低分組的項目難度。

　　顯而易見，高低分兩組越是極端，區分度指數就越明顯。但個案過少則會減少結果的信度。凱利（T. L. Kelley）指出，在正態分佈中，兼顧兩者的最佳百分數是27%。對於小樣本，如一個常規教學班，可取25%-33%之間的任何數字，只要使用方便。

　　區分度指數D和項目難度P彼此並不獨立，項目難度為中等水平時，區分度指數為最大值。^[3]

　　項目難度和區分度指數最大值的關係

PT	PH	PL	D最大值
1.00	1.00	1.00	0.00
0.90	1.00	0.80	0.20
0.80	1.00	0.60	0.40
0.70	1.00	0.40	0.60
0.60	1.00	0.20	0.80
0.50	1.00	0.00	1.00
0.40	0.80	0.00	0.00
0.30	0.60	0.00	0.60
0.20	0.40	0.00	0.40
0.10	0.20	0.00	0.20
0.00	0.00	0.00	0.00

[編輯]

項目特征曲線^[1]

　　即便是某個項目具有適當的難度和區分度，也不能保證對於各個水平的被測者來說都能很有效地發揮作用。對於一個好的測驗項目，隨著被測者測驗總分的增加，其在該項目上的通過率也應該穩步增加。可以通過項目特征曲線來描述項目的這種特征。

　　一個好題目的曲線走嚮應該是通過率隨著總分的升高而增加；反之，說明該題目出得不好或是定錯了答案。曲線上通過率為50%的那個點能反映該題目的難度，該點對應的總分越高，說明這個題目的難度值越小，即難度越大；該點的斜率能反應該項目的區分度，越陡峭，區分度就越好。這裡的難度和區分度都是通過曲線直接看出來的，具體數值的計算比較複雜，往往要藉助於電腦。

[編輯]

區分度和難度

　　難度和區分度都是相對的，是針對一定團體而言的（絕對的難度和區分度是不存在的）。一般說來，較難的項目對高水平的被試區分度高，較易的項目對水平低的被試區分度高，中等難度的項目對中等水平的被試區分度高。這與中等難度的項目區分度最高的說法並不矛盾，因為對被試總體是較難或較易的項目，對水平高或水平低的被試便成了中等難度。由於人的多數心理特征呈正態分佈，所以當需要把人作最大程度區分時，項目難度的分佈也以正態為好，即特別難與特別容易的題目較少，接近中等難度的題目較多，而所有題目的平均難度為0.50。^[4]

　　什麼情況下區分度高呢？或者說什麼樣的題目才能最大限度地區分不同水平的人群？這就引出了試題項目評價的第二個指標：難度。題目的難度過高，很少人能答對，大部分得分都很低；難度過低，很少人會答錯，分數分佈在高分端。因而過難或過易的題目都不能很好地區分不同水平的個體。因而當題目的難度為中等時，區分度最高。

　　一個好的測驗中是不是要求所有題目都是中等難度？那高考、研究生入學考試這樣的高水平測試為何還有難度很大或很小的題目？這是因為在一個測驗中如果都是中等難度的題目，就又走向另一個極端，即對中等程度的人有最佳鑒別力，而對水平高和水平低的那部分人不能做很好的區分。簡言之，不同難度的題目對於不同水平的人來說區分度是不同的。鑒於全體受測者的能力分佈往往是呈正態的，測驗中題目難度的分佈也基本為正態分佈，即難、中、易都有分佈，中等難度題目最多。只有這樣才能保證整個測驗有較高的鑒別力。

[編輯]

參考文獻

↑ ^1.0 ^1.1 張厚粲．實用心理評估．北京：中國輕工業出版社，2005年
↑ ^2.0 ^2.1 丁秀峰．心理測量學．開封：河南大學出版社，2001年
↑ 竺培梁．心理測量．合肥：中國科學技術大學出版社，2008年
↑ 洪煒，劉仁剛，馬立驥．心理評估．天津：南開大學出版社，2006年：121-136

取自"https://wiki.mbalib.com/zh-tw/%E5%8C%BA%E5%88%86%E5%BA%A6"

打开MBA智库App, 阅读完整内容打开App

如果您認為本條目還有待完善，需要補充新內容或修改錯誤內容，請編輯條目或投訴舉報。

本条目由以下用户参与贡献

nonameh,赵先生,上任鹅陈.

頁面分類: 統計術語

評論(共0條)

提示:評論內容為網友針對條目"區分度"展開的討論，與本站觀點立場無關。

發表評論請文明上網，理性發言並遵守有關規定。

查看

工具▼

區分度

出自 MBA智库百科(https://wiki.mbalib.com/)

目錄

什麼是區分度^[1]

區分度的相對性

區分度的指標及計算

區分度指數

相關係數法

項目特征曲線^[1]

區分度和難度

參考文獻

温馨提示

本条目相关课程

本条目由以下用户参与贡献

評論(共0條)

導航

意见反馈

查看

工具▼

區分度

出自 MBA智库百科(https://wiki.mbalib.com/)

目錄

什麼是區分度[1]

區分度的相對性

區分度的指標及計算

區分度指數

相關係數法

項目特征曲線[1]

區分度和難度

參考文獻

温馨提示

本條目相關文檔

本条目相关课程

本条目由以下用户参与贡献

評論(共0條)

導航

意见反馈

什麼是區分度^[1]

項目特征曲線^[1]