全球专业中文经管百科,由121,994位网友共同编写而成,共计435,825个条目

經典測驗理論

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

經典測驗理論(Classical Test Theory) 

目錄

什麼是經典測驗理論

  一般將測量理論分為經典測驗理論、概化理論項目反應理論三大類,或稱三種理論模型。人們將以真分數理論為核心理論假設的測量理論及其方法體系,統稱為經典測驗理論

經典測驗理論的提出

  經典測驗理論是最早實現數學形式化的測量理論。它從十九世紀末開始興起,二十世紀30年代形成比較完整的體系而漸趨成熟。50年代格裡克森的著作使其具有完備的數學理論形式,而1968年洛德和諾維克的《心理測驗分數的統計理論》一書,將經典測驗理論發展至顛峰狀態,並實現了向現代測量理論的轉換。

  所謂真分數是指被測者在所測特質(如能力知識個性等)上的真實值,即(TruE ScorE)真分數。而我們通過一定測量工具(如測驗量表和測量儀器)進行測量,在測量工具上直接獲得的值(讀數),叫觀測值或觀察分數。由於有測量誤差存在,所以,觀察值並不等於所測特質的真實質,換句話說,觀察分數中包含有真分數和誤差分數。而要獲得對真實分數的值,就必須將測量的誤差從觀察分數中分離出來。為瞭解決這一問題,經典測驗理論提出了三個假設:其一,真分數具有不變性。這一假設其實質是指真分數所指代的被測者的某種特質,必須具有某種程度的穩定性,至少在所討論的問題範圍內,或者說在一個特定的時間內,個體具有的特質為一個常數,保持恆定。其二,誤差是完全隨機的。這一假設有兩個方面的含義。一是測量誤差的平均數為零的正態隨機變數。在多次測量中,誤差有正有負。如果測量誤差為正值,觀測分數就會高於其實際的分數(真分數);如果測量誤差為負值,則觀測分數就會低於其實際的分數,即觀察分數會出現上下波動的現象。但是,只要重覆測量次數足夠多,這種正負偏差會兩相抵消,測量誤差的平均數恰好為零。用數學式表達為:E(E)=0。二是測量誤差分數與所測的特質即真分數之間相互獨立。不僅如此,測量誤差之間,測量誤差與所測特質外其它變數間,也相互獨立的。其三,觀測分數是真分數與誤差分數的和。即X=T+E。

  在上述三個基本假設的基礎上,經典測驗理論作出瞭如下兩個重要推論:第一,真分數等於實得分數的平均數(T=E(X));第二,在一組測量分數中,實得分數的變異數(方差)等於真分數的變異數(方差)與誤差分數的變異數(方差)之和。即(S2X= S2T + S2E)。

經典測驗理論的基本概念

  經典測驗理論在經典測驗理論假設的基石上構建起了它的理論大廈,主要包括信度效度項目分析常模標準化等基本概念。

  (1)信度:是測量理論中最重要的核心概念,指測量果的一致性程度,亦稱可靠性程度。在經典測驗理論中信度被定義為:一組測量分數的真分數的方差(變異數)在總方差(總變異數)中所占的比率。

  由於真分數的方差和誤差分數的方差是無法獲得的,因此這個信度概念還只是一個理想的構想的概念,不能直接計算。為瞭解決這一問題,經典測驗理論提出了平行測驗(ParallEl TEST)的概念。

  所謂平行測驗是指能夠對同一被試的同一特質作相同準確測量的不同測驗形式(測驗題目)。如果某一測驗有許多平行式,則某被試可以在每一形式上獲一個觀測分數,這樣就產生了一個觀測分數的分佈,這一分佈的平均值就稱作該被試的真分數。實際上,平行測驗是一個構想的概念,要在實際的測驗的編製中實現是非常困難甚至是不可能的,最多也只能說是比較接近。

  在平行測驗假設的基礎上,經典測驗理論提出了估計測驗信度的一系列方法,如採用相關法進行重測信度複本信度分半信度的估計,提出同質性的概念以保證反應的一致性,如克倫巴赫繫數、庫德和理查遜提出的估計一致性的兩個公式K-R20公式和K-R21公式、荷伊特信度等都是進行同質性估計的重要方法。

  (2)測量的效度:是指測量結果的有效性程度,也就是已測到的質和量與主試者欲測的質和量相符合的程度,有的也稱效度為正確性。效度是任何一種測評必須解決的首要問題,因為有效性決定了一種對測量效度的考查是一個很複雜的問題,特別是對人的潛在特質的測量,因為潛在特質並不是一個看得見摸得著的物質實體,而是一種觀念構想。對潛在特質的測量只能採用間接的方法,其測量模型可表示用行為主義的公式S-R表示,在測量過程中我們所能控制的是呈現給被試的刺激S,所能觀測到的是被試在一定測量情景下對刺激S的反應R。而潛在特質是介於S和R之間的,在這一中間過程對S傳入大腦的信息作出了處理,處理後的信息以R方式輸出。簡單地說,效度要弄清楚的是在S信號傳入大腦後,哪種(哪些或最主要是哪一種)特質參與了對輸入信號的處理。

  經典測驗理論對效度問題提出了諸多解決方案,因而有很多效度名稱。如,同時效度,預測效度錶面效度,相容效度,協同效度,假設效度,效標關聯效度,實證效度,經驗效度等等。為了規範效度問題的研究與解釋,美國心理學會在1974年將測量的效度分為三大類,即內容效度,是指測驗的內容對欲測範圍內內容的代表性程度;結構效度,測量結果與測驗的理論假設之間的一致性程度;效標關聯效度,又稱實證效度,指測量的結果與某種外在效標之間的一致性程度,一般用測驗分數與效標之間的相關係數表示。

  成就測驗或學科測驗(以檢測知識為主的考試)較容易獲得較高的內容效度,而對這類測驗也往往註重考察它們的內容效度。對於能力測驗個性測驗、態度測驗、品德測評等,其內容效度的考察往往比較困難,而採用效標關聯效度較多。效度的檢驗不是一次就能完成的,往往要通過累積證據的方法不斷積累效度資料來證實它的有效性,結構效度在根據某一理論結構模型(智力、個性等)編製測驗時特別註重,它也是通過累積證據的方法來效度獲得支持的。

  (3)項目分析:為了提高測驗的信度和效度,經典測驗理論理論特別註重測驗項目的質量,除了深入研究試題的類型和功能及編製技巧外,還發明一系列篩選、甄別項目的方法,統稱為項目分析,其中最主要的是難度分析和區分度分析。項目難度的主要指標是通過率,即在該題上答對的人數與全體被試的比率(或平均得分與該題滿分的比率)。僅難度還不足以說明題目質量的優劣,經典測驗理論還提出以題目對被試水平區分鑒別能力作為評價試題質量的區分度概念。

  (4)常模:經典測驗理論理論認為,僅從測驗試卷上的得分不能獲得被試個體確切地位的信息。為了對測驗的分數進行合理的解釋,提出常模的概念。所謂常模即是從某一總體中抽取的被試樣本在該測驗上得分的分佈,以常模團體的平均數(或中位數)為參照點,將個體的分數標定在高或低於參照點的某一位置以確定該被試在團體中的相對地位。這種標定可以通過原始分數轉換成量表分,或稱導出分數。經典測驗理論將這種類型的測驗稱為常模參照測驗,與此相對應的稱為標準參照測驗,其測驗分數的解釋與轉換方法有所不同。

  (5)標準化:是指對測驗實施程式、對象範圍、施測環境、測試方式、測驗時限、分數解釋(常模)作了統一的規定,使測驗能夠在異時、異地,不同的主試等條件下進行,並能得到同等有效的測驗結果。標準化的思想主要來自於自然科學中對實驗條件進行嚴格控制以降低測量誤差,其方法主要源自實驗心理學中對無關變數和干擾變數控制的方法。

經典測驗理論假設

  經典測驗理論假設是指觀察分數與真分數之間是一種線性關係,並且只差一個隨機誤差,即X=T+E。根據這一模型可以引出三個相關假設:

  1、若對個體的某種心理特征可以反覆測量足夠多次,那麼其觀察分數的平均值會接近真分數;

  2、真分數和誤差分數之間的相關為0;

  3、各平行測量上的誤差分數之間相關為0。

經典測驗理論的缺陷

  1、信度估計精度不高;

  2、誤差指標籠統單一、不精細;

  3、各種參數估計樣本的依賴性太大;

  4、參數指標之間的匹配性較差。

相關條目

本條目對我有幫助20
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目投訴舉報

本条目由以下用户参与贡献

Tracy,刘维燎.

評論(共0條)

提示:評論內容為網友針對條目"經典測驗理論"展開的討論,與本站觀點立場無關。

發表評論請文明上網,理性發言並遵守有關規定。

打开APP

以上内容根据网友推荐自动排序生成

下载APP

闽公网安备 35020302032707号