全球专业中文经管百科,由121,994位网友共同编写而成,共计435,874个条目

測試效度

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

測試效度(test validity)

目錄

什麼是測試效度

  測試效度亦稱測試的有效性,指一套測試對應該測試的內容所測的程度。也就是說,一套測試是否達到了它預定的目的以及是否測量了它要測量的內容。

  例如:“Is photography an art orscience?Discuss.”這種題目以攝影的知識為前提和主要內容,用來考語言能力,就不具有效性。又如用聽寫來測量學生的聽覺能力,其效度也是不理想的,因為書面記錄有聲語言不僅涉及學生的聽覺能力,而且還與他們的書寫速度、拼寫能力、語法知識、記憶能力和對全文的理解能力等有關。

測試效度的分類

  測試的效度一般可分為以下幾類:

  (1)錶面效度face validity

  指測試應達到的捲面標準,即一套測試題從錶面看來是否是合適的。例如,若一次閱讀理解力的測試包括許多受試者沒有學過的方言辭彙,則可認為這次測試缺乏錶面效度。錶面效度是測試出受試者正常水平的一種保證因素。

  (2)內容效度(content validity)

  指一套測試題是否測試了應該測試的內容或者說所測試的內容是否反映了測試的要求,即測試的代表性和覆蓋面的程度。例如,如果某一套發音技能測試題僅僅考查發音所必須具備的某些技能,如只考單一音素的發音,而不考查重讀、語調或音素在詞語中的發音,那麼,該測試的內容效度就很低。

  (3)編製效度(construct validity

  指一套測試題的諸項目對編製該測試所依據的理論的各個基本方面的反映程度。例如,以結構主義語言理論為基礎,認為系統的語言習慣是通過句型而獲得的,那麼,強調辭彙和語法環境的測試題目就失去了編製效度。

  (4)經驗效度(empirical validity

  經驗效度是一種衡量測試有效性的量度,通過把一次測試與一個或多個標準尺度相對照而得出。經驗效度可分為兩種:一是共時效度(concurrent validity),即將一次測試的結果同另一次時間相近的有效測試的結果相比較,或同教師的鑒定相比較而得出的繫數;二是預測效度(predictive validity),即將一次測試的結果同後來的語言能力相比較,或是同教師後來對學生的鑒定相比較而得出的繫數。

  一般來說,對某次測試的效度進行檢驗時,除了要根據教學大綱的要求和觀念有效性的理論對試卷的內容進行考查以外,還須採用計算相關係數的定量方法,即計算出本次試卷與另一份已被確定能正確反映受試者水平的試卷之間的相關係數。繫數高則有效性大。課堂測試的效度應在0.4-0.7之間,規模較大的測試其效度應在0.7以上。

測試效度的影響因素

  測量的效度就是指測量的有效性,即能測量到所要測量目標的程度。一般來說,效度的作用比信度的作用更為重要。如果一個測驗效度很低,無論它的信度有多高,這項測驗都沒有應用價值。較高的效度是一個良好的測驗最重要的特性,是必要條件,也是選擇和評鑒測驗的重要依據。但是很多方面都在影響測量的效度,下麵主要從測驗本身、樣本團體、效標因素進行具體分析。

本條目對我有幫助7
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目投訴舉報

本条目由以下用户参与贡献

LuyinT.

評論(共0條)

提示:評論內容為網友針對條目"測試效度"展開的討論,與本站觀點立場無關。

發表評論請文明上網,理性發言並遵守有關規定。

打开APP

以上内容根据网友推荐自动排序生成

下载APP

闽公网安备 35020302032707号