概化理論
出自 MBA智库百科(https://wiki.mbalib.com/)
概化理論(Generalizability Theory; GT)
目錄 |
概化理論是克倫巴赫(Cronbach)等人在二十世紀六十至七十年代初提出的理論,其基本思想是任何測量都處在一定的情境關係之中,應該從測量的情境關係中具體地考察測量工作,提出了多種真分數與多種不同的信度繫數的觀念,並設計了一套方法去系統辯明與實驗性研究多種誤差方差的來源。並用“全域分數”(Universe Score)代替“真分數”(True Score),用“概括化繫數,G繫數”(Generalizability Coefficent)代替了“信度”(Reliabilty)。
概化理論認為,測量的總方差可以分解為代表目標測量的方差成分和構成誤差的種種方差成分。測量工作中要加以認識和予應用的心理特質水平是測量目標。而構成測量條件與具體情境關係的因素,稱為測量側面(Facets of Measurement)。
概化理論是用方差分析的方法來全面估計出各種方差成分的相對大小,並可直接比較其大小。它既能估計出主效應,也能估計出交互作用效應,並能對各估計值的大小進行直接比較。在概化理論中,理論估出各方差成分相對大小的過程,叫概化理論的概括分研究階段或稱G-研究階段。
概化理論並不內靜止地分析各種誤差來源,還要在G-研究的基礎上,通過實驗性研究,進一步考察不同測驗設計條件下的概括力繫數的變化狀況,如固定側面或增加側面水平下的變化狀況,從而探求到最佳的控制誤差的方法,作出最佳的設計決策,從而改進測驗的內容、方式方法提供了有價值的信息。這一階段稱作決策研究或稱D-研究階段。
GT在研究測量誤差方面有更大的優越性,它能針對不同測量情境估計測量誤差的多種來源,為改善測驗,提高測量質量有用的信息。其缺陷是統計計算相當繁雜,如果藉助一些統計分析軟體可以解決這一問題。GT理論目前在我國還處於實驗研究階段,在面試、考核等主觀性測評中有一些應用。
概化理論把全域分數方差對總變差的比稱為概括力繫數(簡稱G繫數)。而總方差可以分成全域分數方差(δ2 (p)和誤差分數方差(δ2(δ)),如果測驗是常模參照性測驗,則G繫數E2ρ是評價測驗穩定性程度的最佳指標: E2ρ=(δ2(p))/[ δ2(p) +(δ2(δ))]。
若該測驗是標準參照性測驗,則其依存性j指標是測驗穩定一致性的最好指標:j=(δ2(p))/[ δ2(p) +(δ2(△))]
上兩式中,誤差方差δ2(δ)可能是很多項的和
學生閱讀能力測驗,其目的是對學生閱讀能力的測量,因此,閱讀能力就成為測量目標,除此外試題的水平和評分者等因素也會影響測驗的總變異。
對學生閱讀能力的測量是在雙側面情境的條件下進行的,測量側面中的單個事例叫側面的水平。如有兩個評分者甲和乙,則評分者這一側面就有兩個水平。測量側面又分為隨機側面和固定側面。隨機側面是指測量側面中所包含的各水平中是類似水平的隨機樣本,而非固定不變的側面,如大規模考試中評分者每次都有可能不同,由這樣變化的評分者所組成的測量側面就稱為隨機側面。固定側面是指在各次實施中測量側面的所在水平一直保持不變的測量側面,如標準化的心理測驗中測驗的項目總是一樣,這樣的側面就叫固定側面。因此,進行測驗的標準化就是對某些測量側面進行固定。固定測量側面可以減少測量誤差,但卻會使測量目標變得更為局限。比如,把閱讀理解題定為對科技說明文,這時,所測的特質就不再是一般的閱讀理解能力,而是特定的對科技說明文的理解能力了。這樣,測驗所得的分數就不能再推廣到原來那麼寬廣的範圍了。