效标效度
出自 MBA智库百科(https://wiki.mbalib.com/)
效标效度(Criterion validity)
目录 |
这个独立存在的、可观察的相关行为特征表现称为效标。教育和工业领域的人事选拔、招生选拔以及临床心理测量等,通常都需要采取效标关联效度来作为评价测量工具质量的最重要指标。
效度也叫有效性和正确性,是指测试方法测量出的所要内容的程度,也就是说它在多大程度上可以测量出要测的内容,如果测量出要测内容的程度比较高,就说明测试方法的效度比较高,反之就表明测试方法的效度比较低。
当一个测验的分数系统性地与-个相应的效标相关的时候,它就具有了效标关联效度。效标关联效度依赖于测验分数和独立效标相关显著性的证据。有两种方法用来证明效标关联效度:预测的方法和同时的方法。但由于预测效度在实际操作时难度较大,因此效标关联效度的验证大多采用同时效度,即把测量工具用于一批已经有效标评价结果的被试。但预测效度可以反映所测心理特征关联的个体行为的动态发展趋势,有时不能用同时效度来代替。
所谓效标效度,就是考查测验分数与效标的关系,看测验对我们感兴趣的行为预测得如何。因为效标效度需要有实际证据,所以又叫实证效度。
- (一)预测效度与同时效度
根据搜集效标的时间,可以将效标效度分为预测效度和同时效度。
1.同时效度的效标资料是与测验分数同时搜集的,主要用于测量工具评价结果与效标评价结果可以同时获得的情境,这种方法经常用于评价测量工具诊断被试当前心理特质状态的效果。例如大学入学考试可以用中学成绩作效标。同时效度常用的效标是在校的学业成绩、教师的等级评定、临床检查等。
2.预测效度
预测效度的效标资料需要过一段时间才可搜集到,它主要是验证现有测量评价结果与将来才可能获取的效标评价结果之间的关联程度。此种效度对人员的选拔和安置工作非常重要。常用的效标是专业训练的成绩、实际工作的表现等。
由于预测效度需要的时间长,所以很多时候我们都采用同时效度。同时效度在获取上相对来说更容易,但是因为同时效度会受到参加测评人员的工作经验的影响,因而从预测准确性的角度来看要略低于预测效度。
- (二)效标和效标测量
- 1.效标
所谓效标指的是衡量测验有效性的外在标准,通常是指我们所要预测的行为。
可以用来作为效标的变量有很多。效标可以是连续变量(如分数),也可以是分类变量(如 职业);可以是然的现成的指标(如产量、薪水),也可以是人为设计的指标(如课堂测验);可以是主观评判,也可以是客观测量。归纳起来,常见的效标主要有学业成就、等级评定、临床诊断、特殊训练成绩、实际工作表现、对团体的区分、其他测验成绩。
- 2.效标测量
阿斯汀(a.w.astin)将效标分为观念效标和效标测量。观念效标是一个概念,效标测量则是对观念效标的数量化。例如:对于大学入学考试来说,我们感兴趣的是“大学学习的成功”,这是观念效标,而大学的学习成绩,则是效标测量。如果无效标测量,观念效标是毫无用处的。
好的效标测量应符合以下几个条件:
①效标测量必须真实地反映观念效标的重要侧面;
②效标测量必须稳定可靠;
③效标测量必须客观,避免偏见;
④在保证有效性的前提下,效标测量必须尽可能简单、省时、花费少。
效标效度一般可以通过统计分析得到一个数量指标,因此有人又叫它统计效度。常用的估计方法有相关法、分组法、预期表法等。
- 1.相关法
确定效标效度最常用的方法是计算测验分数与效标测量的相关。根据变量的性质不同,可分别采用积差相关法、等级相关法、二列相关法等。相关法的优点是:
①提供了预测源与效标间的数量关系;②可利用回归方程式来预测每个人的效标分数。
相关法的缺点是:
①如果预测源与效标之间不是直线关系,便会低估测验的效度;②不能提供关于取舍正确性的指标。
- 2.分组法
确定效标效度的另一种方法是看测验分数能否区分由效标测量所定义的不同团体。例如在大学里,我们根据教师评定,把学生分为合格与不合格两组,然后回过头去查阅他们的高考分数,若两组在高考分数上有显著差异,那就可以认为高考是有效的,否则便认为是无效的。
- 3.预期表法
预期表法是将预测源分数和效标分数制成双维图表,并将每个变量按水平分成若干档次,然后列出每个档次上的人数百分比。从预期表我们可以看出效标效度的高低。从右下角到左上角的对角线上各格中的数字越大,说明效标效度越高。