信度系数
出自 MBA智库百科(https://wiki.mbalib.com/)
目录 |
信度系数是指观测分数中可归因于被测者的真分数中变动的比例部分;同时,也可定义为两份平行测验之间的相关。
信度系数的意义[1]
信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异所占的比例。例如,当信度系数为0.80时,可以说实得分数中有80%的变异是真分数造成的,仅20%是来自测验的误差。在极端的情况下,如有rxx=1.00,那么表示完全没有测量误差,所有的变异均来自真实分数;若有rxx=0,则所有的变异和差别都反映的是测量误差。应该注意的是,信度系数的分布0.00~1.00的正数范围,代表了从缺乏信度到完全可信的所有状况。我们可以利用不同信度反应的误差来源,来推测真分数变异所占的比例。假设对100个应聘者以两个月的时间间隔先后施测一个创造力测验的A/B两个复本,所得的等值性与稳定性系数为0.70,根据被试对每个复本的反应计算出分半信度为0.80(先计算每个复本的分半相关系数,将二者平均后再用斯皮尔曼一布朗公式校正)。同时,让另一个评分者随机抽取50份卷子另外评分,得到评分者信度为0.92。然后,就可以对这三种方法所产生的误差变异进行分析,如下俩表所示。
信度系数的标准[1]
一个测验究竟信度多高才合适,才让人满意呢?当然,最理想的情况是信度为1,但实际上是办不到的。根据多年的研究结果,一般的能力测验和成就测验的信度系数都在0.90以上,有的可以达到0.95;而人格测验、兴趣、态度、价值观等测验的信度一般为0.80~0.85或更高些。一般原则是:当rxx<0.70时,测验不仅不能用于对个人作出评价或预测,并且不能作团体比较;当0.70≤rxx<0.85时,可用于团体比较;当rxx≥0.85时,才能用来鉴别或预测个人成绩或作为。另一原则是:新编的测验信度应高于原有的同类测验或相似测验。
信度系数的应用要求[2]
毫无疑问,信度系数的作用就是用来评价人员测评工具的稳定性,如果一个人员测评所得的结果不具备稳定性,那么依据测评结果所做出的人事决策就具有很大的随机性,达不到科学决策的目的,所以在应用人员测评时必须考虑测评工具的信度,低信度的测评项目绝对不能作为人员测评的测量工具。在人员测评的实践中,一般要求能力与成就测评的信度系数应达到0.90以上,性格、人格类的测评应该达到0.70以上。
提高信度系数的方法[1]
当测验信度没有达到所要求的标准时,可以通过增加测验的长度,提高测验的信度系数。一般来说,在一个测验中增加同质的题目,可以使信度提高。因为测验越长,测验的测题取样或内容取样越有代表性,被试的猜测因素影响也越小。但是,增加测验长度的效果应遵循报酬递减率原则,测验过长是得不偿失的,有时反而会引起被试的疲劳和反感而降低可靠性。假如我们希望用增长测验的方式提高测验的信度以达到某种理想值,可以通过斯皮尔曼一布朗公式的导出公式计算最少应增加的题数。
式中:K——改变后的长度与原长度之比;rxx——原测验的信度;rkk——测验长度是原来的K倍时的信度估计。
例:一个包括40个题目的测验信度为0.80,欲将信度提高到0.90,问至少需要增加多少题目?
即要取得0.90的信度,测验长度应为原来的2.5倍,也就是需增加60个题目。