内容效度
出自 MBA智库百科(https://wiki.mbalib.com/)
内容效度(Content validity)
目录 |
内容效度指测验题目对有关内容或行为范围取样的适当性。成就测验和熟练测验特别注重这种效度。例如,在成就测验中,测验题目是根据教学大纲和教材内容适当抽出的,内容效度就是判断测验题目(内容)是否符合它欲测的目标。由于这种衡量效度的方法必须针对课程的目标和内容,以系统的逻辑方法详细分析题目的性能,故又称课程效度或逻辑效度。
一个测验要具备较好的内容效度必须满足两个条件。
1.要确定好内容范围,并使测验的全部项目均在此范围内。所谓内容范围可以是具体知识或技能,也可以是复杂行为。成就测验的主要目的在于测量学生的学习效果,因此特别重视内容效度。
2.测验项目应是已界定的内容范围的代表性样本。换句话说,就是选出的项目能包含所测的内容范围的主要方面,并且使各部分项目所占比例适当。具体做法是对内容范围进行系统分析,将该范围划分为具体纲目,并对每个纲目作适当加权,然后根据权重,从每个纲目中随机取样。
- 1.专家判断法
确定测验内容效度常用的方法是由专家对测验项目与所涉及的内容范围进行符合性判断,这是一种定性分析的方法。对于成就测验来说,学科专家要先对教学大纲或教材有全面了解,然后与测验题目进行系统比较,看题目是否能代表所规定的内容。具体方法步骤如下:
①定义好内容总体,并描绘出有关知识与技能的轮廓;
②划分细纲目,并根据重要性规划好各个纲目的加权比例,作出尽可能详细的描述;
③确定每道题所测的知识与技能,将自己的分类与测验编制者的纲目作比较;
④制订评定量表,从各方面对测验作出评定。
- 2.复本法
克伦巴赫认为,内容效度可由一组被试在取自同样内容范围的两个测验复本上得分的相关来作数量上的估计。如果相关低则说明两个测验中至少有一个缺乏内容效度,但无法确定究竟哪一个缺乏内容效度。当相关高时,一般推论测验具有内容效度,但也可能出现两个测验有相同偏差的情况。
- 3.再测法
先将测验施测于被试,由于被试对测验内容了解甚少,因而得分较低,然后对他们进行教学训练,结束时再测一次,如果成绩提高很大,则说明测验对于教学具有较高的内容效度。
- 4.经验法
不同的被试团体在测验上的得分和对每题的反应存在较大差异,一般说,高年级比低年级的水平要高,如果总分和题目的通过率随着年级而增高,则说明测验对于教学具有内容效度。
作为一种方法,内容效度较为适合于评价教育成就测验和职业选拔测验。在这种测验中,测验内容应是知识、技能和实际工作的代表性样本。内容效度不仅是评价教育成就测验和职业选拔测验的较好方法,而且也是编制任何测验都应加以考虑的基本方面。内容效度对标准参照测验更为重要,因为在标准参照测验中我们主要关心的是被试对一定范围内的知识、技能掌握得如何。
在实际应用中,内容效度容易与表面效度相混淆。所谓表面效度指的是外行人从表面上看测验是否有效。表面效度不是效度的客观指标,它不能真正反映测量的有效程度,但是它能影响被试的动机,从而影响测验的效果。所以在编制测验时,表面效度是一个必须考虑的问题。
内容效度既具有一定的优点,也有一定的局限。它的主要缺点是缺乏可靠的数量指标,因而妨碍了各测验间的相互比较。
表面效度(Face Validity):指外行人从表面上看测验是否有效,测验题目与测验目的是否一致。表面效度不是真正的效度指标,但它容易和内容效度搞混。
表面效度是外行对测验作表面上的检查确定的,而内容效度是专家对测验进行详尽的、系统的评价建立的。
虽然两者都是对测验内容作出的主观判断,但判断的标准不同。前者只考虑测验项目与测验目的之间的明显的、直接的关系,后者则同时考虑到测验项目与测验目的和总体内容之间的逻辑的本质的联系。
表面效度高的题目内容效度不一定高,表面效度低的项目内容效度也不一定低。如,明尼苏达个性调查表中有这样的题目:“我的喉咙里总好像有一块东西堵着似的。”表面上看来这种题目似乎与个性无关,但在临床上,回答“是”的人很可能是癔病或神经衰弱患者。
测验对表面效度的考虑
表面效度不是效度的客观指标,不能保证测验的正确性,但能对受测者的动机产生影响,因而也会影响到测验的效度。如,智力测验、成就测验,受测者看出测验题目反应自己的智力、能力,受测者会尽力去完成这些题目,最大限度地表现自己的能力和水平,对于某些人格测验、态度测验,被试如果看出这些项目与自己的人格缺陷、品德有关,被试会有意地掩盖自己的缺点,从而产生虚假反应,如,:“我偷过东西。”让被试判断是否,被试即使偷过也会说否。
因此,编制测验时应根据编制测验的要求提高或降低表面效度,如人格测验,表面效度应该低,使被试看不出来,从而让被试作出真实的反应,能力测验应该提高表面效度,以激发被试的答题动机。
好