高考试卷的信度测量通常采用以下几种方法:
重测法(Test-Retest Reliability)
使用同一测量工具对同一组被试在不同时间进行两次测试。
计算两次测试结果之间的相关系数,以评估信度。通常测试间隔至少为2周。
复本法(Parallel Forms Reliability)
使用两个内容相似、难易度相当但具体题目不同的等值测验版本。
对同一组被试在不同时间进行测试。
计算两次测试得分的相关系数,以评估信度。
分半法(Split-Half Reliability)
将测验题目分成对等的两部分。
分别计算两部分的总分,然后求这两部分总分的相关系数。
可以使用Spearman-Brown公式来估计整份试卷的信度系数。
内部一致性法(Internal Consistency)
评估问卷或量表内部测量结果的一致性。
常使用Cronbach's Alpha系数来计算同构项目的相关性。
克隆巴赫α信度系数(Cronbach's Alpha)
目前最常用的信度测量方法之一。
通过计算问卷内部各项目得分的相关性来评估信度。结果介于0和1之间,一般要求标准化测试的信度系数在0.90以上。
评分者信度(Inter-Rater Reliability)
评估不同评分者之间评分结果的一致性。
可以使用多种方法计算,如Spearman-Brown公式、积差相关、等级相关、肯德尔和谐系数等。
概化理论(Generalizability Theory)
用于评估测量误差的多方面来源,包括评分者信度、测量结果跨时间的稳定性系数、跨不同测验版本的等值复本信度等。
这些方法可以单独使用,也可以结合使用,以获得更全面的信度评估。在实际应用中,通常会根据测试的具体情况和需求选择合适的方法。例如,对于主观题较多的试卷,内部一致性和评分者信度可能是更为重要的指标。而对于客观题较多的试卷,重测法和复本法可能更为适用。