职业编号 男生顺序 女生顺序 D 1 3 3 0 0 2 1 1 0 0 3 5 7 - 2 4 4 2 2 0 0
3)点双列相关系数的显著性检验规则
P77的(4.16)公式:
式中x 表示有具体数值的现象,q、p是另一现象的个体分成两部分后各自所占的比例, 、 分别为p、q两部分所对应的X数值平均数, 是全部X数值的标准差。
5 7 5 2 4 6 4 4 0 0 7 8 8 0 0 8 6 6 0 0 = 8 若算得 值的绝对值大于相关系数 = 0 的临界值表中的为它们之间不存在显著的关系。
值,则认为两现象之间存在显著的关系,否则,认
若
则认为两事物关系不显著,否则认为关系显著。
可查附表三(P381)得到。
例如 欲研究外语成绩是否与学习兴趣有关系的问题,随机抽取16名学生作外语兴趣的调查,结果是7人对外语感兴趣,成绩分别为90,93,82,89,73,79,88; 9人不感兴趣,成绩分别为60,71,85,80,64,62,74,77,65。这时的外语成绩即为X,p是感兴趣学生的比例,q是不感兴趣的学生的比例, 是感兴趣学生的外语平均成绩, 是不感兴趣学生的外语平均成绩, 是16名学生成绩的标准差。因此有p = 0.438, q = 0.562, = 84.857, =70.889, =10.583,由公式(4.16)可算得
又查相关系数 = 0的临界值表得 = = 0.623,因为 0.655 > 0.623,所以可以认为外语成绩与学习兴趣存在极显著的关系。因此,外语教学应据此信息采取有效的措施,以提高教学效果。 4)
检验 (读:卡方检验)
检验规则(均为二分型的类别数据) <以下为P78 (4.17) 公式>
①.2×2的
若
则认为两事物关系不显著,否则关系显著。
式中,n 表示总人数,a、b、c、d 是两现象都对个体分成两部分后所得四类的人数,如表4-9。
21
若算得的关系。
例如表4-9列举的91名学生参加公益活动的态度情况,据此代入公式(4.17)可得: 又查
分布表 (P383 附表五) 得 = 3.841,因为3.170 < 3.841,所以可以认为,学生参加公益活动与性别不
值大于
分布表中的 值,则认为两现象之间存在显著的关系,否则,认为它们之间不存在显著的
存在显著的关系。
表4-9 学生参加公益活动的态度调查
性 别 男 生 态 度 积 极 消 极 总 计 20 (a) 25 (c) 45 (a + c)
②.
检验规则(
为两事物的分类数)
30 (b) 16 (d) 46 (b + d) 50 (a + b) 41 (c + d) 91 (n) 女 生 总 计 若
则认为两事物关系不显著,否则关系显著。
* 注意计算 式中,
值时,应先对应每一个 为第i行第j列的数据,
计算相对应的 为第i行的总计,
,然后代入公式计算。
为第j列的总计,n ..为全部总数。
查分布表时 df = ( r – 1 ) ( k – 1 ), r、k分别为两现象的分类数。
表4-10 学生性格与气质的统计调查
气 质 多血质 性 格 外向 内向 综合 总 计 20 5 2 27 3 17 0 20 10 12 2 24 0 0 0 0 2 3 0 5 35 37 4 73 粘液质 胆汁质 抑郁质 综合 总计 如下表的计算,这是对法律常识成绩与所属阶层的相关分析。 各阶层人员法律常识考试成绩表
22
可算得
∴认为法律常识成绩与所属阶层之间没有显著关系。
由检验所针对的类别数据以及所举的例子可知,它特别适用于非学业方面的相关分析。
第十讲 考试质量的评价
一、需记忆的问题: 1.效度: 考试的有效性。
2.内容效度: 考试内容与预定要考内容一致性程度。
3.效标关联效度: 考试结果与效标的一致性程度。效标是检验考试效果的参照标准。 4.信度: 考试的可靠性。
:用同一份试卷对同一组学生不同时进行前后两次考试,然后分析两次考试结果的一致性。 6.分半信度及其计算方法:
① 分半信度的含义:有意识的把试卷编制成等效的两个部分,然后分析这两部分考试结果的一致性程度。这相当于一份试卷对同一组学生同时进行两次考试,避免了再测信度两次时间间隔的问题。
② 分半信度的计算方法:先计算两部分结果的相关系数,再代入分半信度计算公式,即p58的(3.1)公式。
式中,为分半信度,r 为相关系数。
7.难度: 试题的难易程度。 8.区分度: 试题的鉴别能力。 二、需理解的问题:
1.内容效度和效标关联效度的分析方法
23
① 内容效度的分析方法:利用双向细目表进行分析。注意编制双向细目表的步骤和要求。(编拟试题所应遵循的步骤:
(1)列出课程的主要教学内容和教学目标。(2)根据各部分教学内容和教学目标的相对重要性,确定它们在测试内容上所占的比例。编制命题双向细目表,如表12-1,和表12-2 (P337 – 338)。(4)依据命题细目表中的具体规定编拟试题。 )
② 效标关联效度的分析方法:主要是通过考察考试结果与效标之间的相关程度,即计算两者之间的相关系数并进行显著性检验。(如P339的例子)
2. 再测信度和分半信度的分析方法
① 再测信度的分析方法:主要通过考察两次考试结果的相关程度,即计算两次考试成绩的相关系数并且进行显著性检验。
② 分半信度的计算方法:先计算两部分结果的相关系数,再代入分半信度
计算公式,即p58的(3.1)公式。
式中,为分半信度,r 为相关系数。
分半信度的解释:客观题的应达到0.9以上,主观题的应达到0.8以上。
3. 难度系数的计算及解释(熟记难度的计算公式。) 1).难度系数的计算
① 主观题:见p343的(12.2)公式 P =
式中,P表示难度系数, 表示某题考生的平均得分,W表示该题的满分值。显然,0 P 1。如果 在W中的比重大,则表示该题目较易,反之,则较难。一般认为,P值应在0.3 - 0.7之间,以0.45–0.65之间为最佳。
例如某道论文题考生平均得分12分,而该道题的满分值是20分,即 =12,W = 20,则该题的难度系数P= 12/20 = 0.6,可见该题的难度很适中。
② 客观题:见P344的(12.3)公式 P=
式中,k 表示某道题答对的人数,N为考生总人数。
例如,60名考生在某道选择题中答对的有15人,即k = 15, N = 60,则该题的难度系数P = 15/60 = 0.25,可见该道题偏难。
(一般来说,全卷的平均难度应在0.45 - 0.55之间。全卷题目的难度分配一般为 易:中:难 = 3 : 5 : 2 . 即 P > 0.7的有30%,
2).难度系数的解释
24
的有50%,而P<0.3的有20% 。当然要结合考试题目的灵活处理。)
① P>0.7时较易 ② P<0.3时较难 ③
时较适中。
4.两种区分度的分析方法
1).相关法:计算学生试题得分与试卷总分的相关系数并且进行显著性检验。
若检验结果为显著相关,则认为区分度较好,否则,区分度较差。一般来说,对于主观题(如简答题或论文题)的区分度可算积差相关系数,对于客观题(如选择题和判断题)的区分度可算点双列相关系数。
例如根据表12-5(P341 - 342)列举的八名考生在某道题目(论文题)的得分(x)以及他们的总分(y),可算得 =2.121, =4.892, = 3.464,并代入(4.14)公式,得积差相关系数 r =
又查相关系数 =0 的临界值表 = 0.707. 由0.792 > 0.707,可知考生该题得分与总分存在显著相关,即该题的区分度较好。
表12-5 八名考生某道题得分
学生编号 题目得分 x 总分 y 1 10 34 2 9 36 3 7 35 4 8 37 5 9 42 6 5 30 7 4 27 8 6 29 又如根据表12-6 列举的十名学生在某道题(选择题)的测验结果以及他们的总分x,可算得该题答对的比例P = 0.80,答错的比较 q = 0.20, = 5.25, = 1, = 2.577,并代入(4.16)公式,得点双列相关系数
又查相关系数 = 0 的临界值表得 = 0.682, 由0.66 < 0.682可知该题测验结果与总分不存在显著相关,即区分度不大好。
表 12 - 6 十名学生某道题测验结果
学生编号 某题结果 总分 x 1 错 2 2 错 0 3 对 7 4 对 3 5 对 1 6 对 8 7 对 5 8 对 6 9 对 6 10 对 6 2).两端分组法:全班找高分段的27%的人数,低分段的找27%的学生来进行计算。 ① 两端分组法区分度(D)的计算公式:见p343的(12.1)公式。D= 其中
分别为学生高分组和低分组中的难度。注意高分组和低分组各取27%的学生。
②两端分组法区分度D的解释 1)当D
时区分度属好 2)当
时区分度比较好
3)
时区分度还可以 4)
25
相关推荐: