如何进行教学测验整理精校版.docx

上传人:b****3 文档编号:1843516 上传时间:2022-10-24 格式:DOCX 页数:13 大小:29.22KB
下载 相关 举报
如何进行教学测验整理精校版.docx_第1页
第1页 / 共13页
如何进行教学测验整理精校版.docx_第2页
第2页 / 共13页
如何进行教学测验整理精校版.docx_第3页
第3页 / 共13页
如何进行教学测验整理精校版.docx_第4页
第4页 / 共13页
如何进行教学测验整理精校版.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

如何进行教学测验整理精校版.docx

《如何进行教学测验整理精校版.docx》由会员分享,可在线阅读,更多相关《如何进行教学测验整理精校版.docx(13页珍藏版)》请在冰豆网上搜索。

如何进行教学测验整理精校版.docx

如何进行教学测验整理精校版

如何进行教学测验

教学相长

050921:

50

一、有效教学测验的基本要求

既然教学测量与评价是有效教学活动的一个必要环节,而教学测量是以科学的教学测验为工具施行的,那么有效教学测验有哪些基本要求呢?

(一)测验的效度

测验的效度指的是测量的正确性和有效性,即它能在多大程度上达到测量目的。

考察效度的方法很多,根据其侧重的问题不同,可将测验的效度分为三类,即内容效度、构想效度、实证效度。

对于学绩测验而言,最重要的是具备内容效度。

内容效度指测验题目对有关内容或行为范围取样的适当性,也就是测验所选的项目是否符合所要测量的东西,其代表性是否适当。

要编制内容效度高的测验,必须注意两点。

第一,要有一个定义完好的内容范围,即对测量目标应有明确的界定。

对学绩测验而言,它所要测量的是学生能力的形成状况,而能力是概括化和系统化了的知识和技能。

因此,在编制学绩测验时,应依据教学内容和教学目标,对能力结构中的知识因素和技能因素进行综合测量。

第二,测题对所界定的内容范围应是代表性取样。

也就是说,要根据教学内容和教学要求的重要性来选择题目,而非随机取样,以便使选出的题目能包含所测内容范围的主要方面,并使各方面题目比例适当。

学绩测验尤其强调取样的适当性。

但是有的教师编制测验的随意性很大,不注意取样的策略,他们或者对什么感兴趣就出什么题,或者觉得怎么方便就怎么出题,或者为难倒学生而出一些偏题、怪题。

这样编出来的测验内容缺乏代表性,其内容效度必然很低。

为了防止这种情况发生,必须对内容范围进行系统分析,将该范围区分为细目,并对每个细目作适当加权,然后再根据权数从每个细目中随机取样,直至得到所需要的题目。

(二)测验的信度

测验的信度又叫测验的可靠性,指的是测量的一致性程度。

一个好的测量工具必须稳定可靠,即多次测量结果要保持一致,否则便不可信。

要想提高测验的信度,了解并掌握影响它的因素是十分必要的。

信度的影响因素,主要来源于四个方面,即测题数量、测题难度、施测对象和施测过程。

1.测题数量

由于测验是测量的一个样本,因此取样的适当性必然影响到测验的信度。

如果测题数量太少,不能代表整个学习内容的全域,这样的测试必然带有偶然性,其信度不可能很高。

要提高信度,一般来说,增加测题数量是一个有效的方法。

但必须注意,只有当新增加的题目和原来的题目取自同一总体,即与原题目具有同质性时,增加题目数量才能提高信度。

虽然增加题目数量可以提高信度,但并不是题目越多越好。

增加题目数量的效果是遵循报酬递减律的,即当题目达到一定数量后,再增加题目数量往往得不偿失,有时会引起学生的疲劳和反感而降低可靠性。

为了节省经费和时间,有时还需要把过多的题目适当删减,而不使其对信度有大的损害。

总之,增加测题数量可以提高信度,但是测题数量须有一定限制,并非越多越好。

2.测题难度

测题的难度和信度没有直接的关系。

然而,如果测题对某团体过难或太易,则分数范围将缩小,信度也将降低。

这表明,要使信度达到最高,能产生最广分数分布的难度水平方为合格。

当测题难度过大,远远超出被试能力水平时,被试对许多项目作随机反应即瞎猜,则所有被试的总分接近随机分布,因此其信度极低。

反之,测题太易,几乎所有被试均能正确作答,则分数分布很集中,因此信度也很低。

有关测题难度及区分度的问题,我们下面还将讨论。

3.施测对象

即使一个测验经过精心编制,题目取样具有代表性,由于受测者动机和焦虑的变化,也会给测验信度带来影响,这是最难控制的因素。

由于学生的应试动机不同,他们的注意力、情绪状态、焦虑水平也不同,从而影响测验成绩,使信度受到影响。

一般来说,恰当的动机、适度的焦虑水平会使人的兴奋性提高,注意力增强,提高反应速度,从而对测验成绩产生积极影响。

动机过强、焦虑水平过高都会使工作能力降低,注意力分散,思维变得狭窄而刻板,从而对测验成绩产生消极的影响;反之,动机过弱、焦虑水平过低的被试往往采取满不在乎的态度,从而测验成绩大多较低。

可以说,适当的动机和焦虑水平是保证测验信度的必要条件,过强或过弱的动机和焦虑水平都不利于测验信度的提高。

4.施测过程

测验的环境条件如通风、室温、采光等条件会影响到测验的稳定性,室内燥热、考场周围嘈杂、座位拥挤、考试秩序混乱等都会导致测验信度下降。

主试错误理解指导语,不按规定严格施测,或故意制造紧张气氛等也会影响测验的信度。

应该说明的是,虽然信度和效度都是鉴定测验质量的指标,但两者并不是完全一致的。

一般而言,效度高的测验,其信度也一定高;信度高的测验,其效度却不一定高。

也就是说,高信度是高效度的必要但非充分条件。

三、项目的难度与区分度

信度和效度是就整个测验而言的,难度和区分度则是就测验题目(简称项目)而言的。

每个测验都包含有许多项目,每个项目都有它的难度和区分度。

(一)项目难度

项目难度指测验题目的难易程度,通常以答对或通过该项目的人数占应试总人数的百分比来表示。

也就是用通过率来表示难度,通过率越高,难度越小。

但对于不同的测验题型,其计算有所不同。

对于是非题,当只有正确或错误两种答案时,可以用通过该题人数的百分比代表难度,公式为P=R/N(P,难度;N,受测总人数;R,通过该题的人数),也可以用极端组的方法计算难度,公式为P=(PH+PL)/2[PH,高分组(总分最高的27%的学生)答对该题的人数占高分组学生总数的百分比;PL,低分组(总分最低的27%的学生)答对该题的人数占低分组学生总数的百分比]。

对于选择题,如在K个选项中(K>2)只有一个正确答案,则其难度可以在该项目的通过率P的基础上进行矫正,计算公式为CP=(KP-1)/(K-1)(CP,矫正后的难度;P,未矫正的难度;K,选项的数量)。

这是因为对单选题学生可能随机猜测,用此公式则能排除这种影响。

对于论文型题目,可以用某题的平均分数为依据计算难度,公式为P=M/W(M,全体考生某题的平均得分;W,某题规定的最高得分),也可以用极端组的方法计算难度,公式为P=(MH+ML-2Nl)/[2N(h-l)][MH,高分组(总分最高的27%的学生)考生该题得分之和;ML,低分组(总分最低的27%的学生)考生该题得分之和;N,所有考生总人数的27%;h,该题最高得分;l,该题最低得分]。

至于项目的难度多高合适,则取决于测验目的。

如果测验是为了考察学生对某些方面的知识、技能是否掌握(掌握性测验),可不考虑项目难度,只要是教学目标中重要的内容就可以,甚至通过率100%或0%的测题也不必淘汰,可以继续使用。

当测验主要用于选拔时(选拔性测验),就应比较多地采用那些难度值接近录取率的项目。

如果我们要把全体受测者作最大程度的区分,则0.50左右的难度最合适。

总之,对项目的难度特征进行分析时,应考虑到测验的目的,不能一概而论,一般在0.30~0.70为宜。

(二)项目区分度

区分度又称鉴别力,是指试题对所要测量的心理特性的识别程度,也就是项目的效度。

项目效度越高,其区分度越大,鉴别力越强。

但对于不同的测验题型,其计算也有所区别。

对于客观题,项目区分度的简便计算公式是D=PH-PL(D,区分度;PH,高分组通过该题的人数占高分组总人数百分比;PL,低分组通过该题的人数占低分组总人数百分比)。

对于论文型题目,项目区分度可以这样计算,D=(MH-ML)/[N(h-l)][D,区分度;MH,高分组(总分最高的27%的学生)考生该题得分之和;ML,低分组(总分最低的27%的学生)考生该题得分之和;N,所有考生总人数的27%;h,该题最高得分;l,该题最低得分]。

项目区分度多高合适也和测验目的密切相关。

就学绩测验而言,一般要求项目与总分的相关达到0.20以上,高分组与低分组通过率之差达到0.15~0.20。

一般认为D>0.40,该题非常优良;D<0.19,该题必须淘汰。

但是这一标准也不是绝对的。

一个测验用于选拔,其区分度应该高一些;如果一个测验只是用于考察学生对知识、技能的掌握情况,可不考虑区分度,即使区分度为0,只要该项内容是重要的,今后仍可继续使用。

总之,信度、效度、难度和区分度是鉴定测验质量的客观指标。

一个良好的测验必须既有较高的信度,又有较高的效度,并且每个项目都有一定的难度和区分度。

广大教师在编制教学测验时,应该综合考虑这些要求。

 

 

 

 

教学测验的类型及其应用

 

 一、教学测验的类型

(一)常模参照测验和标准参照测验

在学校教学过程中,教学测验可以用来测量和评价学生在一定群体中的等级,也可以用来测量和评价学生是否有效地完成了教学目标。

前者即常模参照测验,后者即标准参照测验。

1.常模参照测验

常模参照测验(normreferencedtest)是以学生团体的平均成绩作为参照标准,就某学生得分的高低来说明其在学生团体中的相对位置(或名次),将学生排队。

其特点是学生成绩的高低是相对的。

它着重学生个人之间的比较,适于区分学生的成绩水准,可供选拔、编班、编组之用。

这种测验要求测得的分数变异性要大,得分的范围要广,充分显示个别差异;要求试题有很强的鉴别力。

这种测验重视名次排列,鼓励竞争,对学生的学习起考核和监督的作用,但缺少诊断的效用,且易引起学生过度的紧张与焦虑。

2.标准参照测验

在学校里,凡是参照规定的作业标准,核对学生的测验得分,评定其是否达到标准以及达标的程度如何的测验,都属于标准参照测验(criterionreferencedtest)。

其特点是学生成绩的高低是绝对的,不是表示他在同辈集体中的相对位置。

这种测验在课程和教学改革的推动下产生,从20世纪60年代起颇受重视。

学生的学业成绩宜用学习的数量和程度来表示,而且只有与预先规定的某种标准加以比较才具有确定的意义。

这种测验的试题必须正确地反映教学目标,方可作为评价的标准,所以要求试题在数量上和质量上同要测定的内容和范围一致,而不必关心题目的难易和区分度。

在测验中如果发现多数学生不能正确回答某些题目,那么就要检验这些题目是否体现了教学目标,要考虑教学方法是否恰当,而不是简单地剔除它。

标准参照测验能用来考查学生的基础知识与技能的学习情况,哪些学得较好,哪些没有学好,需要补救。

因此,标准参照测验主要用于基本知识、基本技能的测量,用于诊断及个别指导。

(二)准备性测验、形成性测验和终结性测验

测量与评价贯穿于教学过程的始终,从教学开始至教学结束。

教师必须根据教学过程的不同阶段,灵活选用不同的测验。

1.准备性测验

准备性测验(preparatorytest)一般在教学活动开始之前施行,目的在于了解学生对未来的教学活动的准备状态,即是否具有完成新的教学任务所必需的基本知识和基本技能,从而有效地安排教学。

准备性测验一般属于掌握性测验,试题难度较低,考核内容主要是有关基本知识和基本技能,目的在于为制订教学目标和教学计划提供依据。

这种测验往往在教师不了解学生的知识和能力时,或者所预测的学习结果非常具体并有明显的顺序的情况下采用。

2.形成性测验

形成性测验(formativetest)一般在教学过程中进行,目的在于了解学生在教学过程中达到教学目标要求的程度,探究教学中存在的问题或缺陷,以便及时调整教学,提高教学的自觉性和主动性。

形成性测验一般要根据情况进行多次,它应成为教学过程的一个有机组成部分。

它通常也属于掌握性测验,试题根据教学内容和教学要求编制,可难可易,一般由任课教师本人根据教学进度和实际教学情况实施。

但它一般不以区分学生的优良程度为目的,不重视对学生分等鉴定,以及学生之间成绩的比较。

教学测量与评价的反馈—调节功能主要是通过形成性测验来实现的。

3.终结性测验

终结性测验(summativetest)一般在教学活动结束后进行,目的在于考察教学目标达到何种程度,判明是否有必要修订教学目标,重新进行补救教学,同时,检查教学活动的组织是否得当,教材的安排是否合理并确定学生的学习成绩。

其目的在于对整个教育活

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 其它课程

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1