高中数学测试命题的技术与创新.docx

资源描述

高中数学测试命题的技术与创新.docx

《高中数学测试命题的技术与创新.docx》由会员分享，可在线阅读，更多相关《高中数学测试命题的技术与创新.docx（14页珍藏版）》请在冰豆网上搜索。

高中数学测试命题的技术与创新.docx

高中数学测试命题的技术与创新

《高中数学测试命题的技术与创新》

北京市西城区教育研修学院李梁

（一）高中数学测试命题的要求与技术

1、关于命题的整体考虑

首先要明确本次命题考试的性质。

有几种不同的考试。

它们的性质不同，命题的要求是不一样的。

目标测试，目的是根据教学目标，检验学生是否通过，是否达标。

例如单元测试、期中、期末考试、模块考试等都是。

这种考试不太注重区分和排序。

所有的人都通过，就都升班，或都发证书。

这种考试注重达标。

试题要全面地体现《课程标准》的要求。

尤其及格线要定得准。

59分不行，60分就行了。

所以60分的及格线或达标线是特别有讲究，不是随意确定的。

选拔考试，是带有竞争、竞赛性质的。

这种考试的目的是择优和排序。

所以题目就特别注意区分度，要求就不一样。

中考和高考，还要求在各个分数段都有好的区分度。

出活题、考能力是这种考试的特点。

命题的设计是很精细的。

诊断测试和调查研究，目的是要了解真实的情况。

不需要排序、选拔和淘汰，不需要考查达标不达标。

只是调查统计有多少人会，有多少人不会；哪方面有欠缺；有多少人会到什么程度等。

把这个原始情况了解上来就达到目的。

第二要引导教学。

这是通过考试要达到的具体一点的目的。

例如促使师生重视课本，这就是一种引导。

提示他们重视提高中低档题的正确率，这又是一种引导。

题目常见、做过、能做、会做，看着不难，但是就知道他肯定得分不高。

另外要注重题目的科学性、量力性、还有针对性，也是一种引导。

题目要有针对性。

做对了，可以使它在某个知识点上巩固验收；错了，可以帮助发现某些方面的问题和漏洞，引起重视，然后查缺补漏。

这些都是引导教学的考虑。

还有例如，考试说明中，某一知识点的要求有所变动。

你在题目上有所体现，就引导老师和同学对这件事要注意。

这都是命题之前，应该考虑到的事。

第三要弄清考试对象的情况。

考试对象是这一届（班/年级）学生。

学生的人数、组成、学生的程度、以及各方面情况和特点，是必须要考虑的。

因为考试的目的要求最终是体现和落实在学生身上。

这就如同大夫真要开药方，必须摸清楚病人的情况。

第四要全面理解考试说明和考试要求。

特别是模拟考试的命题，还有教学目标测试的命题。

各部分知识点，哪要求、哪不要求；哪要求高、哪要求低；到什么程度。

各个知识范围、题型、题量、难易等各方面的比例关系是多少。

还有各个考点演变的来龙去脉，过去怎么要求，现在怎么要求。

尽量把这些事搞得比较具体。

在脑子里有“模特”，有活生生的具体化的东西。

要以教学大纲和考试说明为指挥棒。

不是以某一份考题为指挥棒，更不是以某一道题为指挥棒。

所谓指挥棒，是全面体现在考试说明里面或者是历届考题中，大家认为比较成功的、比较科学、正确的那些题目里面。

历届考题中，有个别失误的地方，那就不能作为遵循的依据。

我们是以考试说明，和历届考题当中成功的部分，大家公认比较好的，得到官方和民间一致认可的那些内容，合在一起作为指挥棒。

这是个全面的理解。

不是以某一份试题做指挥棒，更不是以某一道题做指挥棒。

另外，在重大的考试命题之前，应该组织老师对这些事情进行集体讨论。

舍得花一个单元两个单元，把这些事讨论清楚。

否则对象不清，情况不明，很难开出对症的药方。

2、命题计划和双向细目表

把整体的事情讨论清楚以后，就着手制定命题的具体计划。

一个是题型、题量，各部分内容和难易搭配的比例。

不同题型有不同的考查功能。

它们要有合理的搭配。

了解各个学科各自试题演变的历史过程，可以从中得到各种比例的依据。

难题占多少、容易题占多少、中等题占多少，规定有一个比例关系。

这里重要的是容易题、中等题和难题要掌握得比较准。

要能说清楚什么样的题算容易题，什么样的题算中等题，什么样的题算难题。

具体一道题到底是算中等题还是算难题，这个事要拿得准，就比较要劲儿。

有几件事可以作为对照的参考点。

一是历年历届考试结果的分析材料，表明这样的题是属于容易题，还是属于中等题。

二是按咱们教学当中时间和精力的投入，以及这道题对学生知识和能力的要求，来定它的难度。

我是倾向于这样判断，而不是单纯地看测试结果得分率。

因为按测试结果得分率0.7以上就是容易题。

本来一件事情挺难的，咱费劲挺大的，最后学生掌握了。

考试下来成绩挺好。

可是按照考试理论，或者按教委考试中心的统计结果，这道题就算容易。

考试说明上有很多容易题，其实并不容易，就是因为它得分高，而被算作容易题。

我认为命题不能完全以此为依据。

判断容易题、中等题、难题，还应该结合实际参考学生的情况，水涨船高。

学生情况好，容易题也就提高一点。

学生的情况差，容易题就得再降下来些。

第三个参考点就是：

达标过关题和选拔竞赛题有不同的起点，或者说对不同类型的学生有不同的起点。

哪道题算容易哪道题算难没有绝对的标准。

但是无论如何，在你出的这份卷子当中，哪几个题算容易的，哪几个题算中等的，哪几个题算难的，一定要有比较清楚的认识，不能糊糊涂涂就这么一堆。

关于命题具体计划，有各项比例的合理搭配。

不同的知识块各占多少分；容易题、中等题、难题各占多少分；各种不同的题型各占多少分；理论与实践各占多少分，等等。

可能还有些别的比例关系，比如直接来源于课本的，占多大比例。

过去做过的，占多大比例。

直接采用过去高考试卷和中考试卷用过的成题，占多大比例。

这个都可以有比例关系。

但是都得有计划，统筹安排。

一份试卷，要控制题目难度的起点和最高点。

这关系到学生分数的分布。

例如满分150分，计划让他们平均分为100分。

但是，同样平均分为100分，分数可以比较集中，也可以比较离散。

这就跟你出题的时候，控制难度的起点和最高点有关系。

起点放得低一点，最高点再升得高一点，同样可以把平均分稳定在那个原来的位置。

但是分数的分布就可以相对集中一点。

因为你起点低了，差学生也有点分了；最高点提高了，好学生也不会太冒尖，也受一下阻碍。

这样，分数就可以离散得小一点儿。

相反起点提高、最高点降低，题目是比较集中了，学生的分数就分化得厉害了。

因为试卷里中等题目特多，差学生够不着，没什么分；好学生都不在话下，分数都挺高的。

这一切最后要体现在一个双向细目表当中。

不同的学科、不同的试题，双向表有不同的列法。

但是，必须得有。

我们在这个双向表上动了很多的脑筋。

这个双向表是设计试卷的蓝图。

实际中考、高考都有详细的双向细目表。

这是命题的总体计划。

一个小工程，例如盖一间小房子，也得有图纸，有整体设计。

这是一样的道理。

3、总体难度的估计和掌握

命题计划中有一项指标叫总难度。

一份试题在命题计划当中，就已经规定了这份卷子我想让学生得多少分。

中考、高考模拟考试的命题，对此都有规定。

中考可能是0.75，高考0.60。

全国高考，要求0.55左右。

这在理论上是有原因的。

控制总难度，这是件挺伤脑筋的事，也是挺要紧的一件事。

关于控制总难度，我谈四点建议。

第一，可以找有经验的老师试做试估。

就是拿一份题，让他估模一下考生大概能得多少分。

教师自己也得练习这种过硬的工夫。

可以说是一种目测直觉。

拿眼睛一看，根据自己的知识经验，结合各方面的思考做出一个综合的直觉判断。

没有那么多因为所以，就凭感觉，判断考生能考多少分。

考完以后与考试结果不断地对照，不断地积累。

你就能看得比较准。

这是一个需要经验，需要费脑筋斟酌的重要的事。

自己拿不准，就找那些真正有这方面的灵感和经验的老师（不一定是老教师）进行试做试估。

实践是检验真理的标准。

每次判断的比较准，你就可以依靠他。

第二谈怎么调整总难度。

高三年级，每年大的统一考试有三次。

一月份一次，五月份一次，六月份一次。

一月份的题假如出容易啦，五月份的题就想稍难一点，使总平均分降一点。

怎么个降法，就是调整总难度的方法，不只是出难题一条。

你要想让他们降点分，很多老师一下子就想到给来几道难题。

实际上远远不止这一种方法。

甚至根本不采取这种方法，也能让他降分。

可以采取的方法例如

（1）用调整比例关系的方法改变总难度。

因为各不同的知识块，不同的题型，不同的内容，他们掌握的情况是不一样的，得分情况也不一样。

你稍微改变一下比例关系，可以使总难度起变化。

（2）可以扩大题目的覆盖面，增加考查点。

题目并不难，但是考查的面比过去宽了一点儿。

（3）可以稍微提高起点。

原来起点低有些白送分的题。

现在把起点稍微提高一点，就没有白送分的题啦。

也就是把补贴的几分取消了。

（4）可以增加题量。

容易题虽然不难，可是增加了题量。

让他在短时间内准确而迅速地解题，这就是考能力。

题量增加了，等于要求提高了，就等于增加了难度。

（5）题目还是那些题，原题不动。

我们把题目的赋分值给点变化。

原来难题占分少，现在让难题占分多点。

难度就上去了。

因为难题实际得丢分。

原来这道难题5分，现在你给改成8分，无形中学生被扣的分就多了。

（6）评分标准严和松，也是调整总难度的一种方法。

评分标准的严和松，可以使总难度起变化。

（7）最后一条就是增加少量的难题，也可以改变总难度。

这些，是我们经常采用的。

我们甚至于比较少的采用出难题的方法。

难题只有少数学生能做，只有少量的分。

对于学生整体、对于整个考试结果，起的作用不大，只能对少数学生有点用。

调整总难度，往往不是采取出难题的办法。

第三，维持总难度不变，还可以采取一些措施调整分数分布。

比如专门设计几道送温暖的题，让他们长分。

低分段分数就可以上升。

因为对高分段的学生，这部分题目反正是容易题，本来就他手里的分。

低挡题放得更低一点，差学生的低分却能往上兜一下。

为了维持总难度，维持这个总平均分，高档题还要往上升，难度还要再加大些。

这样就能把高分段的学生分数往下压一压。

这样，总的来看，就是让容易题、中等题、难题的台阶变得更大一些。

这样维持总难度不变，既能够使差生分数提高，又能防止成绩优秀的学生分数过高。

这两个分数段互不影响。

这两个分数段同时调整，就可维持总难度不变。

第四，如果对总难度确实把握不准，就宁可偏易不要偏难。

说宁可偏易不可偏难，这里面有教学的规律和背景。

适度的紧张和压力，可以提高效率。

过度的紧张和压力，反而降低效率。

不会因为咱们题目偏易，而导致学生水平的降低。

也不会因为咱们题目偏易，别人说咱们水平低。

人家第一看你的题，有没有错。

第二看你的题，经不经得住大家的使用和推敲。

拿那个双向表分解以后，要经得住行家研究。

把试题总难度掌握得合适，是命题高水平的表现。

4、应防止的一些偏向

第一是盲目出题。

所谓盲目出题就是对这次测试的性质和目的不做认真的研究，没有认真的思考，上来就就忙于拼凑题。

最后的结果，是病情不清，药不对症，达不到你考试的目的。

第二个偏向是缺乏整体计划。

只是把搜集到的一些题目机械地拼凑在一起不行。

一张卷子是一个有机的整体。

它有内部结构和章法，搭配有它的道理。

打个比方，每一味药都是好药，随便抓几味掺合在一起，那绝对不能吃。

因为你不是大夫。

你不是按着药方抓的那些药。

每一味药都是好药，掺合到一块不能吃。

就是这个道理。

每一道题都是好题，随便掺合到一块，成为一张卷子不能用。

这一点也不奇怪。

其实大夫的本事在那张药方上。

你要问怎么开药方，这事就说来话长。

上了几年医科大学，都不一定马上能开药方。

所以说题目的整体计划和各项比例关系是挺有讲究的。

一道题那就只是一道题，整个卷子整体上还有很多的考虑。

缺乏整体计划，只是把题目机械地拼凑在一起。

这是一个应该防止的偏向。

第三个应该防止的偏向，就是重要的考试题目，例如中考、高考的模拟考试，只由一个人承包这一份题。

一个人很难方方面面考虑得那么周到。

必须发挥集体的力量，凝聚集体的智慧。

还要反复推敲，反复修改。

第四个应该防止的偏向，是追逐难题、偏题、怪题。

说得缓合一点，热衷于求新、求异。

老认为课本上常见的、普通的、不太难的、学生能做的、会做的，都不在话下。

总愿意出点课本上没有的，没见过的、没听说过的、新鲜的、学生不会的。

这样的题，有少量的可以，多了绝对不行。

还是要以普通的、课本上有的、学生学过的、能做会做的、不太难的为主。

有新意是在这个基础上略有变化，就算新颖了。

不是新得离纲离谱。

那就没谱了。

难点和热点，不一定是重点。

难点是难，热点是热，很有刺激性和吸引力。

然而，难点和热点，往往并不是重点。

因为考不考还不一定。

考的话，也没多少分。

所以不要一哄而上，盲目跟风。

这个事要注意。

第五个应该防止的偏向，就是押题。

把中考、高考考试说明和历年的考题进行研究以后，考点和要求，考什么、怎么考应该是意料之中的。

但是具体那道题是什么样，又是千变万化。

猜题押题无异于赌博。

过去曾经有过极偶然的巧合。

咱们一模刚考过这个难题，高考又考这类问题。

大家都特别高兴。

但是统计的结果显示，照样没有多少分。

不是说学生做过，这回就有分。

不是的。

因为你考几次，他的能力达不到还是达不到。

事实证明猜题押题没有用。

第六个应该防止的偏向，就是随意地翻印外地、外区的题下发给学校。

考试说明和中考、高考的原题，那才是研究高考、中考最权威的资料。

应该多研究它。

至于模拟考试谁出的题，张三、李四谁做的报告，都不足为凭，仅供参考。

我不主张翻印外地、外区的题下发。

就如同吃人家的剩饭似的，总不如自己做的对路。

第七个应该防止的偏向，是纠缠大纲的边缘。

对于大纲的边缘，不要做过多的学术讨论。

甚至可以不做学术讨论。

更不要针对大纲的边缘采取什么对策。

命题时愿意体现就体现一点，不体现也无妨。

无伤大雅，不会有太大的影响。

复习当中具体的要求，是各遵其便，量力而行。

有的的学生非清华不上，那就方方面面都得达到高水平；有些普通校的学生，基础的东西还没过关，大纲边缘要求不要求，对他来讲也没意义。

（二）命题工作程序及要求

1、命题程序

（1）确定考试性质、考试目的，认真研究考查对象的状况，以使命题正确导向，达到预期效果．

（2）认真研究有关考试说明、大纲、教材．注意中考、会考、高考的题型、题量、难度、试卷结构、特点的历史演变，注意对历年试题的分析评价。

注意吸收考试理论的研究成果，熟悉各题型的考查功能、命题技术和要求，在此基础上恰当确定考试目标。

（3）制定周密的命题计划，包括考试性质和目的、范围及要求、题量及分布、题型及搭配、难易及层次、试题的编排、总时间、总分数、预期难度和区分度要求等等．根据命题计划制定出双向细目表．

（4）根据命题计划要广泛征题、选题、编题、备足题量（一般是计划用题的3倍）。

再由集体讨论认真筛选。

重要考试，不得委托某一个人承包一份试题。

（5）把入选试题排入双向细目表，按命题计划进行平衡。

各项数据和比例要达到计划要求，其中要特别精心斟酌的是能力考查的设计和总难度的掌握。

（6）对题目的文字、数据、图表等进一步加工，核查答案，制定评分标准。

（7）提前完工，冷却一段时间后再思考、审查，并找命题组以外的高水平的老师独立审查、作答、核对。

（8）排版、付印过程中，要认真校对、确保无误。

2、对试题的要求

（1）题要体现考试目的，符合《课程标准》或《考试说明》的要求。

达标试题要恰当掌握标准。

选拔性试题要体现学科能力考查要求。

试题应对于测试有效，并且不超出大纲的要求。

（2）试题应确保科学性、教育性、针对性、训练性、量力性。

试题要问题明确，准确，符合学生语言理解水平，符合教材中的表述习惯，并注意用字，语法、标点规范正确。

（3）试题应便于施测，便于作答，便于评分，抗干扰性强。

试题答案应有科学定论，赋分合理。

（4）试题应有适当的难度等级（试测或预估），应有合适的区分度，以服从于考试目的，鉴别不同层次水平的考生。

（5）试题可较多采用小综合题和加以变形的常见题，力求稳中有变，不落俗套。

试题的立意、创设情境、设问的角度要新颖、灵活，对教学要有明确的导向。

3、对试卷的要求

（1）兼顾知识和能力的考查，考点分布合理，有足够的覆盖面和代表性。

题型搭配恰当，各部分知识内容分配合理，各层次能力考查题的分布应符合双向细目表的规定，对本学科各方面能力的考查应有精心设计。

（2）试题难度比例、考查深度应符合《课程标准》或《考试说明》，难题应尽量出在重点考查内容上。

（3）试卷中各题相对独立，任一试题的表述及正确解答不要构成对其他题正确解答的提示；任一试题的正确解答不能以其他某题的正确解答为前提。

（4）试卷中试题一般按题型排列。

同类型试题一般由易到难顺序排列。

同类型试题编写格式、规格应统一。

同类型试题之前应扼要说明该类试题解答要求，使考生明确做什么，怎样做，以及答案的形式和要求。

（5）应控制试卷的长度和字数，一般应保证中等程度学生在规定时间内答完并复查试卷。

（6）评分标准应仔细斟酌，因为同一份答卷由于不同的赋分将导致不同的考试结果．每题赋分应服从于双向细目表体现的命题计划。

评分标准应确切牢靠，不可有太大的自由掌握的机动分。

（7）要注意考虑学生的实际水平，发挥好、中、差学生的不同层次水平，面向全体学生，便于总结教与学中的问题，用以指导教学。

（三）试卷质量（评价）的主要特征量数

考试分数必须通过整理和统计，用某些数值来表示它们的全貌和各种特征，才能比较参加同次考试不同群体的发展水平以及分析试题、试卷的质量。

描述分数某个特征的量数，称为特征量数。

特征量数是试题、试卷分析的基础数据。

对试卷的质量评价，主要有难度、标准差（差异系数）和区分度三项指标。

（一）平均数与难度：

1、算术平均数：

算术平均数是反映分数集中位置的特征数值，可以看成一批分数的代表值。

它有两个作用：

（1）用来代表某个群体的一般水平；

（2）用作同次考试中不同群体的比较。

假定某一批分数为n个，表示为

，这批分数的算术平均数记为

，则

反映平均（数）分的两个重要数据：

某题的平均分和全卷的平均分：

某题的平均分

其中

为各考生该题得分，n为考生人数。

全卷的平均分

其中

为各考生全卷得分，n为考生人数。

一批分数在正态分布或接近正态分布的情况下，用算术平均数为其代表值是比较理想的，但如果一批分数的最高分与最低分数相差甚大，且数目又少时，算术平均数的代表性就会受到影响。

2、难度：

难度是指题目的难易程度。

（1）客观题的难度通常用通过率来表示：

.其中R表示答对人数，N表示总人数。

（2）主观题的难度是全体考生该题的平均分与该题满分值的比值：

.其中

表示全体考生该题的平均分，

表示该题满分值。

一般认为难度在0.70以上为容易题，在0.30—0.70之间为中档题，低于0.30为难题。

（二）标准差和差异系数：

1、标准差：

用平均分来反映两个群体的差异往往是不全面的。

例如，两校各有六个班，参加一次数学考试的平均成绩是

一班

二班

三班

四班

五班

六班

各校平均分

甲校

乙校

可以看出，甲、乙两校数学平均分虽然都是70分，但乙校各班数学成绩差异较小，这个平均分有代表性，而甲校各班数学成绩差异较大，70分的代表性就不大了。

可见平均分数只能反映各班成绩的集中情况，为能反映各班成绩的差异情况，因此引入“标准差”来表示一个群体或群体中的个体的离散程度。

标准差是一组数据离中趋势的典型代表。

一般来说，标准差越小，表明这组数据对平均数的离中趋势越小，总体显得比较整齐；标准差越大，表明这组数据对平均数的离中趋势越大，总体显得参差不齐。

如上述例子：

，

2、差异系数：

标准差是用来比较两个群体的离中趋势的，但如果两个单位的测量单位不同，或者虽然测量单位相同，但平均数相差很大时，用标准差不能直接比较。

一般引入“差异系数”来比较它们的离散程度。

差异系数是一个群体的标准差除以他的算术平均数，再乘以100%，记作cv。

即：

例如：

2007年高考数学（北京卷理科）解答题的得分情况如下表：

题号

满分

平均分

（

）

标准差

（

）

差异系数

（CV）

比较

8.62

3.88

45%

⑤

9.60

3.76

39%

⑥

7.58

4.60

61%

④

7.31

4.75

65%

③

2.27

3.40

150%

①

1.25

1.82

145%

②

从表中可以看出，由于试题的满分值与平均分不同，比较考生得分的离散程度要用差异系数而不能用标准差。

只有在各题的满分值相同且平均分相差不大时，才能忽略其影响直接比较标准差。

（三）区分度：

例如，某年高考数学（北京卷理科）试题的区分度如下表：

题号

平均分

难度

区分度

题号

平均分

难度

区分度

4.79

0.96

0.29

2.89

0.58

0.55

4.85

0.97

0.32

3.55

0.71

0.48

4.15

0.83

0.41

3.34

0.67

0.53

3.14

0.63

0.41

4.64

0.93

0.36

4.05

0.81

0.42

8.62

0.66

0.73

3.27

0.65

0.33

9.60

0.69

0.78

2.60

0.52

0.35

7.58

0.54

0.78

3.08

0.62

0.37

7.31

0.56

0.67

4.72

0.94

0.33

2.27

0.17

0.67

3.97

0.79

0.59

1.25

0.10

0.60

一般认为，区分度在0.3以上为合格的题目，在0.4以上为优秀题目。

从上表可以看出，该年年高考数学（北京卷理科）试题的区分度合格的试题达到95%；区分度达到优秀的试题达到65%，是一份区分出色的试卷。

展开阅读全文