新课程初中英语教学评价.docx

资源描述

新课程初中英语教学评价.docx

《新课程初中英语教学评价.docx》由会员分享，可在线阅读，更多相关《新课程初中英语教学评价.docx（28页珍藏版）》请在冰豆网上搜索。

新课程初中英语教学评价.docx

新课程初中英语教学评价

一、英语测试与评价

（一）前言

英语教学和英语测试（testing）/评价（assessment）分属两个不同的领域，但它们在教学过程中又是密不可分的两个部分。

有教学的地方就会有测试和评价。

测试和评价的原则和方法总是对教学有着强大的导向作用（backwash）。

我们老师对英语测试和评价不是很了解，这不是我们的错，因为我们学的是英语教学。

我们痛斥应试教育，可是，反过来，我们为什么不去利用它呢？

了解了测试，学会了测试，我们就可以利用测试，这就是导向作用。

这种导向作用既可能是正面的（beneficialbackwash），可以促进教学发展，有利于学生英语水平的提高；也可能是负面的（harmfulbackwash），会冲击教学，导致学生高分低能。

因此，了解并掌握英语测试与评价的基本理念和方法有助于中小学老师的英语教学工作。

本专题重点介绍英语测试和评价的发展趋势、基本理念和中小学英语常用测试与评价系统设计与实施的基本方法、原则与要求。

1.1发展趋势

（1）外语测试逐渐成为一门独立的学科

我们平常觉得很普通的英语测试和评价工作，实际上涉及到多方面的理论和知识。

从二十世纪六十年代起，外语测试已发展成为一门多学科交叉的跨领域学科，其理论和应用涉及普通语言学、应用语言学、社会语言学、心理语言学、外语教学法、心理统计、教育测量和计算机科学等。

外语测试主要通过研究各种外语测试的指导思想、测试目的、考试内容、方法、命题技巧、评分以及通过数据分析、评价测试和学生成绩，探讨外语测试的规律，及如何对外语教学产生正向的导向作用。

（2）标准化外语测试普遍使用

70年代以来，我国外语考试的改革走在了其他学科的前面。

英语界最早引进多项选择题和完形填空测试方法，为题型的改革作了有益的尝试。

1981年我国研制开发了第一个英语标准化考试（EPT），在此基础上，又发展了CET、MET、PETS等有影响的英语标准化考试，并先后引进了光电阅读器阅卷和计算机英语考试（高兰生等，1996）。

大规模测试试卷的设计、制作、实施和使用的标准化程度得到提高。

标准化测试既能客观地评价学生的英语水平，也便于批改。

（3）交际语言测试受到重视

近二十年来，随着交际教学法的发展，以考核学生语言交际能力为主要目的的交际语言测试（communicativelanguagetesting）受到了越来越多的重视，有条件的考试都增加了英语口语和听力考试。

（4）提倡形成性评价

这是和我们最有关的一点。

近年来，语言学习理论关于语言发展过程的研究和学习者个体差异的研究给外语教师带来了观念上的变化。

以学生为中心的外语教学，激励学生讲英语，鼓励学生多投入，多练习，通过学生的体验、参与、实践和合作，形成积极的学习态度，促进语言实际运用能力的教学理念受到关注。

形成性评价和终结性相结合的多元评价体系成为新课程评价改革的重要目标。

1.2存在问题

•缺乏专业的评价和测试系统研发队伍

•现有测试系统不能完全体现国家课程标准为七至九年学生设置的教学目标

高考是标准参照的，为要考查学生的实际英语水平，而中考试卷基本还是课本参照，如Readingcomprehension仍以考查语言知识为多。

考试标准应在学生一进校门时就让师生知道，到初三就来不及了。

•一线教师缺乏基本测试理论知识，不能高效地利用评价与测试来提高教学效益

比如说，我们往往要求学生背诵Dialogues.Dialogues是拿来背诵的吗？

1.3重要概念

•评价——assessment，它是总称，是总的评估。

•测试——test，它是assessment的一种做法，是要有目地、有计划地检验学生掌握到何种程度。

•形成性评价——formativeassessment

•终结性评价——summativeassessment

•导向作用——backwash

•有效性/效度——validity

•可靠性/信度——reliability

•可操作性——practicality

1.4测试的种类

•水平考试——proficiencytest，如公共英语等级考试，高考。

它们只有大纲，没课本参照。

•成绩考试——achievementtest，如期中考，期末考，中考。

它们是以教材为依据的，考查学生在教材范围内掌握的程度。

这种考试会导致功利心，如猜题。

其实猜题是不道德的，因为在猜题过程中，教师会在无意之中压缩教学范围，这对学生不公。

•诊断性考试——diagnostictest，这是小项目的测试，如课堂中dictation,dialogueperformance,makingsentences,compositionwriting等。

•分班考试——placementtest，它是为了分层教学，也为了更好地了解学生，区分度较高。

这种考试在外国比较普遍，在中国就不了。

•直接性/间接性考试——direct/indirecttesting，直接性考试如写一封信、听对话或独白后填空，间接性考试如以填空的方式让学生解题来考查学生是否会写信了。

•分部分的考试/整体化考试——discretepoint（即听力、口试、阅读、写作分开）/integrativetesting（即我们中国流行的综合卷）

成绩参照/标准参照的考试——normreferenced/criteriareferencedtesting，成绩参照的考试如托福，三好生评比，操行考评。

其目的是使人进步，优点是通过分等级可鼓励一部分人，缺点是一定要有人不及格。

标准参照的考试是指只要达到某标准，人人皆可优。

客观性考试/主观性考试——Objective/subjectivetesting

•机考——computeradaptivetesting，如托福，机动车驾驶员考试，错了，再给你类似的另一题，对了，就给你稍难的，一步步前进到所要求的程度。

其优点可避免漏题，当然，它也有时间限制。

•交际性考试——communicativetesting

（二）英语测试与评价的主要作用

•了解学生现有语言水平，发现和诊断语言学习中的问题，

•检查和评价学生在某一阶段或某一课程学习中对所学内容的掌握情况，

•主要是测量学生英语语言知识和综合运用英语的总体水平，

•主要是预测学生是否具有学习外语的天赋或潜在能力（aptitudetest），

•激励学生学习。

（三）评价和测试设计的原则

•有效性（validity）

•可靠性（reliability）

•可操作性（practicality）

•公正性（fairness）

•区分性（discrimination）

（1）有效性

指语言测试能测出预定要测量的事物的程度。

如：

用作文考查写作能力就比用多项选择题有效。

用听写考查听力，评分不当，考试有效性就会降低。

有效性反映在测试的不同方面，验证有效性要通过多种途径收集数据。

如：

内容有效（考试内容的代表性，选择内容应广泛）、结构有效（试卷结构的合理性，兼顾语言内容和技能的各个方面）、共时有效（现行考试与以往成绩的关系，与教师掌握的情况相比较）、预测有效（考试成绩与学生以后发展的关系）、评分有效（评分标准真实反映考生英语水平的程度）、答题有效（学生答题情况：

是否认真，是否作弊）等。

（2）可靠性

•指语言测试的测量结果一致性的程度。

包括考试的可靠性（稳定一致的程度）和评分的可靠性（稳定一致的程度）。

•重要量化指标：

相关程度（reliabilitycoefficient）

标准差（standarderror）

真分（truescore），例：

一个考生在某一考试中的60分，他/她的实际成绩有68%的可靠性在55分-65分之间，有95%的可靠性在50分-70之间，有99.7%的可靠性在45分-75分之间。

.评分可靠性（scorerreliability），指评卷者的主观因素对考生得分的影响程度

•保障可靠性技术手段有：

.有足够的试题，题越多，相对可靠性越高，如：

检测阅读能力，三篇短文、三组题目比一篇短文、一组题目的可靠性要高

•试题设置应顾及个层次的学生,当然试题要参照课程标准,而不能参照课本。

•适当限制考生的答题自由度

•题目不应有一种以上理解

•试题说明应简洁、明了

•卷面设计科学，留有足够的答题空间，如打“0”比打“√”科学。

•让考生充分熟悉考试形式和答题技巧，所以，做适当的模拟试题是需要的。

•统一考试实施要求，如2005年高考浙江取消听力就是因为各地媒体条件不一。

•限制评卷者/测试员的评分自由度，这需要有相应的制度才能保障。

•提供尽可能详尽的标准答案

•允许标准答案以外的正确答案

•训练测试员

•隐匿考生的姓名

•主观性考试采用两个独立评卷人

（3）可操作性

•指实施语言测试的难易程度，投入的人力和财力；评卷的难易程度和解释分数的难易程度。

如：

大规模考试要考虑便于操作和试卷保密、主观题评分的可靠性等方面。

（4）公正性

•所有考生所获得相关条件相同

•所有考生得到同一尺度的的测量

（5）区分性

•指某次语言测试能够区分参加考试学生优劣的程度，也即难易度。

检验试题的区分度，主要是测算难易度和区分度。

如：

我们出了50道题，100个人来做。

有的题，100人全都做错了，或100人全都做对了，这样的题就是太难了或太容易了。

好的试题的难易度在30－70之间。

有的题，如果水平好的同学做对了，水平差的同学做错了，这样的题就有一定的区分度。

测算的时候，要把学生分为三组，比较高分组和低分组答题的情况。

有的题，如果水平好的同学和水平差的同学做对的一样多，就是没有区分度。

如果水平好的同学做错了，水平差的同学猜对了，这样的题就是废题，一定要淘汰。

升学卷尤其要把握好区分度。

它应如何把握呢？

难题应超越、略高于大纲要求或考试要求，但也不能是怪题、偏题；大多题应是国家课程标准所要求的；简易题应该是那些哪怕英语水平烂得不能再烂的学生也必须拿到的，一般占30%。

（四）新课程英语测试与评价的基本要求

•《英语课程标准》（实验稿）指出，测试与评价的三个主要目的是：

“使学生在英语课程的学习过程中不断体验进步与成功，认识自我，建立自信，促进学生综合语言运用能力的全面发展；使教师获取英语教学的反馈信息，对自己的教学行为进行反思和适当的调整，促进教师不断提高教育教学水平；使学校及时了解课程标准的执行情况，改进教学管理，促进英语课程的不断发展和完善。

”《英语课程标准》（实验稿）主张建立能激励学生学习兴趣和自主学习能力发展的评价体系，评价体系应由形成性评价（formativeassessment）和终结性评价（summativeassessment）构成。

•《英语课程标准》（实验稿）建议终结性评价（如期末考试、结业考试等）要注重检测学生综合运用语言技能和语言应用能力。

终结性评价是反映教学效果、学校办学质量的重要指标之一，要客观、科学、全面考查学生在经过一段时间学习后所具有的英语水平。

测试应包括口试、听力考试和笔试等形式。

《英语课程标准》（实验稿）同时指出形成性评价是教学的重要组成部分和推动因素。

在英语教学过程中，应以形成性评价为主，注重培养和激发学生学习的积极性和自信心。

一线英语教师应善于将形成性评价有机地融入教学过程，营造开放宽松的评价氛围，形成生动、活泼、开放的学习气氛。

同时应了解和熟悉终结性评价的要求和形式，观察两种不同形式的评价结果，分析和研究两种评价的相关程度，以全面评价学生学习效果并反思教师教学工作。

（五）形成性评价

5.1形成性评价的主要设计原则

形成性评价注重对学生发展和学习的作用。

形成性评价的主要目的是激励学生学习，帮助学生调控自己的学习过程，使学生获得成就感，增强自信心。

通过有效的形成性评价，教师要让每一位学生感觉到——老师对我最好。

如：

对学生较好的表现，不妨以“Good”、“Wonderful”“Excellent”进行评价，表扬词还是简单点为好；纠正学生的错误以轻描淡写为佳，如纠正Helikeswimming,不妨采取“Helikeswimming”↑or“Helikesswimming”↓，即用升降调供学生选择。

教学课程中进行的向学生和教师说明学生学习进展的测试，只包括被教的内容，说明学生是否需要增加学习量或注意力。

形成性测试通常以及格或不及格表示，如果不及格，学生就得加强学习并重新参加考试。

5.2形成性评价的主要主张和特点为：

1）重视语言学习的过程，而不是语言学习的结果；

试比较：

“某某同学以前不……，今天终于……。

”和“某某同学曾经…，但他经过怎么怎么的努力，今天终于……。

我为他高兴。

”第一种只有结果，第二种突出了过程，两者的激励效果完全不一。

2）重视动态的进步，而不是静态的位置；

如：

最差班虽然还是最差班，但可以拿数据，用事实说明自己比自己还是进步的。

3）认为学习和测试是有机的整体，而不是分阶段的、分离的任务；

4）语言学习本身是一个不断学习的终身教育，而不是考试前的阶段性任务；

5）鼓励合作性学习，而不是学生间的竞争或攀比；

因为这是一个竞争的社会，所以须用合作来淡化竞争。

如两考官考两考生，每一考官打一学生的分，两考生必须要合作好才能拿高分。

6）重视学生是否达到课程的标准，而不是学生的成绩在班里的位次；

只要达到某一标准，一个班可以人人达A。

7）关注学生的进步和能力，而不是学生的弱点和失败；

重视学生参与和进步（所以要建立学生档案），而不是一次的考试成绩（保存试卷）；

8）注重试题或评价的多种可能性答案，而不是答案的唯一性；

9）鼓励教师开发有意义的课程内容，而不是为考试、为名次教学。

5.3形成性评价的主要形式

1.课堂观察（classroomobservation），教师通过对学生在课堂上听课、交谈、使用教材或运用语言的观察，评价学生的学习情况，观察结果可以是表格统计的形式或日记形式记录下来，这为建立档案打下了基础。

因此，老师不要总站在前面，而要带着期待、欣赏的目光走到学生中去，了解学习情况，发现问题。

这既是一种评价手段，又是一种教学手段，比如，教字母书写时，老师单凭讲讲有用吗？

走下去，个别悄悄纠正为好。

这样，老师在传授知识的同时，又关注学生，会让学生感觉老师是重视我的，反过来也影响学生对老师的评价。

要注意的是，对差生、对优生的态度要一样，要平等，不须给差生偏多的关注，因为学生不等于孩子，老师千万不要让自己替代家长的位置。

至于观察记录，如果忙不过来，可以采取分组记或分批记的方式。

2.学生英语水平发展档案（portfolios），教师可以指导学生为自己建立一个档案袋，记录、收集学生在学习过程中所做的努力和取得的成绩，增强学生的参与意识和学习热情，并作为自我评价的依据。

档案袋里装的是资料，是学生自己收集、记录的他所有的成绩（即好的、优秀的东西），参与活动情况及所有一切的证据，如照片、试卷、默写本或纸。

档案袋分目录，具体内容两部分，由学生自己记录，自己保存，老师抽查时，全看目录，抽看里面内容，然后打分。

3.学生英语成绩档案（profiles），它由老师做，保存在老师那儿，里面记录的是每个学生英语水平发展轨迹，如成绩单，成绩分析表，为个别指导提供参照。

4.学习周记（journals），可以安排学生每周写周记总结和归纳本周的学习内容，分享喜悦，倾诉烦恼，提出问题，反思不足，总结经验，探讨技巧，是学生和老师交流的有效途径。

老师必须认真对待每一篇周记，并及时反馈。

5．问卷调查（questionnaire），给学生发放问卷，通过问卷，引导学生有效地、正确地评价自己的学习。

问卷可以是自我评价，也可以是相互评价。

6．面谈（interview），教师可定期安排与学生面谈，通过面谈了解学生对自己学习情况的的感受和看法，以评价学生的进展和存在问题。

7．讨论（studentsconference），安排学生座谈，给学生提供相互交流的机会，这种互动讨论为教师提供了具体的评价机会。

形成性评价时，要有计划地根据教学内容灵活设计，做到持之以恒。

评价要有利于学生的情感投入，有利于学生的自主学习，有利于培养学生的学习策略，有利于学生生动活泼地学习。

（六）终结性评价

6.1终结性评价的主要设计原则，还是有效性，可靠性，可操作性，公正性，区分性。

6.2终结性评价的主要形式

•口语能力测试

•听力能力测试

•阅读能力测试

•写作能力测试

•综合测试

口语能力测试

•口语测试主要通过让考生接收、处理英语信息，并输出相应的英语信息的方式测量考生的英语能力和英语知识水平。

•主要形式：

直接型（测试员-考生，考生-考生），

间接型（以笔试的形式靠口语知识），

半直接型（以录音机、计算机、电话/可视电话等）。

•设计原则除了要遵循试卷设计的基本原则外，还应体现交互性、情景性和文化得体性。

•设计还应尽力克服因主观性测试带来考生得分的可靠性较低的问题。

听力能力测试

•听力测试通过让考生输入英语信息，按一定答题（选择、填空、判断等）方式测量他们的输入、处理英语信息并作出正确反应的英语听力能力。

•设计原则除了要遵循试卷设计的基本原则外，还应遵循口语性、真实性、情景性以及与他们的英语以外知识背景相一致的原则。

阅读能力测试

•阅读测试通过让考生阅读几篇与相关教学目标一致的短文，按一定答题（选择、填空、判断等）方式测量他们的输入、处理英语信息并作出正确反应的英语阅读能力。

篇章一篇是不够的，至少三篇以上，且须不同领域的，不能太易也不要太难。

中考一般三篇，高考一般5篇。

•设计原则除了要遵循试卷设计的基本原则外，还应遵循真实性、情景性以及与他们的英语以外知识背景相一致的原则。

写作能力测试

•写作测试主要通过让考生接收、处理英语信息（阅读考试说明），测量他们书面表达能力和英语知识水平。

•主要形式：

直接型（写作），

间接型（以笔试的形式靠写作知识），

•设计原则除了要遵循试卷设计的基本原则外，还应遵循真实性、以及与他们的英语以外知识背景相一致的原则，

•与口试一样，设计还应尽力克服因主观性测试带来考生得分的可靠性较低问题。

综合测试

•目的在于测量考生的综合语言能力和知识水平，其主要题型除了与前面各型试卷相同，还有综合选择、完型填空等。

•综合试卷的缺点是有效性，特别是可靠性差，但可操作性强。

分类测试则相反。

6.3试卷设计过程

•根据测试目的和课程标准中相应的教学目标后确定考试类型及测试内容，

•设计出试卷总体框架，包括项目、内容、题型、试卷整体布局、试卷说明，

•试测（测试题）、修改、试测（测说明）、修改、定稿，

•编写试卷（第一次至少五套）、实施手册、测试员遴选培训选拔、模拟卷，

•准备实施。

二、如何正确地评价学生

（一）专题研究

作为教师我们经常听到这样的说法：

某个学生真是很聪明，学习成绩在班上名列前茅；某个学生太差了，无论怎样辅导，学习成绩还总是在最后等。

如我们好好追究一下此类话的来源，就会发现，许多的教师将教学评价等同于测试。

的确，我国许多中小学英语教学的主要评价形式仍套用中考和高考形式的测试方式，仅仅通过一次考试分数的高低来评价一个学生的好坏。

过分强调甄别与选拔的功能，忽视对学生学习过程的评价，忽视学生的全面发展和学生的个体差异。

另外在评价活动中，被评价人和评价的关系也趋于单一。

教师运用试卷对学生进行检测，似乎是教师和学生的唯一一种评价关系。

教师较少想到引导学生进行自主评价，也较少想到和学生进行合作评价。

在这种教学评价体系下学生的心态存在问题，而且被动接受外部评价，容易造成一些成绩较差的同学的自卑情绪，甚至自暴自弃。

这样既损伤学生学习英语的积极性，又不利于发现和发展学生多方面的潜能。

随着英语学习的不断发展，教育者们已经开始意识到了这个问题，所以在《英语课程标准》（实验稿）中对英语课程评价作了明确地说明：

“通过评价，使学生在英语课程的学习过程中不断体验进步与成功，认识自我，建立自信，促进学生综合语言运用能力的全面发展。

评价既要关注学习过程，又要关注学习结果；要注重过程评价，注重评价学生在英语学习中形成的情感态度、学习策略和价值观；要重视学生的自我评价，充分体现学生在评价中的主体地位，力求评价方式的多样化和评价主体的多元化，提倡学生、同伴、教师、家长等共同参与评价。

”所以我们在使用新教材的同时，对形成性评价方式也进行了一系列的探索与尝试。

下面，让我们走进课堂，来看几个案例。

（二）走进课堂

案例一

以现行的初中英语课程改革试验教材《Goforit!

》第一册第12单元（Unit12Myfavouritesubjectisscience．）为例，分析学生档案作业的布置及评价：

语言目标

学习策略及技巧

重点词汇

✧以what,who,why引导的一般现在时的特殊疑问句

✧用because陈述句回答

✧掌握一周中7天的表达方式

✧掌握表示学科的词汇

●群体思维

●参照图表

●互换信息

●Math,science,history,P.E,favor,teacher,

●Monday,Tuesday,Wednesday,Thursday,Friday,

Saturday,Sunday

语言结构

语言功能

跨学科学习

以what,why,who引导的特殊疑问句及其答语

●谈论自己喜爱的学科并说明理由

●谈论自己喜爱的事物并说明理由

●思维：

调查偏科的倾向，重视各科的学习．

【档案题目】他们喜欢什么?

（Whatdidtheylike?

）

每个时代学生的特点、兴趣是有差异的。

让学生向父母、祖父母等长辈，了解他们当年的学习状况和爱好，看看有哪些相同和不同之处，试分析原因．

【活动过程】先把学生分成不同的小组，自行设计探究实践方案。

教师提供一个案例：

1）采访自己的父母和祖父母，询问他们当年求学时与我们现在环境的相同与不同，填写表格，分析原因：

我和父母

我和祖父母

相同点

不同点

相同点

不同点

社会环境

学习环境

学习态度

原因分析

2）采访自己的父母和祖父母，询问他们当年求学时最喜欢的科目、教师及喜爱的原因，并填写表格：

我

父亲

母亲

祖父

祖母

最喜欢的科目

最喜欢的原因

最喜欢的老师

最喜欢的原因

3）绘总收集到的信息，综合分析数据，撰写探究实验报告。

从中看到时代的巨大变迁给人们带来的不同的生活环境，学习环境，学会今日来之不易的幸福生活。

分析

本案例是在十二单元学习完结构“Myfavorite．．．is···，because．．．”的基础上进行的一项课后挑战性探究实践活动，难度在于其探究活动完成后的报告写作要求高。

‘

写作要求

首先，要有信息的收集部分，占报告总体的4０％～５０％。

包括：

表格信息统计、采访录音摘要、环境背景介绍等等。

第二，要有数据的分析和汇总部分，占总体的30％～40％。

这里重点是相同点与不同点的原因分析，包括：

社会环境、学习环境、家庭环境、态度看法等等方面的异同。

第三，要有探究实验结果，占总体的20％～30

展开阅读全文