重建高考作文评分规则的思考.docx

上传人:b****4 文档编号:11534355 上传时间:2023-03-18 格式:DOCX 页数:4 大小:22.20KB
下载 相关 举报
重建高考作文评分规则的思考.docx_第1页
第1页 / 共4页
重建高考作文评分规则的思考.docx_第2页
第2页 / 共4页
重建高考作文评分规则的思考.docx_第3页
第3页 / 共4页
重建高考作文评分规则的思考.docx_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

重建高考作文评分规则的思考.docx

《重建高考作文评分规则的思考.docx》由会员分享,可在线阅读,更多相关《重建高考作文评分规则的思考.docx(4页珍藏版)》请在冰豆网上搜索。

重建高考作文评分规则的思考.docx

重建高考作文评分规则的思考

重建高考作文评分规则的思考

“花里胡哨的作文竟是满分作文!

”已经不止一次听到这样的忿忿之言了。

诚然,作文评分受到诸多因素制约,是评价的世界性难题。

但是,当质疑的声音聚焦于2012年浙江省30多万份作文卷中选出的6篇满分作文时,我们需要思考的,就不仅是阅卷员的主观性问题(如立意定势、风格偏爱、趋中倾向等[1]),还有其他更为关键的问题。

一、满分作文的粗略评点根据网上评卷双评差值“语文作文双评或三评中出现满分,系统自动提交进行终评”的规定,一篇满分作文的产生至少三评,且一般经作文组长或学科组长审查终评的。

也就是说,6篇满分作文,其优秀性最符合评分规则中的优等标准,几无瑕疵。

真是这样吗?

限于篇幅,我们只能窥斑见豹。

请看某考生《矮纸斜行闲作草》,全文以“坐在路边鼓掌,其实也挺好”立意,第1~3段(302字)为第一部分,用华丽的文笔铺垫,再提出观点;第4~9段(470字)为第二部分,以“苏子的旁观”和古语“无欲则刚”展开形象论述;第10~11段(91字)为第三部分,以“但求闲作碧池边的一席矮草”点题并为全文作结。

作者具有清晰的立意、严密的构篇和老练的语言驾驭能力,这不容否定。

但是,文中所说的“旁观”“无欲”,是否就是在“路边鼓掌”?

用苏轼的材料,是否也有套话作文“题材总是选用历史文化(文学)名人”之嫌?

全文议论、抒情、描写兼用且分类相当,属于“论述类”还是“文学类”?

如归入“散文”,又是哪类散文?

如此等等,自可见仁见智。

其实,所以选这篇考场满分作文说事,实在因为它具有近几年浙江省高考满分高分作文的典型样貌:

题意上,善借命题中的关键词点化全文;素材上,巧用历史文化(文学)名人和所谓的“陌生化名言”;文体上,崇尚散文化的议论文;语言上,善用诗化语言。

然而这篇满分作文,如果让北京市高考语文阅卷组负责人、北京大学中文系漆永祥教授来评,将会如何呢?

在接受《中国青年报》记者采访,回答“高考作文质量下降主要体现在哪些方面”一问时,漆教授说:

存在的问题非常多。

首先,在所谓“攻略”的引导下,不少作文“假大空”,程式化、模块化严重,模仿痕迹明显;其次,喜欢用生僻、华丽或怪异的词藻,排比句型,夸张语言或者四不像的“文言文”,来表现自己的知识面和写作才能;第三,内容空洞无物,没有生活气息、真情实感,没有年轻人的朝气;第四,错别字、替代词甚至网络语言使用越来越多。

[2]以笔者所见,漆教授所说的“假大空”“用华丽的词藻,排比句型来表现自己的知识面和写作才能”“内容空洞无物,没有生活气息、真情实感”这些词句颇可以用作这篇满分作文的“评语”。

难保漆教授不会将这篇作文打入二类、三类之列。

为何如此?

是浙江阅卷者的集体风格偏爱?

还是阅卷团队存在强权?

但满分作文至少是三人匿名评断的呀。

笔者以为,所以如此,必有多方面原因,但“上有所好,下必甚焉”,评分规则这根高考的“指挥棒”难辞其咎!

二、现行评分规则的问题思考评分规则就是用来评分的准则或规定,通常包括等级/水平、描述符和表现样例三部分,作为一种评价工具,它提供表现程度或水平的描述,适用于对学生复杂表现或作品(如作文)的评价。

[3]现行的高考作文评分规则包括分项评分规则(习惯称为“分项分等评分标准”)和整体评分规则(一般设五类,每类有特征描述)两类。

(一)现行评分规则的静态分析根据朱迪思·阿特等的研究,合格有效的评分规则应考虑内容/覆盖面、清晰度/详细度、实用性、技术合理性等方面。

[4]现行的评分规则,无论是分项还是整体的,均基于《考试说明》,汲取了我国近百年来有关写作能力、写作要素研究的成果,总体是合格有效的。

但是,现行的评分规则,下列问题不能不引起思考。

1.是否抓住“关键因素”?

内容是全面的,一般包括基础等级的“内容”和“表达”、发展等级(或称“特征”)。

但是,它是否足够成为判断高考作文的“关键因素”,也就是说,是否抓住最能区别不同水平作文的核心指标,却是要打问号的。

2.描述是否足够清晰?

“足够清晰”,意味着运用同一评分规则,不同的教师,或同一教师相隔一段时间,能对同一篇作文给出一致性高的评定。

这一点,由于语言本身的模糊性、要素描述的概要性,始终是作文评分的世界性难题。

如今的评分规则,也并没有突破。

3.内容再完整、描述再清晰,还需要操作简便,这就是实用性的要求。

从如今的阅卷操作看,有多少阅卷员能记忆评分规则,并严格遵循规则?

4.技术合理性方面,一般要求整体的评分者一致性不能低于65%,单个评分点不能低于98%。

[4]目前我们没有见到高考评分的相关数据,估计这是非常高的一个指标,少能企及。

(二)现行评分规则的操作分析有了合格有效的评分规则,尚需对评分规则的合理使用,否则也会影响评价的效度、信度。

在作文评分规则的运用中,下列问题不能不引起注意。

1.分项评分规则形同虚设。

传统阅卷,阅卷员用笔打分,尚能在作文上画画圈圈,最后写出“内容+表达+发展(特征)”分项分和总分。

而今网上阅卷,只用键盘、鼠标输入评分,分项评分难以持续,名存实亡。

2.整体评分规则如何落到实处。

对大范围且要求快速评分的高考作文评分来说,分项评分远不如整体评分。

但由于“关键因素”没有考虑文体(特殊写作能力)分类等,其通用性(如立意深刻、结构严谨)受到限制,评分规则的实用性就大打折扣。

3.“操作细则”如何补充“等级评分标准”之不足。

不管是分项的,还是整体的作文评分规则,总不能罗列全部的评分点。

从现行的各省操作看,均有“操作细则”,但从我们见到的情况看,均失之过简,未能起到统一阅卷分歧点的作用。

4.“表现样例”是否典型,是否经过足够的讨论并形成共识,这是操作的关键。

学理上说,表现样例应是“事先”的,与评分规则一同制订。

在高考作文评分中,却只能“事后”的,在足够的试批中甄选。

但从这几年非官方流出的例文看,其“样本”性质显然不足。

(三)现行评分规则的效用分析评分规则要满足客观、公平、快速阅卷的需要,这是首先要思考的。

但是,仅此是不够的。

为什么“满分作文”遭人质疑?

为什么良善的阅卷者激愤而言“作文评分是草菅人命”?

为什么难以破解学科专家屡屡感叹的“高考作文质量下降”难题?

我们认为,这与没有发挥评分规则的教学引导作用有关。

尽管高考与日常的形成性考试相比,不需要反馈分项得分和补救教学,但对后来的考生具有重要的学习价值,对教师具有教学价值。

如何发挥评分规则与命题所共有的“指挥棒”作用,值得探索。

三、高考作文评分规则的重建既然现行的评分规则有诸多问题,就当加以重新审视,并作审视后的修订或重建。

(一)“关键因素”的厘定开发评分规则,首要任务是弄清足以区别作文水平高低的特征,也就是“关键因素”。

根据初步的研究和实践,我们认为,高考作文评分规则的“关键因素”有审题立意、材料运用、文体特征、结构布局、语言表达、卷面格式等六个维度。

1.审题立意,意在检测审题、确定中心(即立意)的能力,包括三个子因素(或评价项目):

一是切题情况,二是立意的清晰度,三是立意的高下。

2.材料运用,意在检测素材的积累、选择和组合的能力,包括三个子因素:

一是与作文中心的一致性,二是材料的质量,三是对材料的处理。

注意,不同的文体对材料的选择、处理有所不同,如能加强这方面的权重,正确引导学生梳理生活积累、丰富阅读积累,可有效控制“套话”作文,实现写作本真的回归。

对满分高分作文的指责,莫过于内容空泛,与传统作文“言之有物”的认知相背离。

3.文体特征,意在检测选择、运用体裁的能力,包括两个子因素:

一是符合某一文体惯常特征的情况,二是表达方式的运用与文体特征的契合度。

近年来高考高分作文的文体特征模糊,样例单一(少有典型的议论文、记叙文),“四不像”作文泛滥,与《课程标准》《考试说明》的表述模糊、与“文体不限”导向的误读有关。

如要纠偏,专家解读、日常教学、高考评分都需要作出努力。

4.结构布局,意在检测思维的条理性(思路)和结构安排的能力,包括三个子因素:

一是段的划分,二是段的排列,三是段的技巧性处理。

结构布局,可以简称“文脉”。

文脉清晰的文章,有助于实现作文“作者—读者”的言语交流。

传统作文要求“言之有序”,其内在表现为思而有路,外在则表现为段落的处理,实际上是内外兼顾的,评分中要注意”隐”和“显”之间的平衡,鉴别纯技巧的投机者。

5.语言表达,意在检测语言表达能力,其评估价值是由语文学科的性质决定的,包括两个子因素:

一是规范、通顺的程度,二是丰富、灵活的程度。

语言是写作中最为稳定的因素,而其评分主观性最强,易受阅卷者的语感强弱和风格偏爱影响。

不少教师偏爱华美,学生效而从之,助长华而不实的文风蔓延,应当引起重视。

6.卷面格式,包括四个子因素:

一是正字,二是标点,三是格式,四是行文(字写得是否漂亮)。

前三者属于书面表达的纯技术性要求,评估的客观性最强;后者属于书面表达的美学效应,容易“先入为主”,导致晕轮效应,影响综合成绩的评定。

(二)评分方法的选择确定关键因素后,还需要选择评分方法。

评分方法,依据评分规则的类型,分整体法(综合法)和分项法。

选择的基点,一是有效性,哪一种最能体现评分结果一致性、实现跨时间稳定性,具有理想的区分能力;二是实用性,哪一种更适合阅卷者的经验,以实现有效基础上的快速阅卷,做到公平、效率兼顾。

1987年江西、1991年河北曾有这方面的实践检验,整体法和分项法的相关系数分别为0.885和0.924,没有实质性差异。

[1]高考作文评分均可采用,问题是具体怎么操作。

1.整体评分法的运用。

整体法的优势是快速作出评定,其快速在于:

①作文本身的特点,关键因素的分解只是研究的需要,实际上彼此联系成为一个整体;②阅卷者的心理特点,阅卷者对评分规则的掌握是靠记忆来保持的,这种记忆带有抽象性和综合性;③阅卷者的专业判断能力,成熟的阅卷者能快速阅读并作出判断。

我们在2011~2012学年区、校两级高三作文阅卷中,设计和采用了整体法。

(1)六个方面都较优秀的,可判一等(51~60分)。

(2)四个方面较优秀的,其他两个方面一般的,可判二等(45~50分)。

(3)三个方面较好的,其他三方面一般的,可判三等(39~44分)。

(4)有两个方面问题很突出的(卷面格式除外),可判四等(33~38分)。

(5)离题,套作,字数在600字以下,有三者之一的,可判五等(32分以下);其中离题且字数不足400字的,20分以下。

与高考作文的纯选拔性不同,这样的设定,是基于教学反馈、阅卷速度,而其效度、信度等都缺少研究和检验,仅作为例子使用,具体操作有待于完善。

2.分项评分法的运用。

需要解决两个问题:

一是分项的数量和各项的权重,二是网上阅卷的技术支持。

根据信息加工学原理,人们对项目、等次的区分能力大致在3~7个(级)之间,超过7个往往难以辨别。

作文评分的六个“关键因素”,在正常的辨别阈内,但还是不够简便,为此,我们需要重组,粗略设计如下:

内容(20分):

审题立意,材料运用。

形式(15分):

文体特征,结构布局。

语言(20分):

语言表达。

文面(5分):

卷面格式。

一般认为,作品的“形式”包括结构、语言、体裁。

我们将“语言”单列,是为了凸显其在写作能力构成中的地位。

“文面”可有三种处理:

一是独立设项,控制权重(如上);二是并入“形式”;三是做加减分处理,列入“操作规则”。

如果分项评分,阅卷屏幕就需要设置分项,阅卷者分项打分,由机器生成总分,在不增加阅卷人员劳动强度的情况下,使分项评分与整体评分结合起来。

3.建立评分模型的考虑。

阅卷者对评分规则的记忆特点,无论是整体评分还是分项评分,都不具有亲切性和直观性,能否借助统计学、工程学的方法,将分项(含权重)、整体评分、操作规则等综合思考,开发类似“九九乘法表”“天体运行图”那样的模型,以提高阅卷的效度、信度和速度,寄希望于更多的研究和探索。

(三)操作细则和表现样例的确定确定评分规则和评分方法后,就是评分规则的操作。

评分规则的操作,涉及配套规则的制订、阅卷员的规则使用、考务管理等方面。

这里只谈操作细则和表现样例的确定。

1.必须高度重视细则和样例。

广义的评分规则应包括操作细则、表现样例。

高考作文评分规则进入使用阶段,必须尽快确定操作细则、表现样例,以解决规则的模糊性、抽象性问题。

另一方面,每次考试的试题都有个性,都有与其他试题不同的地方,而且考试作文的实际写作情况,都有超出命题预想的,显出“事先”制订的评分规则不完善的地方。

2.多种确定方法并用。

一是阅卷核心组专家确定,这需要在阅卷员集中前完成;二是让全体阅卷员在试批阶段参与细则制订、样例确定;三是前两种方法的综合。

确定后的细则、样例,都需要点评、解读和充分的讨论,以取得最大的共识。

3.细则和样例的“质”的规定。

作文的“操作细则”,需要有利于解决评分规则操作中的实际问题。

如“审题立意”三个子因素,要结合学生作文的多样性,尽可能明确评分规则中“切题”“偏题”“跑题”和“立意深浅”等比较模糊的概念,确定等间距离、分界,尽可能在试批环节就减少阅卷员的随意性和立意思维定势的干扰。

表现样例,则要解决三个问题。

一是各档例文的选定,未必需要各档的最佳。

在阅卷实践中,常出现一、二类卷不敢打高分,四、五类卷不愿给低分,从而形成趋中倾向,因此一、二类卷应取下限,三类卷取上下限,四、五类卷取特征。

二是有足够的例文数量,如果将作文分为五等,每等又分上、下,那么需要的例文量为5×2=10篇,如果再分文体,则需要20篇或30篇,这在试卷随机流转、阅卷强调速度的情况下,是很难做到的,但并非无法可想。

三是例文要附有依据评分规则作出的评语,明确评等评分的理由,把评分规则具体化。

(四)评分规则教学效用的发挥要发挥评分规则的教学效用,“公布策略”是首选。

华东师范大学课程与教学研究所崔允漷教授曾说:

“没有理由把学生蒙在鼓里,不让他们知道你要评价什么、你将依据什么标准来评价。

提前给予学生评价内容和评价标准,他们可以为此早做准备。

”[3]如何“公之于众”?

其方法很简单,在《考试说明》的参考试卷中提供试卷中作文题的评分规则(含操作细则、表现样例)。

其实,这件事并不难做,近年来许多省份都组织了对参考试卷在抽样学校的试测,将试测检验后的评分规则、操作细则和表现样例公之于众,听取基层意见,完善评分规则,另一方面作为很好的教学材料。

不要担心这会引导师生考什么教什么学什么,威金斯指出,如果这个考试是有价值的、值得学生去花时间的,这不成问题,关键是你考些什么,是否能达成标准。

[3]实践中,我们将月考和县、市模拟考阅卷后的评分规则、操作细则和表现样例提供给学生,已经证明这种担心是多余的,反有助于学生更好地诊断自己的作文问题,写出更满意的作文。

参考文献:

[1]章熊.中国当代写作与阅读测试[m].成都:

四川教育出版社,2000.[2]肖舒楠.专家称社会对高考作文是一种畸形重视——访北京大学中文系副主任、北京市高考语文阅卷组负责人漆永祥[eb/ol].崔允漷等.基于标准的学生学业成就评价[m].上海:

华东师范大学出版社,2008.[4]朱迪思·阿特,杰伊·麦克塔尔.课堂教学评分规则——用表现性评价准则提高学生成绩[m].促进教师发展与学生成长的评价研究项目组译.北京:

中国轻工业出版社,2005.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 互联网

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1