信息技术教学中表现性评价的应用.docx

资源描述

信息技术教学中表现性评价的应用.docx

《信息技术教学中表现性评价的应用.docx》由会员分享，可在线阅读，更多相关《信息技术教学中表现性评价的应用.docx（39页珍藏版）》请在冰豆网上搜索。

信息技术教学中表现性评价的应用.docx

信息技术教学中表现性评价的应用

第五章信息技术教学中表现性评价的应用

第一节针对传统技能和作品的表现性评价

通过本节的学习你将能：

1.描述表现性评价和传统的纸笔测验的不同之处。

2.识别表现性评价的长处和局限。

3.为表现性评价写出预期的表现性结果。

4.区别限定性表现性评价和拓展性表现性评价。

5.描述制作表现性评价的一般过程。

6.制定一个包括表现性评价任务安排、观察、记录和评定的计划。

7.编制一个描述清楚、有针对性、易于使用的行为检核表。

8.制定一个描述清楚、有针对性、易于使用的等级评定量表。

9.制定为表现性评价结果制订一个总体计分量规

问题：

你在设计

一、针对技能和作品的表现性评价的特点

纸笔测验可以对从简单到复杂的多种学习任务进行测量，但对信息技术课非常重要的操作技能及与其他更高层次的信息素养有关相关学习结果的评价，纸笔测验难以胜任，而必须借助表现性评价。

（一）针对技能和作品的表现性评价的优点

1．能评估传统纸笔测验无法评价的复杂学习结果和技能性学习目标。

2．能对推理能力、口头表达能力和动作技能提供更自然、更直接和更完整的评价一些。

3．能通过明确学习和使学习更具意义性来增强学生学习动机。

4．鼓励学生将学习运用到现实生活情境中。

（二）针对技能和作品的表现性评价的局限：

1．使用起来耗时、耗力。

2．对学生表现的判断和评分具有很强的主观性，比较繁琐，而通常信度较低。

3．表现性评价通常只能个别施测，而不是集体施测。

二、表现性评价的评价对象分析

（一）表现性技能

学生在一个真实性的学习任务中的成功表现都是以有关的知识为基础，以临场的各种操作技能为外部表现，并体现了有关情感、态度和价值观（如图5－1所示）。

所以，如果把表现性评价的评价内容归结为表现性技能的话，那么表现性技能是由知识要素、技能要素和情感要素等各层次的要素构成的。

例如，考察学生数据库规划、设计、建立、使用与维护的实际能力，要同时关注学生对有关数据管理思想方法、对数据管理技术的基本概念的掌握，考察学生熟练使用某种数据库软件的技能水平，并要考虑学生在整个操作中是否能自觉遵守有关的法律、法规和道德规范。

在表现性评价中的主要评价内容是技能要素，知识性要素可以在对技能进行评定前用如前所述的测验方法加以测量或进行部分的评定，而在表现性评价也不能忽视对情感性要素的评价。

所以，制定表现性评价计划时，要全面考虑一个成功表现的所有构成要素，不能有所偏废。

图5－1表现性技能的构成要素

（二）限定性和拓展的表现性评价任务

表现性评价的表现性任务可以限定在一个非常具体、有限的技能上，例如，用键盘尽量快速、准确地输入一段规定的文字，根据教师提供的素材和明确的要求用作图软件绘制一幅图片或制作一个简单的多媒体作品等。

也可以拓展到一个包含大量具体技能的综合性操作任务上，如搜集某个主题的资料并利用搜集到的资料制作网站；就某一主题利用数据库检索资料，根据查询到的资料之间的关系得出结论并采用合适的方式呈现结论等。

拓展的表现性评价给学生提供了更大的自由去选择或执行任务，给学生更多的机会去自我评估和自我提高，对学生的活动过程和活动结果的讨论既要重视其活动过程的质量，也要注重学生独立学习能力的发展。

尽管信息技术课主要关注学生的综合信息素养和信息技术的综合应用能力，但对某些信息技术技能的限定性评价可以帮助教师了解学生在某些方面的具体操作水平并有针对性地提高学生地操作。

所以，在将具体的技能放在复杂的综合性任务中进行评价之前，可以使用限定性评价对它们进行单独评价；或者在利用复杂的任务对学生进行表现性评价时，运用限定性任务来诊断学生存在的问题。

三、准备表现性评价的步骤

有效的表现性评价需要采用系统的方式来准备和实施，以下是准备表现性评价的主要步骤：

1．对操作性任务的学习结果作详细的界定

如果在教学设计中已经对预期学习结果进行了详细的界定，那么可以直接从中挑选需要使用表现性评价的学习结果。

如果教学设计中没有提供表现性的学习结果，就需要重新考虑是否需要测量有关的学习结果并对必要的表现性学习角个进行界定。

可用于描述限定性表现性学习结果的典型行为动词及其对应的教学目标见下表。

表5－1可描述限定性表现性学习结果的典型行为动词及其对应的教学目标

行为动词

对应的教学目标

⏹识别：

选择正确的物体、物体的组成部分；选择正确的方法、过程；选择正确的特性。

⏹典型的行为动词有：

识别、查找、选择、接触、获取、标记、描述

⏹根据任务需要选择合适的工具、软件；

⏹选择正确的问题解决方案

⏹识别一个软件、系统、平台或作品的组成部分、所用数据结构、算法等。

⏹发现程序、系统、软件等的缺陷或问题

⏹确定一个宏观概念或较大系统的组成部分

⏹制作：

制造一个符合规定要求或规格的作品。

⏹典型的行为动词有：

制作、组合/组装/装配/搭建、建造、设计、绘制、制造、准备

⏹利用计算机软件按要求描画一幅图形、图画

⏹设计一个程序/作品，如数据库、一段程序、一个简易专家系统等

⏹将素材组合成一幅作品

⏹准备合适的计算机硬件环境、软件环境、网络环境等

展示：

表现出一系列的操作或者

过程

典型的行为动词有：

展示、使用、运行、测试、操作、演示、组装

⏹熟练使用某个软件、系统

⏹运行某个系统或程序

因为关注一个表现性任务中所有的具体过程或细节往往会使评价目标过多和过于繁琐，所以通常只关注其中最关键的、代表性的行为样本，使其长度控制在合适的范围内，以便能对操作进行更加精确的观察和判断。

所以，对表现性评价结果进行详细说明的细目表应包含对完成某项工作或任务最关键要素的分析。

有些表现性评价中操作任务的顺序并不重要，而另外一些表现性评价则需要严格遵循系统的操作步骤，例如，网站和多媒体作品的制作任务中，就应遵循相对固定的顺序：

先进行设计规划，然后选定工具软件，然后搜集、加工素材，最后集成或制作作品。

拓展性的表现性评价包括多元的教育目标，所以在设计有关的学习时应该全面考虑这些教育目标。

例如，如果要求学生经过文献查阅，选定某一名人或英雄人物进行研究，根据搜集到的资料和研究结果，制作一份关于该名人或英雄人物的多媒体演示文稿。

则确定评价目标时，不仅应对学生的信息技术应用水平进行评价，还应对作品中体现出的学生对内容的理解、小组合作情况甚至口头报告情况等方面进行评价。

在确定了需要评价的表现性学习结果后，再对这些结果用操作性的术语进行更具体的界定，如下表所示：

表5－2在研究基础上制作多媒体的表现性目标细目表（示例）

一般性

目标

具体的表现性目标描述

多媒体作品的内容

内容全面，包括任务要求的所有基本主题，能论及有关的其他主题

观点准确，论证清楚、有力

主题内容逻辑顺序准确、清楚，重点突出，易于理解

包含细节、提问，能引发读者思考、好奇和探询更多信息的动机

技术

布局

区域划分清晰，版式美观，易于理解

内容表现形式多样、合理

布局平衡合理，易于观看和检索

界面

页面风格与主题相符，形式新颖

背景能很好地衬托出主题

图片、图片使用合理，能提高访问者兴趣并有助于理解相关文本

多媒体素材应用

声音使用合理，能创造与主题相符的氛围

能根据演示的需要合理设置有关对象的动画效果，动画播放顺序准确、自然

能准确、合理地使用外部的多媒体素材，如声音、动画、视频素材等

导航

有用于导航帮助的目录页，各幻灯片标题清晰易懂，利于理解和检索

能利用母版设置各页之间的链接，相关页面之间的链接准确、合理

页面切换自然、准确

口头报告

能使用生动、准确的语言

报告组织严密，条理清晰，易于理解，能引发观众兴趣

能灵活地使用信息传递和交流技巧

小组成员轮流发言

做过较好的预演

制作的

分工合作

分工明确，能相互合作，取长补短

小组成员能完成分配给的任务

各小组成员主动帮助别人，共同完成项目

总分

2．选择评价的重点

如上所述，表现性评价的目标是多方面的，但由于每次教学及评价的具体目的不同，所以表现性评价的重点也会有所变化，有时会侧重过程，有时会侧重结果或作品，有时可能两者并重。

评价的重点应主要根据表现性任务的特点来确定，并根据具体的情况进行适当的调整。

（1）侧重过程的表现性评价

不会得出某种作品的表现性任务要求使用侧重过程的表现性评价。

在多数情况下，操作的过程和结果在教学和评价中都应得到重视。

例如，评价学生利用键盘打字时，开始时强调学生正确的指法、坐姿等，但后来则强调打字的准确性和速度。

一般来说，在下列情况中，会比较侧重对过程的评价：

没有作品，或者对作品的评价不可行，比如，难以评价作品或评价作品的成本和代价过高；操作的过程具有一定的顺序并可直接进行观察；正确的过程或操作步骤对后续学习或活动的成功至关重要；对过程的分析有助于提高作品质量。

（2）侧重作品的表现性评价

在某些学习领域或表现性任务中，作品则更值得关注，过程则显得比较次要。

一般来说，在下列情况中，比较侧重对结果的评价：

不同的过程都可以得到同样优秀的结果，例如，设置一段文本的格式时，字体、字号、行距的设置顺序；过程难以观察到，如学生在家里或课外开展的活动。

或者，一些在课堂中开展的活动，但主要过程是内部的思维过程，不具有观察性，尽管过程的某些成分可以通过学生的大声思维（“thinkaloud”）来得到，但评价重点仍是活动的结果；过程虽然重要，但学生已经掌握；结果可杯清楚的确定和判断。

3．选择任务的合适的真实程度

从真实性的角度看，表现性评价介于普通的纸笔测验和现实情境中的实际操作之间。

在评价中不可能完全复现学生离开学校后运用所学知识的现实情境，但在准备表现性评价时应可能使表现性评价的情景接近现实世界中的真实情境，而且越真是越好。

表现性评价情境的真实性达到何种程度最合适取决于诸多因素。

首先，要考虑教学目标的性质。

并非所有的教学都需要利用真实性的任务情景来评价学生，在某些教学中，例如，在每门课程的导入课中，运用纸笔测验或其他真实程度很低的方法来评价学生的技能即可满足教学需要。

第二，具体课程的教学序列也可能要求在测量学生实际动手操作之前先采用纸笔测验。

例如，先考察学生对信息技术基本概念、基础知识的掌握情况，然后再测量学生对不同操作软件的掌握水平。

第三，大量的实际条件的限制，如耗时、成本高、需要使用特殊器材/设备、施测和评分的难度，都会限制问题的现实程度。

第四，在测验情景中，任务本身的性质也会限制问题的现实程度。

例如，在分析违反与信息活动有关的法律、法规可能产生的后果时，只能采用已有的、他人的案例，不可能创设真实的情景。

所以，尽管在表现性评价中应追求最大限度的任务真实性，但在准备表现性评价通常是在理想的目标和现实的条件之间进行必要的折衷。

4．选择或设计表现性任务情境

表现性评价可根据评价情境或背景的不同而划分为不同的类型。

根据表现性评价所用情境的真实程度，可将表现性评价采用的情景分为：

（1）纸笔型表现性评价任务（Paper-and-pencilPerformance）

纸笔型表现性评价强调对学生在模拟情景中应用知识技能的评价，区别于传统的纸笔测验。

纸笔型表现性评价既可用于对某些阶段性学习结果的评价，也可以作为更真实表现性评价的中间步骤。

在很多情况下，纸笔型表现性评价可产生有重要教育价值的成果并能对这些成果进行评价，例如，在一个信息技术教学评价的课程中，可能会要求学员完成如下的任务：

”“为《信息技术基础》课的某个教学单元中编制一整套测验细目表”“根据某个测验细目表编制合适的测验项目”“编制检核表来评估一个成就测验的质量”。

在完成这些纸笔型表现性评价任务后，学员会形成一些对各自的教学有很高实用价值的书面作品。

而在另外一些情况下，纸笔型表现性评价仅仅为对动手操作的表现性评价提供基础。

例如，在学生使用某个数据库软件之前，可能就要求先理解数据库中的“库”“表”“字段”“记录”“关系”等基本概念及其含义，尽管虽然这种理解不是使用数据库的充分条件，但却往往是必要条件。

这时可以利用纸笔型表现性评价测量全班学生对基本概念的掌握情况并作为进一步的实际使用数据库软件的先导。

此外，还有一些的客观条件的限导致不得不采用纸笔型表现性评价，例如，在计算机数量有限，不可能在每个具体的教学环节都安排上机操作时；或某种设备很昂贵、不可能每个学校都配备时，要求学生采用纸笔型表现性评价形式展示一下自己的能力可避免将来在真实情景中操作失误的可能性。

（2）识别型测验（IdentificationTest）

鉴别型测验包含真实程度不同的各类情境：

最简单的可能仅仅要求学生识别某种工具、设备、软件并说明其功能；稍微复杂一点的可能是呈现给学生某个具体的操作任务，让学生选择合适的工具、软件以及完成这个任务所需要的步骤；更复杂一点的可能是让学生识别或测试一个有问题的程序、软件，分析出问题及造成问题的原因。

识别型测验更多的是作为学生进行真实操作或模拟操作的准备程序，但有时候也用来对操作技能进行间接的测量，例如，识别一段程序语言中存在的问题等。

（3）结构化的表现性评价（StructuredPerformance）

结构化的表现性评价是在标准的、有控制的条件下，要求所有的学生都对同一系列的任务进行操作，并对学生的表现进行评价。

结构化的表现性评价多用于职业教育中对受训者某种操作的熟练程度进行评价，在中小学信息技术课中只有少数对操作的熟练性、精确性有一定要求的教学内容适合采用这种评价方式。

例：

文字处理上机操作题：

1．设置页眉，页眉为“冯·诺依曼简介”。

2．将标题设为四号黑体、居中、段前断后各空一行

3．将正文设为小四号宋体，行间距设置为1.5倍行距。

3.将文“图灵”的字体设置为红色、加粗、加下划线。

冯·诺依曼

冯·诺依曼1903年12月28日生于匈牙利，1957年2月8日死于美国。

我想知道计算机的人一定对他不会陌生，它可以称为计算机之父了，现在我们面前计算机内采用的体系结构就是以他的命名的冯·诺依曼结构。

冯·诺依曼小时就十分聪明，6岁时就能够心算8位数字的除法，它在匈牙利接受了他的初等教育，并于18岁发表了第一篇论文！

在1925年取得化学文凭后，他把兴趣转向了喜爱已久的数学，并于1928年取得博士学位，它在集合论等方面取得了引人注目的成就。

1930年他应邀访问普林斯顿大学，这所大学的高等研究所于1933年建立，他成为最早的6位数学教授之一，直到他去世，它一直是这个研究所的数学教授。

后来他为成为美国公民。

1936到1938图灵（另一位伟大的计算机科学家）是普林斯顿大学数学系的研究生，冯·诺依曼邀请图灵当他的助手，可是图灵钟情于剑桥而未能如冯·诺依曼所愿，一年后，二次世界大战使图灵卷入了战争，1934年图灵曾经发表的论文"OnComputableNumberswithanApplicationtotheEntscheidungs-problem"不可不提，在这篇论文中，图灵提出了通用机的概念，冯·诺依曼应该知道了这个思想，至少后来他是不是应用了这个思想却不得而知。

冯·诺依曼迅速发现了这种后来被称之为计算机的通用机器的用处在于解决一些实际问题，而不是一个摆设，因为战争的原因冯·诺依曼开始接触到许多数学的分支，使他开始萌生了使用一台机器进行计算的想法，虽然我们现在都知道第一台计算机ENIAC有他的努力，可是在此之前他碰到的第一台计算机器是HarvardMarkI（ASCC）计算器。

冯·诺依曼有一种非凡的沟通能力，能够在不同的科学家之间担任一个中介者的角色，虽然这些科学家并不想让别人知道自己的秘密。

冯·诺依曼建造的机器名为IAS机，一些由国家实验室建造的计算机不过是IAS机的复本而已。

结构化的表现性评价非常强调测验情境的高度控制和高度标准化，并要求学生按照相对规定的程序进行操作。

但中小学信息技术教育的目标更侧重学生在真实的情景中综合运用信息技术的能力，因此，在教学过程中，不宜过多在人为设置的高度结构化的任务情景中评价学生操作的精确程度，尤其要避免对学生信息技术操作过程中无意义的细微差别斤斤计较。

如果确需使用结构化的表现性评价，应制定表示最低操作水平的绩效标准，包括精确程度、合适的操作步骤、遵循有关的规则、操作速度等（如下表所示）。

在实际教学和中，通常需要将多项绩效标合并起来评价学生的表现。

例如，对打字的评价，既要求准确性又要求速度。

应综合考虑不同的教学阶段、操作的性质和具体的情景，选用合适的标准并确定各标准的权重。

表5－3结构化评价环境中判断操作的一些常用标准

类型举例

速度每分钟打40个字

错误率打字时每页纸的错误不超过两处

时间在规定的时间内拆装一台常用配置的台式机；

或在规定的时间内排查一台计算机的故障

数量在因特网中找到至少20条与某个主题相关的信息

质量（需要评定）制作一份整洁、规范的商业信函

步骤要求运用适当的步骤在因特网上检索下载和存储信息

安全不违反任何安全规则地使用电脑和网络

（4）模拟型表现性评价任务（SimulatedPerformance）

模拟型表现性评价力图使评价任务总体上或部分地与现实情境中的任务匹配。

例如，在不具备上网条件或上网会导致很多负面影响时，教师设置虚拟的网络环境并以此评价学生在互联网上进行各种操作或利用各种服务和功能的能力；在真实的设备非常昂贵或容易损伤时，要求学生在计算机模拟的各种虚拟现实环境中进行各种仿真性的操作等。

模拟型表现性评价既可直接用于评价有关的操作技能；但在大多数情况下，模拟情境中的技能只能表示学生实际操作的准备程度，而不能代表其真实的操作水平。

例如，飞行员在模拟飞行器中能熟练驾驶飞机仅代表其做好了真正驾驶飞机的准备，并不代表其真实的飞机驾驶水平。

（5）（真实）任务样本（WorkSample）

（真实）任务样本要求学生完成要测量的完整真实任务中的代表性任务样本。

真实任务样本包括完整的真实任务中最关键的部分，并要求在控制的条件下完成有关操作。

例如，考察学生“利用某个已有数据库辅助学习，开展专题研究”的能力时，就应要求学生经历其中一些有代表性的关键环节，包括就某个专题检索、甄别和筛选有价值的数据；对数据进行必要的排序和统计分析；根据数据之间的关系发现规律或得出有价值的结论；利用数据支持或驳斥某种观点等。

例：

利用文字处理软件制作一个班刊。

（共40分）

要求如下：

（1）至少有3个板块的内容，且各部分文字流畅；

（2）必须在16开、且上下左右边距分别为2厘米的纸张上完成排版；

（3）标题必须醒目；

（4）段落设置采用应有的技术；

（5）配有插图；

（6）颜色搭配、版面布局合理；

（7）在页脚以右对齐方式署名。

（6）拓展性研究性学习任务（ExtendedResearchProject）

拓展性研究性学习任务是表现性评价最复杂的类型之一，拓展性研究性学习任务需要学生解决非结构性的现实问题，或制作独特的作品，或两者兼有的任务，其中涉及学业能力、交流技能和思维能力的结合。

所以，拓展性研究性学习任务都包括多层面的学习结果和多维度的评价目标。

学生应参与评价指标的制定，选择需要研究或调查的问题，设计和开展研究，评价研究结果；撰写研究报告，进行口头报告并就研究结果进行答辩。

拓展性研究性学习任务从始至终都关注问题解决中的高水平学习结果（例如：

分析、综合、评价）、合作交流技能的有效使用、自我评价能力和独立学习能力等。

有关内容将在后面的相关部分详细论述。

5．选择观察、记录和评分的方法

表现性评价中，对过程、作品的观察、记录和评分常采用一下方法

（1）系统的观察和轶事记录，

（2）行为检核表（3）评定量表，和（4）作品集或曰档案袋（portfolio）。

其中档案袋既可作为表现性评价的观察、记录和评分手段，现在也越来越多地被用作相对独立的评价方式，所以，将在以后的章节中对档案袋评价进行详述。

（1）系统的观察和轶事记录（anecdotalrecords）

表现性评价可通过在自然情境下通过观察学生获取关于学生表现和结果的信息。

在日常教学中对学生的观察往往是不系统的，而且缺乏对观察结果的正规记录，难以为评价学生复杂的表现提供全面、客观、有意义的信息更有作用。

因此，通常需要将行为检核表或评定量表指导下的结构化的系统观察活动和日常教学中的非结构化观察结合使用，保证既收集到评价计划中与学习目标直接相关的信息，也能收集其他没有包括在评价计划中但对评价有价值的信息。

轶事记录是指在观察过程中以文字的形式对被评价者的行为做描述和诠释,主要包括观察到的行为、行为发生的情境以及对事件的独立说明。

虽然轶事记录可能比较浪费时间，但是这种方法可将记录限制在某类行为（如，学生在信息活动中与安全、健康、负责使用信息和信息技术有关的行为）和某最更需要帮助的个体上（如班级中信息技术零起点或水平很低的学生）上。

实施轶事记录时应尽量体现以下原则：

（1）集中记录有意义的事件；

（2）事件发生后及时记录；（3）记录包含足够的信息以便日后理解；（4）观察到的事件应与对事件的说明严格分开。

理想的轶事记录应是对一个有意义事件简洁、客观、信息充分的描述并对事件的意义做必要的说明。

当轶事记录集中于某一个体时，往往能获得该个体典型的行为模式。

（2）行为检核表（checklist）

行为检核表提供一个被评价者表现及作品中可测量的各维度的列表，供评价者对各维度进行简单的“是”或“否”的判断。

举例来说，如果利用行为检核表来评价学生“分析问题”“确定算法”“描述算法”“编程求解”这一系列过程时，就检核表中列出学生需要完成活动序列，然后观察被评价者的表现，检查某个行为学生做了还是没做。

而对作品进行评价的行为检核表一般包括合格作品涉及到的典型维度或典型特征，供评价者判断这些必要特征在作品中是否出现。

总之，行为检核表仅仅可用于标出观察时需要注意的有关方面或维度并提供简要的记录和判断，往往不会对各个维度进行较为细致和量化的分析。

构建一个表现性评价的行为检核表通常包括以下步骤：

A.列出需要评价的过程的步骤或作品的特征

B.如果需要诊断错误的操作，可列出错误的步骤或不良表现的特征。

C.采用符合逻辑的顺序（例如，按照操作的前后顺序）排列上述各项。

D.提供指导语并在检核表中留出供评价者对每一项进行检核的空白。

E.必要时，在整个检核表的最后留下空间供评价者填写建议。

（3）评定量表（ratingscale）

评定量表在判定过程和作品时所起的作用与行为检核表类似，两者的主要区别在于评定量表是对学生表现出的评价要素进行更为精细的程度判断，而不像行为检核表那样简单地使用“有或无”的判断。

量表的评定等级包括被评价者某种行为出现的频率，如“经常”、“有时”、“从来没有”；某个表现的总体水平，如“非常突出”、“高于平均水平”、“平均水平”、“低于平均”“非常差”等；或一系列用来描述对被评价者表现满意度的短语，如“迅速完成任务”、“较慢地完成任务”、“没有帮助不能完成任务”等。

含有3个评定等级的量表被称为“3点量表”，含有5个等级的被称为“5点量表”。

评定量表的格式也是标出观察时需要注意表现的各个方面并提供简便的记录判断的方法。

下面这个例子就是一个同时评价行为过

例：

学生制作多媒体作品任务的评定量表*

指导语：

请根据被评价者在下列各项中的实际表现，在各项前面最适合被评价者实际表现的数字上画圈。

各数字的含义分别为：

5＝表现非常突出；4＝表现高于平均水平；3＝平均水平；2＝低于平均水平；1＝非常差

对被评价者行为过程的评定量表

学生在下列各方面的具体表现如何？

54321（a）为作品制作准备了非常详细的计划

54321（b）确定了所需要的材料

54321（c）选择了合适的信息技术

展开阅读全文