增值性评价与学校效能Word文档下载推荐.docx-资源下载

增值性评价与学校效能Word文档下载推荐.docx

1、学校每次考试的平均数除以全区平均数，对学校前后两次的除数进行比较，判断学校是否取得了进步。有的地方将学校效能评价分成若干指标，分项打分，比较前后两次评价的分值之差来衡量各学校的进步幅度。这些方法显然比仅根据学生成绩或者升学率来考察学校效能进步了很多，含有增值思想的萌芽。但是上述方法存在众多的缺陷，仍旧不能从根本上解决学校效能评价中生源差异的问题，学校进步幅度，即增值的计算存在几个根本性问题：第一，没有基于学生个体的增值进行计算。学校增值的计算是将所有学生笼统地作为一个整体参与计算，而不是在学生个体增值的计算基础上进行的，也没有将起点不同的学生进行分类计算。因此，仍旧是高分学生对学校排名贡献大

2、，从而获得教师更多的关注。第二，没有学校间的比较。在学校增值计算的过程中只有学校自身的纵向比较，没有与其他学校的横向比较，更没有与其他学校类似起点的学生进行比较学校间的比较是在增值计算完成后进行的。第三，难于将所有学校放在一个标准上进行评价。以发展性评价为例，增值是在分项打分的基础上计算的，评价指标体系的设立必须考虑占大多数的普通学校和薄弱学校。评价标准对于优质资源学校常常比较低，因此评价指标需要不断更新以满足优质资源学校发展的需求。但是评价指标的变化又破坏了连续的年度纵向比较的基础，有的地区将优质资源学校的评价体系与其他学校分开，但是不同的评价标淮造成了学校间进步幅度无法进行横向比较。在

3、教育评价领域中，增值性评价是指通过追踪研究设计，收集学生在一段时间内不同时间点上的标准化测验成绩；基于学生自身测验成绩的纵向比较，并考虑其他不受学校或教师控制的因素对学生成绩的影响（如学生的原有成绩水平、人口学因素、家庭背景信息以及学校周围地区的经济发展水平等）；使用多水平模型对数据进行统计分析，可以将上述因素对学生成绩的影响与学校或教师对学生成绩的效应分离开来，追踪学生在一段时间内学业上的变化，考察学校或教师对学生学业成绩影响的净效应，进而实现对学校或教师效能较为科学、客观的评价。进行增值评价的优点是显而易见的。它以每个学生的原始成绩作为基准，测量学生在学校里的进步幅度来计算学校的增值。这样

4、一来，既可以屏蔽掉生源质量的差异，从而公正、客观地反映学校效能，又可以使得不同起点的学校在同一标准下比较，找出那些最有效能的学校。因此，学业发展水平测量与增值评价的方法对于创新学校评价体系具有重要的参考价值。与以往基于平均测验分数的横断性评价相比，增值性评价具有如下显著特点：第一，增值性评价实现了关注点的变化。教育评价中，最常用的评价方式是使用学生成绩原始分数的平均分或升学率作为评价指标，确定学校或教师的工作是否有效。有研究发现，使用原始分数作为学校或教师效能的指标是不准确的，甚至会有误导作用。此外，这种评价方式导致人们过于关注一次考试的结果，过分关注少数尖子生的培养，忽视了大多数学生的发展，

5、损害了教育过程中的公平性。而增值性评价则是基于每个学生的进步来计算学校或教师对学生学业增长的影响，这样就使学校和教师的关注点从个别学生身上转移到更加实质性的问题每个学生的进步状况如何。第二，增值性评价保证了更加公平的比较。增值性评价将每个学生的当前成绩与过去成绩进行比较，关注学生的进步和成长，而不是学生成绩的绝对水平，从而改变了以往将学生的学业成绩与平均值或任意制定的标准进行比较的做法。由此对学校或教师效能的评价都是基于学生的进步或增值，这一评价标准的确立，实现了教育评价过程中比较的公平性，有利于激发生源质量差的学校促进学生进步的动力。第三，增值性评价与绩效责任紧密相连。问责制目前已成为各个国

6、家进行学校效能研究的主要方面，它要求使用学生标准化测验的成绩作为评价对象，以使教育对学生的学习成果负责。评价是问责制的重要组成部分，评价的科学性直接关系到问责制实施的效果。增值性评价本身的特点，为问责制提供了一个良好的评价框架，能够提供对学校和教师更为公平的考察。第四，增值性评价具有潜在的诊断性功能。单纯的增值性评价不能识别学生成绩差的原因，但是增值性评价是基于追踪设计的研究，因此它能够根据详尽的数据描述识别出学生的成功与失败之处，这将成为学校和教师发现问题作出决策的起点。此外，利用增值性评价的信息，可同时为教师提供形成性评价和终结性评价的信息，从而为教师的自我提升提供依据。第五，增值性评价

7、能够满足所有学生的需要。增值性评价的基本理念是学校和教师应该保证所有水平的学生都以相同的速率取得学习上的进步，即每个学生在一年内的学业增值幅度应当相同。这就要求学校和教师不能只关注成绩好的学生，而要兼顾所有学生的发展和进步。根据每个学生的需要，采取相应的教学措施，从而促进每个学生的进步，满足所有学生的需要。增值性评价方法主要有描述性统计分析多元回归分析多水平回归分析模型。“增值评价在计量方法上是通过建立投入与产出变量间的回归方程, 量化研究影响学生学习成就的各项因素, 增值即为回归方程的残差值。在统计方法上起初是采用描述性的统计分析以及常用的多元回归分析, 随着对教育活动的多层次嵌套结构

8、的深入认识, 即教育问题中存在着学生属于班级, 班级嵌套于年级, 年级嵌套于学校等现实结构, 而普通的多元回归分析只能对单一层次进行分析的局限, 例如只能在学生层次和学校层次中选择一个层次进行回归分析, 从而丢掉另一层次的详细信息。多水平回归分析模型在近20年中逐步发展成熟起来, 并已应用于增值评价分析,极大地推动了学校效能研究的发展。”增值评价在学校内的应用以及在教学过程中潜在的诊断功能线性标准分数 Z 是将原始分数与其平均数之差除以标准差所得的商数。它是“以标准差为单位度量原始分数离开平均数的量数，它可以表示一个原始分数在团体中所处的位置。即告诉我们它在平均数上多少个标准差，或是在平均数

9、之下多少个标准差”。标准分数T计算公式：T = 50 + 10 * Z 。利用 “正态分布常模” 实现个体内差异评价方法之一对“个体诸侧面的比较”（不同科目之间）而做出的评价。图中的“0”平面为全市平均水平。在下述的 “团体个体内差异评价图” 中，可以分析出长春东师附属实验学校在高三理科三模考试中的优势学科（生物、语文），薄弱环节（化学、英语）。在下述的 “学生个体内差异评价图” 中，可以分析出长春第九中张也同学在高三文科三模考试中的优势学科（政治、语文），薄弱环节（地理、英语）。班级标准分变化趋势的描述（北京四中09班多个学科10次考试举例）详细记录和描述了该学校09班级入学以来10次

10、考试正态化标准分Z的变化趋势。对高二年级各班级8次考试化学成绩的变化趋势进行分析，形成每个团体学业发展进程的“一个连续的影像”。高二10班呈上升趋势高二09班呈下降趋势百分等级分数百分等级分数是一种相对地位量数，它把参加测验的全体人数作为一百分来计算，从而以某一原始分数换算出其在全体中所占的位置，说明分数比他少的人占人数的百分之几。如一学生的测验成绩为80分，经换算某百分等级分数是73分，即表示参加测验的73%的人低于他。百分等级分数不仅可以表示一个分数在团体中的地位，还可比较某学生多个学科测验或多次不同测验的成绩。常模10条百分等级线变化趋势的描述（长春德惠实验学校举例）长春二模、三模

11、考试语文学科，校内常模的10条百分等级线上，（上图）描述了德惠实验学校全校学生变化趋势，（下图）描述了该校46班学生变化趋势。长春二模和三模两次考试，在常模表中的10条百分等级线附近，描述出每个学校总分的变化趋势：A学校（上图）明显优于B学校（下图）。长春xx学校二模、三模英语成绩均为全市第二名，看似持平？实际在多条百分等级线上呈退步趋势，净增值Z排名为44名，诊断出该校英语学科教学存在问题？长春某学校二模、三模考试学科诊断：“常模等值”法分析多层次学生发展变化。语文：多条百分等级线上呈退步趋势数学：低等级退步人数增加，高等级进步人数增加英语学科：多条百分等级线上呈退步趋势政治：多条百

12、分等级线上呈进步趋势历史：地理：各条百分等级上略有小幅度进步二模、三模备考阶段数据分析数学试卷难度增加（平均分60.7347.70），从增值评价的角度，分析原排名前列几个学校的不同反应。实验中学、十一高中：高水平学生适应难题的能力很强，高水平学校仍然可以有“高增值”。A学校、B学校：多条百分等级线上呈大幅度退步趋势，各层次的学生适应难题的能力都很差。我国教育评价领域中，对学校和教师的评价多是一种终结性评价，即以学生测验成绩的均值为标准进行评价。这种单一的评价方法反映的信息并不准确，已受到各方面的批评。为更加科学和准确地评价学校和教师的效能，教育评价领域迫切需要一种新的评价方法。近三十多年

13、来，教育评价领域逐渐兴起一种新的评价方式增值性评价（valueadded Assessment）。一、增值性评价的起源和发展针对学校效能的增值性评价起源于詹姆斯科尔曼1966年向美国国会提交的关于教育机会平等性的报告，简称“科尔曼报告”（Coleman Report），该报告虽然没有直接提出学校效能的增值性评价问题，但其研究结论却引发了世界范围内对学校效能的争论，催生了学校效能增值性评价的出现。自20世纪70年代以来，以“科尔曼报告”为起点，学校效能的增值评价研究在世界范围内逐渐发展起来。20世纪80年代中期以前，增值性评价的应用一直受到统计技术发展水平的限制。80年代末，多水平模型技术的发

14、展与完善，为增值性评价提供了精确可信的分析方法。由于英美两国统计技术的发展以及现实的强大需要，多水平模型和增值性评价方法率先在这两个国家得到了充分的应用。1983年，国家处于危机之中：教育改革势在必行（A Nation at Risk：The importance fnr edueaional reform）报告的出台，美国全国上下对教育状况的关注水平空前提高。1989年，美国总统召开五十州州长教育峰会，思考教育问题，制定行动方案，并最终形成了六项国家教育目标。随后，为响应新的教育目标，美国各州掀起教育改革的热潮，并提出了学校问责制的概念。1992年，应此热潮，田纳西州政府率先采用增值评价系统

15、作为州教育促进法案的一部分。达拉斯州也从增值的角度探讨了判断高效能学校的量化程序，并发展了适用于该州的增值性评价系统；此外，北卡罗莱那州、德克萨斯州等也将增值性评价应用于其教育问责制主体框架之中。随着联邦教育法不让一个孩子掉队（No Child Left Behind）的出台，增值评价受到越来越多教育工作者的认可和政策制定者的青睐，正逐渐成为美国教育评价的主流方式。在英国，20世纪80年代末以来，政府每年都公布所有学校以原始分数表示的学生成绩排名表。由于原始分数没有考虑影响学生成绩而学校自身又难以控制的因素，如生源质量等，因而不能公正、客观地反映学校效能。为解决评价上的问题，研究者提出了“增值

16、”概念。英国的增值性评价同美国类似，也是首先从地区水平上发展起来的。国家统一课程的建立及链接国家数据的新资源的出现，为增值性评价在整个国家内推行提供了可能。英国政府于20世纪90年代接受了增值评价法，2002年在全英格兰和威尔士推行学校效能的增值评价模式，2004年和2005年试点，2006年全面开展学校效能的“多元”增值评价，并将增值评价指标作为一项重要的创新性指标加入到现有的评价指标体系中。此外，随着增值性评价理论的完善，统计技术和相应软件的发展，这一评价方法也逐步在其他国家和地区推广和实施。三、增值性评价的模型增值性评价方法发展初期受到统计方法发展水平的限制，但随着相关统计方法的发展

17、，增值性评价方法的统计技术也随之得以完善。目前应用于增值性评价的主要统计模型如下：（一）概要统计分析概要统计分析是描述统计分析的一种，它使用一系列描述性统计量对数据的概貌进行描述，如最大值、最小值、平均值、中数、众数、方差、标准差、偏度和峰度等。增值性评价的分析使用学生原始成绩的平均数作为增值性指标，如美国北卡罗来纳州将某学校学生群体连续两年测验成绩的平均增长与本州学生测验成绩平均增长的差值，作为该校的增值指标。这种增值性分析方法使用学生两年内的平均成绩增长作为指标，较传统的依赖于一次测验成绩所进行的评价更加科学、全面，但是其中学校是统计分析的最小单位，因此学生层面和学校层面的其他影响因素没

18、有得到应有的关注，仍是对数据的简单利用。（二）多元线性回归分析多元线性回归分析是分析一个因变量与多个自变量之间线性关系最常用的统计方法，这一方法是估计观测值与期望值之间残差值的标准统计技术。以学生水平的数据分析为例，残差值可以解释为某位学生的成绩是高于期望值还是低于期望值，这里期望值是基于样本中所有学生的基线成绩与其学习成绩间的统计关系基础上的。通过多元回归分析得到的残差值，即学生在一段时间内学习进步的“增值”。与概要统计分析相比，这一方法的优点是可以将学生或学校层面的各种影响因素纳入到统计模型中加以分析，如学生的基线成绩、学生的家庭背景信息或学校层面的变量等，从而提供一个更为灵敏的增值指标

19、。但是这一方法的缺点是，统计分析只能从学生层面（估计学生层面的残差）或学校层面（估计学校层面的残差）中两者择其一。因此，如果选择前者为分析单位，那么就无法利用学校群体特性的信息；而如果选择后者为分析单位，则会丧失学生层面的详细信息。（三）多水平分析模型多水平模型是针对传统的多元回归分析的不足发展起来的。教育和组织管理等领域的研究中，存在着大量的分层数据结构，如学生嵌套于班级，班级又嵌套于学校等；为了充分利用各个层面的数据信息，迫切需要一种新的统计方法，多水平模型就这样应运而生了。以教育评价领域的研究为例，多水平模型通常将学生水平的数据作为第一层，将学校水平的数据作为第二层加以分析。McCaf

20、frey等人总结了三类用于增值性评价的多水平模型，包括协变量校正模型、增长的重复横断模型、交叉分类模型。在上述模型的基础上，McCaffrey等人提出了一个学生纵向成绩的广义模型，上述模型均可作为该广义模型的特例。其中，前两个模型可以使用标准的多水平模型软件进行分析（如HLM），并且得到了广泛的应用；而其他的模型则需要专门的软件，由于其计算的复杂性，还没有得到广泛的应用。多水平模型的学校或教师的增值指标是模型中的学校或教师水平对应的残差值，使用的估计方法是限制极大似然估计法，这一方法是基于广义最小二乘法和最佳线性无偏预测实现的。用于分析多水平模型的增值指标的统计软件主要有HLM、MLwin、L

21、isrel、Mplus、R统计软件以及SAS等。增值性评价的多水平分析模型充分利用了学生层面和学校或教师层面的数据信息，能将影响学生成绩的外部因素（如学生的前测成绩、家庭背景、学校或教师层面的外部信息等）与学校或教师的效应分离开来，得到学校或教师的“净效应”，实现对学校或教师效能的科学评价。但是，这一方法的估计程序较为复杂，对于那些没有专业背景的家长、教师和学生来说不易理解；此外，估计的过程中可能存在不收敛的情况，这样估计就无法进行，也无法实现对学校或教师效能的评价。四、增值性评价目前仍需解决的问题及发展趋势增值性评价作为一种新的教育评价思路，近年来得到越来越广泛的关注，并引发了大量的相关研

22、究。它为传统的教育测验分数的分析提供了新的视角，能够实现对学校和教师效能的客观评价。但是作为一种新的正在发展中的方法，它自身仍然存在一些问题。第一，目前增值性评价存在几类多水平统计分析模型，这些统计模型对学生数据的处理方式不尽相同，那么到底哪种模型是最佳模型，能够实现对学生成绩的科学分析与分解，需要进一步的研究。此外，虽然复杂的统计方法能够实现良好的统计控制，但是不容忽视的是，统计方法自身存在对现实世界的解释力问题，这在一定程度上削弱了这种新的评价方法的应用与推广。因此，如何借助教育统计的相关研究，既能够深入理解教育问题，又能够产生对现实问题的合理解释，成为增值性评价研究的一个核心问题。第二，

23、增值性评价采用追踪测验的研究范式，必然产生庞大的数据库系统，因此数据处理的技术支持以及各个数据库之间的有效链接和整合也成为应用者必须要思考的问题。此外，在追踪数据的分析中，不同年份测验的等值是增值性评价的基础。在前述的几种增值性评价模式中，有的采用简单常模参照式处理方式，即将多年的测验分数都转换到同一常模量尺上，有的则忽视了这一问题。这两种处理方式显然都存在严重的问题。这一问题的最终解决也同样需要借助教育与心理测量研究的发展。近年来引起广泛关注的垂直等值，即多年追踪数据的等值方法，有望成为该问题解决的突破口。第三，增值性评价解决不了所有考试领域都面临的一个难题：很难区分学生真正的学习和为了考试

24、而学习的问题。为了提高测验的成绩，学校和教师会将精力集中在如何应付考试的答案，而不是教授学生知识和技能，这样学生只是在简单的记忆答案，而没有真正的学习。因此，在标准化测验中，保持对考试试题的更新非常重要。第四，增值性评价的分析过程是一种统计分析，在一定程度上有不准确之处，尤其在平均数周围的数据分析不准确，但在两个极端部分却较为准确。这一点在评价教师时要尤为注意，不能将增值性分析的结果作为人员任命的唯一标准，还要考虑其他的方面，尤其是那些在平均数附近的教师。因此，在应用增值性评价进行教育评估时，需要谨慎解释和使用相应的结果。第五，目前，增值性评价主要以标准化测验的成绩为基础，而学校为学生提供的是

25、一系列的教育服务，这使得包括增值性评价在内的大部分教育评价仅局限于一小部分的信息，忽视了对诸如音乐、艺术、社会研究和体育教育等不参与测试的科目的教育，这不利于学生的全面发展。尽管存在上述仍需解决的一些问题，增值性评价作为一种新的教育评价方法，其自身有很多不可替代的优越之处，是这一方法得以广泛应用的有力保证。这一评价方法与仅以一次测验成绩的结果为标准的评估相比，在评价的科学性和客观性上已达到了较高的水平。随着统计技术和方法的不断完善以及教育和心理测量领域相关理论和实践应用的发展，增值性评价面临的一些问题都会迎刃而解。这一方法也必将以其独特的优势在教育评价领域发挥越来越重要的作用，也为教育评价领域

26、方法的创新带来了新的希望。当前，我国正处于教育改革不断深化的关键阶段，如何评价当前的教育质量，如何借助教育评价促使教育质量进一步提高，增值性评价为我们提供了新的思路。增值性评价的目的在于有效地引导学校从重投入到重过程、从重生源到重培养、从单纯注重结果到关注教育全过程，也正是这些优势推动了这一方法在实践中的应用。我国的教育评价研究文献中最早介绍“增值”概念是在20世纪90年代中后期，但当时并未引起研究者的重视。随着国外绩效责任制的实施和增值性方法广泛应用，对这一方法的介绍和说明也逐渐增多，促进了该方法在我国的发展和应用。增值性评价每年对学生成绩的追踪思想，为我国教育评价提供了新的思路，借助这一理

27、念，可以建立一个长期追踪学生成绩的系统，同时也包括学生在音乐、美术和体育等方面的发展情况，形成全新的评价理念和方式，从而实现对学校或教师效能的科学评价。增值性评价结果的应用多元模型是基于统计学中的回归方法及在回归方法基础上的多水平分层技术建构的。多元模型通过估计观察值与期望值之间的残差值来表示学校自身对学生进步的影响。观察值指的是学生的实际成绩水平，期望值指的是以该学生先前成绩为分析的基线所预测出的学生成绩水平。残差值可以解释为，某位学生在一段时间内学习进步的“增值”。经由多元模型而获得的残差值，为我们提供了一种有关学生所取得的相对进步情况的统计测量方法。这种方法的一个优点是可以将多种影响因

28、素纳入到统计模型中加以分析，如学生学习成绩的基线、学生的家庭背景信息等，从而提供了一个比单一考试成绩更为有效的评价指标体系。此外，多元模型能够准确地分析连续几年的时间序列数据，并预测学校增值分数的变化趋势。最后，多元模型不但可以将学生嵌套于学校的特性纳入数据分析中，还可以同时考虑学生和学校两个层次内部的变量之间的关系以及跨层变量间的关系，分析影响教育结果的不同因素的重要程度及其交互作用。其缺点是对统计学知识要求较高，且计算复杂，对教师和家长来说，理解起来有一定难度。增值性评价中变量的选择要评估学生在一段时间之内的学业进步情况，不仅需要有学生在该段时间起点的学习成绩，也就是学生的前测成绩，还需要有学生在该段时间结束点的学习成绩，即后测成绩。另外，还要收集学生个体变量和家庭背景变量，这些变量虽然不能被学校所控制，但是却会对学生的学习成绩、学生学习的相对进步有影响，会导致对学校教育质量的评估结果产生偏差。因此，需要将其作为统计分析中的控制变量。在运用多元模型对学校教育的结果进行增值性评价时，英国学者通常考虑的变量包括学生的前测成绩、后测成绩、学生的背景变量、学校的背景变量等。

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？