第一章教育测评概述.docx
《第一章教育测评概述.docx》由会员分享,可在线阅读,更多相关《第一章教育测评概述.docx(24页珍藏版)》请在冰豆网上搜索。
第一章教育测评概述
第一章教育测评概述
第一节教育测量概述
第二节教育评价概述
第三节教育测评的发展阶段
一、什么是测量
(一)测量的定义
测量的定义有很多,但迄今多数人都能接受的是史蒂文斯(S.S.Stevens(1906-1973),美国心理物理学家,以研究声音强度的感觉性而闻名。
他提出了新的感觉等级评定方法,这种方法可以用来比较不同感官的感觉强度;还提出了心理物理的幂函数定律,弥补了传统心理物理学的不足。
1946年当选为国家科学院院士,1960年获美国心理学会颁发的杰出科学贡献奖。
)给测量下的定义:
“从广义而言,测量系根据法则给事物分派数字。
”从字面上看,此定义包含了三方面的特性:
法则、事物、数字。
1.法则
这是测量的标准,也就是测量的依据和准则,即我们根据什么来进行测量。
例如,用天平衡量物体的重量,依据的是杠杆原理;用温度计量体温,依据的是物体热胀冷缩的原理。
“法则”是一个测量所具备的最重要的特性,对于同一个测量对象按照不同的法则实施测量,其结果是不一样的。
比如,测量一个物体的
长度,用不同的尺子去量度,其结果肯定是不一样的。
法则也有好坏之分。
使用好的法则可以得到比较理想的测量结果,而较差的法则只能导致不准确的测量结果。
要寻找和建立较好的测量法则是一件极为困难的事情。
有些事物的属性相对简单一些:
建立法则可能容易一些;而有些事物的属性可能较为复杂和多变,这就给我们的测量带来了很大困难。
但不管是什么事
物的测量,其法则都有一个渐进的过程,即使是对物体长度的测量,也是一个逐步精确的过程。
可以这样说,人类的测量史是一个不断建立和完善测量法则的过程。
2.事物
这是测量的对象,也就是对什么进行测量,更明确地说,就是引起我们兴趣的事物的属性或特征。
不同的事物其属性也是不同的。
所测量的事物是否具有一致性,这是影响测量结果是否精确的一个重要原因。
3.数字
这是测量结果的表现形式。
测量的结果必须以数字的形式表现出来,这是区别测量与定性评价的一个标志。
数字大多数时候具有量的意义,这样它就是代表一定的数值。
这些数值具有自然数的特点,如区分性、序列性或等级性、等距性和可加性。
数的这些性质,是我们进行运算的基础。
必须指出,在测量中,我们是根据事物的属性和属性的大小来分派数字的,因此,必须考虑数字是否具有如上自然数系统的功能,还必须考虑到事物的性质和指派数字的原则。
(二)测量的三个要素
不管是物理属性的测量,还是精神属性的测量,都必须具备以下三个要素:
1.单位
单位是我们用于计算的标准,如测量物体的重量可用吨、千克、克等为单位,测量物体的长度可用千米、米、分米、厘米、毫米等为单位,测量学业成绩可用分数的“分”作单位。
单位是测量的基本要求,没有单位就无法测量。
理想的单位必须具备两个条件:
一是要有确定的意义,即对同一单位,所有人的理解意义要相同,不能出现不同的解释;二是要有相等的价值,即相邻两个单位点之间的差别总是相等的。
物理测量的单位是比较明确的。
但教育测量的单位一般来说是相对的:
首先,它的意义比较模糊。
例如,对原始分数而言,每一个“1分”,在人们心目中的含义是不同的;其次,相同单位不等值,如数学的“1分”不一定等于语文的“1分”(因为很难保证两科的难度完全相等),即使同一次考试的“1分”也不一定完全等值,如选择题的“1分”就不等于填空题的“1分”。
因此,一般而言,教育测量的单位是不能直接加减乘除的。
2.参照点
参照点是计算的起点,参照点不统一,量数所代表的意义就不同,测量的结果就无法进行比较。
参照点一般有两种:
绝对零点和相对零点。
绝对零点里面,“0”表示“没有”的意思,如“0米”,就表示没有长度;相对零点里面,“0”不一定表不没有,如温度的“0°C”就不是表示没有温度,而是表示零上与零
下的交界点。
教育测量的参照点一般也是相对的,“0分”并不表示你对这门学科“一无所知”(可能知道的没有考!
),而另一方面,得分即使不是“0分”,也可能表示就是真正意义上的“一无所知”(至少你可以猜测得分!
)。
3.量表
量表一般称为测量的工具,它是具有一定单位和参照点的连续体。
如尺子是度量长短的量表,天平是权衡重量的量表。
教育测量中所使用的量表多以文字试题的形式出现,也有以图形、符号、操作要求的形式出现的。
由于制订量表的单位和参照点不同,量表的种类也不同。
不同量表的精确度是不一样的。
将量表从低级到高级排列,则可分为四种量表水平,即类别量表水平、顺序量表水平、等距量表水平、比率量表水平。
类别量表是最低水平的一种测量量表,它只是用数字代表事物和事物的归类,没有任何数量的意义。
如对性别进行分类,可以用1表示男性,0表示女性。
类别量表不能作数量化分析,更不能进行加减乘除。
顺序量表比类别量表要精确,其中的数字不仅指明类别,同时指明不同类别的大小等级或具有某种属性的程度。
例如,品德评定的等级:
优、良、中、差;考试的排名次;甚至考试的原始分数等,都是顺序量表。
等距量表不仅有大小关系,而且有相等的单位和相对的零点。
例如,测量温度就是一个等距量表,60℃与50℃之间的差别等于40℃与30℃之间的差别;智力测验的分数、标准分数都是等距量表。
等距量表可以进行加减运算,但由于没有绝对零点,故不能进行乘除运算。
比率量表是最高级和体现最精确的测量水平的一种测量量表。
它既有等距的单位,又有绝对零点,因此可以加减乘除。
大多数物理测量量表是比率量表,而教育测量的量表却很难达到这一水平。
二、什么是教育测量
(一)教育测量的涵义
教育测量是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。
它主要包括对学生内在精神属性的测量,如测量学生的学习成绩、智力水平、品德状况、人格特征等方面。
因此,教育测量主要是一种间接的测量。
(二)教育测量的特点
由于教育测量主要是测量学生的内在心理特性,因此,它具有与物理测量不同的特点。
主要有以下四个方面:
1.测量结果的间接性
教育测量一般是间接测量。
因为我们无法直接测量学生的内在心理特性,而只能通过其外显的行为,来间接测量其心理活动的特点与水平。
也就是说,我们只能通过学生对测验题目的反应和一些行为表现,运用推理、判断的方法,来间接的测量出他们的知识水平、智力高低和品德好坏。
在教育测量中,除了对学生身体素质和发育的测量可以直接测量外,其余绝大多数是间接测量。
2.度量单位的相对性
教育测量的另一个特点是它的度量单位一般是相对的。
这在前面已有说明。
因此,必须对教育测量的数据进行转换,否则,不能进行代数运算。
这将在第六章详细说明。
3.测量对象的复杂性
教育测量的对象主要是学生的精神属性。
首先,它是内在的,不能直接测量。
其次是它的多变性。
因为,学生的智力、学业成绩、品德等各方面情况是在不断变化、发展的,随着年龄、年级的升高,这些特性将会发生变化。
另外,有些主、客观因素,也会影响测量的结果。
如对学生的品德进行测量,有些学生可能故意掩饰其本来的品德情况。
4.测量目的的针对性
任何一个测量都具有明确的目的,教育测量必须为实现教育目的服务,即教育测量是为了掌握学生在学业、智力和思想品德等方面的情况,了解教育和教学的效果,以便更合理地组织教育活动,安排教学内容,选择教学方法,贯彻因材施教,促进学生在德、智、体、美、劳等方面全面发展。
我们不能脱离教育目的和教材的要求,随意地制订量表,任意地进行测量。
三、教育测量的误差问题
无论是在天文领域中的测量,或是在物理、生理、心理、教育等领域中的测量,都存在一定的误差。
有三种情况,会导致测量的误差:
(1)测量的仪器和设备。
测量工具的精密程度会影响测量的精确程度,测量时使用的仪器和设备越好,误差就会越小。
(2)所测量的事物的一致性程度。
所测量的事物是否具有一致性,这是影响测量结果是否精确的一个重要原因。
(3)测量者的因素。
比如,由于测量者的技术不熟练,或观察能力不强,一时注意力不够集中等,都会导致测量的不精确。
由于教育测量的上述特点,导致教育测量的结果存在较大的误差。
教育测量中所使用的量表(工具)很难把学生的知识、才能、思想一点不漏地全部测量出来,这就给教育测量带来了很大的困难。
但是,这并不等于说教育测量是不可能的。
因为世界上的事物、现象都有程度上的不同,亦即数量上的差异,既然有数量上的差异,也就可以进行数量化的测定。
虽然教育测量不如物理特性的测量那样精确、易行,但绝非不可能。
而且,教育测量的长期实践,也证明了教育测量的可能性。
目前,我们对有些方面的测量已经达到了较为科学、客观的程度,如智力测验、学业成绩测验等。
四、教育测量学的作用
学习教育测量对于提高教育、教学质量,提高教育管理水平,进行教育研究等都具有十分重要的作用。
(一)有利于提高教育、教学的水平
教育和教学的最后一个环节就是对成果的检验,同时在教育和教学的过程中,也需要随时了解教育和教学的情况,诊断学生学习中存在的问题,实行因材施教,所有这些方面都需要用到教育测量的理论与方法。
例如,如何编制测验、组织考试、评分以及解释分数等,都属于教育测量的内容。
因此,正确地利用教育测量,有利于提高教育、教学的水平。
(二)有利于提高教育管理的水平
加强教育测量,能提高教育管理的科学性,能有效地改变长期以来形成的凭主观经验衡量教育效果的做法。
教育测量可以根据一定的教育目的,编制客观的标准化的量表,进行广泛的测量,做出科学的分析和评价,它对于合理地使用教育经费,科学地选拔人才,决定教育政策,进行教育规划等,都起着重要的作用,是教育管理不可缺少的手段。
(三)有利于发展教育研究的方法
对于教育测量的研究,本身就是教育研究的重要组成部分,教育测量的理论与方法的丰富和发展必然会充实和发展教育研究的方法。
很多教育问题的研究要直接运用教育测量的方法,如学校教育质量的评价问题、学生不同层次学习能力的培养与检查问题、改革考试制度问题等,既是教育研究的重要课题,也是教育测量的重要研究问题。
此外,教育测量的方法还是进行教育研究的不可缺少的重要手段。
第二节教育评价概述
一、什么是评价
“评价”一词早在900多年前我国的北宋时期就已出现。
《宋史·戚同文传》中就有“市物不评价,市人知而不欺”的记载。
这里的“评价”是讨价还价、评论货物的价格。
我国1979年出版的《辞海》,对“评价”一词的解释是:
“评价,评论货物的价格……今亦泛指衡量人物或事物的价值。
”。
评价就是根据某种价值观对事物及其属性进行判断、衡量,亦即对人或物做出好与坏、真与假、善与恶、美与丑、优与劣等等的判断。
评价意味着对某一事物的价值给予一般的衡量。
价值观在评价中起着十分重要的作用。
人们的价值观不同,对同一事物会有不同的评价。
价值是客观的,但评价带有主观性。
在哲学史上有几种不同的价值观:
一种是客观主义价值观,认为价值是客观对象固有的本性,是纯客观的东西;一种是主观主义的价值观,认为价值是用来表达个人对事物的好恶情感的,是纯主观的东西;另一种是辩证唯物主义的价值观,认为价值是一种表明客体对主体的特殊效用性,是主观性与客观性的统一。
客观事物的效用性与主观的需要和愿望相结合,就具有了一定的价值,符合的程度越大,价值就越大。
我们认为后一种观点是正确的。
二、什么是教育评价
怎样理解教育评价、解释教育评价,是现代教育评价基本理论的重要问题。
因为教育评价是一门新兴的学科,它的理论体系、指导思想、评价模式和方法技术等,都处于不断完善、不断发展的过程中,因此,虽然各国教育评价专家、学者对教育评价做了种种界说和解释,但迄今尚未形成统一的为大家所公认的科学定义。
为了进一步探讨教育评价的本质属性,确切认识教育评价在整个教育系统中的地位和作用,以便对教育评价做出正确的全面的表述,下面介绍几种具有代表性的界说:
(一)早期解释
泰勒在20世纪40年代初将教育评价解释为:
“确定教育目标在实际上被理解到何种程度的过程。
”
后来日本学者进一步把它界定为:
“教育评价就是系统地、有步骤地从数量上测量或从性质上描述儿童的学习过程和结果,据此判定是否达到了所期望的教育目标的一种手段。
”这种解释和学说,认为以教育目标为依据,衡量学习结果达到目标的程度,就是教育评价。
克龙巴赫对教育评价的阐释是基于突破行为目标模式的观点,提出:
“评价是为决策提供信息的过程。
”后来有人对这一界说做了具体的描述:
“教育评价是一种有系统地去寻找并搜集信息资料,以便协助决策者在诸种可行的途径(方案)中择一而行的历程。
”
这种观点强调了评价的信息作用,扩大和拓宽了评价的功能、范围,从广义上、宏观上对评价进行了创造性的解释。
(二)较深层的定义
斯克里文和豪斯的定义:
“评价是一种对优缺点和价值的评估,是一种既有描述又有判断的活动。
”
日本心理学家大桥正夫认为:
“教育评价就是对照教育目标,对教育行为产生的变化进行价值上的判断。
”
这种评价观点认为教育评价的着眼点在于教育现象的价值,也就是评价应当着重判断教育的效果,看其是否具有价值。
这里的关键主要是价值判断。
尽管各国评价学者对教育评价有不同的界说,但在这一点上已相当一致。
.
(三)对教育评价的初步界定和理解
20世纪80年代以来,我国教育界也对教育评价理论进行了初步探讨,对教育评价的概念也进行了专门研究,在系统地学习、借鉴国外评价理论的同时,力图从我国实际出发,对教育评价的含义作了一些描绘和阐释。
如:
“教育评价是对教育的社会价值做出判断的过程”,“教育评价是按照一定的价值标准,对受教育者的发展变化及构成其变化的诸种因素进行价值判断的过程”。
基于国内外评价学者对评价概念的阐释和对资料的分析整理,我们发现,尽管各国评价专家学者的哲学观、方法论不同,教育观也不同,但他们对教育评价的认识确有某些共同特点:
(1)承认评价是一个过程;
(2)价值判断是评价的本质特征;(3)以一定的教育价值观为依据;(4)采用一切可行的科学手段。
根据上述特点,我们初步把教育评价界定为:
“教育评价是根据一定的教育价值观或教育目标,运用可行的科学手段,通过系统地搜集信息、分析解释,对教育现象进行价值判断,从而为不断优化教育和教育决策提供依据的过程。
”要理解这一概念,必须明确:
1.教育评价的对象、范围和地位
随着时间的推移,教育评价从早期以学生学习结果为对象,逐渐扩大了应用的范围,现代教育评价则以教育的全领域为对象。
它已成为整个教育系统不可分割的有机组成部分。
从宏观到中观、微观,各种教育现象都可以作为评价对象,而且不仅评价教育结果,教育计划、教育活动和教育过程也可以作为教育评价的对象,这就意味着现代教育评价已经成为现代教育不可缺少的一部分。
因此,必须正确认识评价在整个教育系统中的重要地位,必须明确每项评价的具体对象。
2.教育评价的目的和作用
它涉及评价的指导思想和教育观等基本理论问题。
教育评价是为了鉴定、考核,还是为了推动、改进;是为了选拔、淘汰,还是为了教育、发展,这是两种不同的教育观和评价观。
过去传统的教育评价偏重于鉴定、筛选的功能,其目的是为了“选拔适合教育的儿童”,它是为“应试教育”服务的。
而现代教育评价则强调评价的反馈、矫正功能即调控功能,其目的是为了“创造适合儿童的教育”,即评价是为了诊断评价对象的现状,以便发现问题,使教育、教学工作不断改进、不断完善,不断适合教育对象的需要,为促进儿童个性全面发展和提高教育质量服务。
教育评价的目的是为教育决策提供信息和依据,为改进教育服务,也是为不断完善和改进教育过程、为提高教育质量服务的。
3.教育评价的依据
价值判断是教育评价的本质特征,是教育评价的核心。
根据什么进行价值判断?
如何进行判断?
这是价值判断的实质和关键。
也就是必需有一个衡量和判断的客观依据和标准,是教育的价值目标和标准问题。
我们应当根据马克思主义价值观和社会主义现代化建设的需要,根据人才成长发展的规律,确立我们的教育价值观和价值取向,确定教育评价的价值目标和标准。
从这个意义上说,教育方针、政策和教育目标就是我们的教育价值观的集中体现,我们应当以教育方针和教育目标为依据确定评价的目标和标准。
4.教育评价的手段
教育评价是运用科学的方法和手段,对教育现象及其效果进行测定所作出的价值判断活动。
教育评价的科学性在很大程度上取决于方法和手段的科学性。
离开了科学的评价方法和手段,就不能称之为现代教育评价。
(四)教育评价与教育测量的关系
教育测量就是借助一定的工具,给教育现象赋值,来获得评价对象数量的方法。
教育测量不是教育评价,但它与教育评价有密切的联系。
教育测量是教育评价获得数据资料的重要手段。
评价只有在测量的基础上才能给予正确的判断,通过测量作出的评价才可靠。
测量也需要评价,测量的结果,只有通过评价的解释才能揭示其实际意义。
测量是评价的依据,评价是测量的具体体现。
教育测量与教育评价又有区别,它们是两个不同的概念。
测量关心的是数量的多少,评价关心的是价值的高低;测量是一种纯客观的过程,评价带有主观性,是主观估计与客观测量的统一;测量是一种单一的活动,评价则是一种综合的活动。
三、教育评价的功能和意义
教育评价究竟有什么功能?
什么是教育评价功能?
功能与结构有什么关系?
这是评价实践中提出的理论问题。
系统论的基本原理告诉我们,所谓系统,是由若干相互联系、相互作用的要素所构成的、具有特定结构和功能的有机整体。
任何一个系统都是较高一级系统的一个要素,任何一个要素,通常又是较低一级的系统。
凡系统都有一定的结构和功能。
构成系统的各要素在系统内组成的方式就是系统的结构,这种结构在运动状态下所发挥的效能就是功能。
因此,系统结构与系统功能是相互制约、相互影响的。
教育评价作为教育系统中一个子系统,和其它任何系统一样,也有其系统的结构和功能。
(一)教育评价系统的结构
从教育评价系统结构上分析,教育评价一般是由以下几个要素所构成:
1.价值目标和标准
是指根据社会政治经济的客观需要和人的发展规律的要求,所设计或制定的教育目标、培养目标和课程标准,以及根据这些目标设计的评价指标、标准等。
具体说也就是实施教育评价所依据的评价标准体系。
2.组织机构和人员
是指实施评价的组织机构、领导人员和评价者。
一定的评价任务要求设置与之相适应的组织机构和人员,或领导小组和负责评价的人员。
目前我国普通教育评价的实施,还没有专门组织机构和负责评价的专业人员。
从评价方针的需要看,建立评价制度和设置专门机构是必要的,但就学校内部而言就不是专门机构问题,一般由有关教师、班主任、学生家长参加,同时也吸收被评价者以自我评价的形式参加。
3.评价方法和技术
是指实施教育评价的技术和方法,其中包括各种搜集评价信息的方法和技术、统计处理评价信息的方法技术和进行综合分析判断的方法和技术等。
4.评价对象与评价人员的心理调控
是指参与教育评价的主体与客体双方在评价过程中所表现的动机、需要和人际关系等心理状态,它直接影响评价过程、评价程序的顺利进行,影响评价任务的完成,因此对评价主体与客体的心理调控就具有重大的意义和作用。
必须通过各种调控的途径,取得及时的有针对性的有效控制,才能保证评价的效果,达到评价的目的。
教育评价系统就是由上述4个要素构成的。
这4个要素相互联系,相互制约,构成了教育评价系统的结构。
(二)教育评价的功能
按照系统论的观点,评价功能是教育评价系统结构的内在机制,是构成评价系统的各个要素的组成形式在运动状态下所发挥的功效,是评价系统内部所固有的一种潜在能量。
这种潜能只有在评价实践中才能表现或释放出来,这种功能的外在表现即是作用。
根据这一理解,一般认为教育评价有以下几种意义、功能:
1.教育评价的意义
(1)教育评价是教育管理的重要组成部分。
教育管理的各个环节都需要评价。
没有评价的管理是一个开放式的管理系统,无反馈机制,这是一种不科学、不健全的管理。
有了评价的管理,能及时反馈信息,及时发现问题、解决问题,这是一种闭合回路的管理系统,是一种科学的管理。
因此,可以说,没有评价就没有科学管理,缺少评价,任何管理都是不健全、不科学的。
(2)教育评价是深化教育改革的重要措施。
要进行一项教育改革,首先要进行改革方案的可行性评价;在改革进程中,必须加强形成性评价;在某一改革告一段落时必须进行终结性评价。
只有这样才能避免盲目性,确保教育改革沿着健康的轨道发展。
(3)教育评价是全面提高教育质量的重要手段。
通过教育评价,可以对学校各项教育教学工作的有效性,对学生各方面发展的情况,获取反馈信息,及时总结成绩,纠正偏差,使教育教学工作经常、全面地保持良好状态,从而有效地促进学校教育和教学质量的提高。
(4)教育评价是教育科学研究的重要内容。
现代教育科学研究被划分为三大领域:
教育基础理论研究、教育发展理论研究和教育评价研究。
可见,教育评价是教育科学研究的重要内容。
2.教育评价的功能
(1)导向功能。
教育评价具有指引方向的功能。
通过评价目标、指标体系的引导,可以为学校指明办学方向,为教师与学生指明教与学的奋斗目标。
评价的导向功能是客观存在的,不以人的意志为转移的,它对教育目的的实现和方针的贯彻,有相当强的制约和保证作用。
教育评价是根据教育目标进行的,它通过对现状与目标之间的距离的判断,能有效地促进被评对象不断接近预定的目标。
所以,教育评价具有导向功能。
(2)监督检查功能。
社会各界要了解、考察教育的发展状况,教育行政领导部门要对学校工作进行指导与管理;学校本身也要对师生的教学活动进行调节和控制;教师要对学生的学习进行监督和帮助,都需要通过一个具有检查监督功能的形式和手段,即教育评价。
利用评价的这个功能,我们可以全面地掌握教育的各种情况,敏锐地发现问题并及时加以解决,对任务完成数量与质量进行控制,为促进、提高教育活动的有效性提供科学的依据。
(3)激励功能。
通过教育评价,会激发被评者争先创优的欲望和情绪,从而创造出一种正式或非正式的竞争环境。
在教育与教学管理中,根据工作的特点和活动的规律性,我们可以有意识地利用评价来强化评价对象间的竞争情绪,这样,不仅能起到激励先进、鞭策后进的作用,还可以使评价者预先设定的目标得以实现。
(4)筛选择优功能。
在教育的实际工作中,经常要对教育的对象进行筛选择优。
这就需要将众多的对象根据一个标准来衡量和判断,也就是要对他们进行科学的教育评价。
过去,我们往往凭经验或少数人的意见办事,结果是不准确的,甚至产生了一些失误,对被评对象也是不公平的。
(5)诊断改进功能。
通过教育评价,可以发现教育、教学过程中存在的问题和不足,然后针对这些薄弱环节提出改进的措施,这就是教育评价的诊断与改进功能。
例如,通过对教育管理或教学活动的每个环节、每一步骤、每一要素的正确性、适应性的分析和研究,我们就能判断出学校管理、教师教学和学生学习的薄弱环节或存在的问题,为有效地指导和改进提供可靠的依据,从而达到直接促进教学发展和提高的目的。
对于教育实际工作者来说,这才是最有实际意义的。
四、教育评价的种类
根据不同的分类标准,可将教育评价分成不同的种类。
(一)根据评价的对象和范围不同。
可分为宏观教育评价、中观教育评价和微观教育评价。
1.宏观教育评价
是以教育的全领域及宏观决策方面的教育现象、措施为对象的教育评价,或对一个具有相当规模的地区的教育进行的评价。
这类评价属于总体的、全局性的、高层次的评价。
2.中观教育评价
是以学校为对象,对学校内部各方面的工作进行的评价。
如学校办学质量评价、学校教学工作评价、学校德育工作评价,等等。
3.微观教育评价
是以学生为对象的教育评价。
如对学生的学业成绩、思想品德、智能发展等的评价。
(二)根据评价的时间和作用不同,可分为诊断性评价、形成性评价和总结性评价