《教育测量与评价》期末考试指导带答案Word文件下载.docx

上传人:b****6 文档编号:20386383 上传时间:2023-01-22 格式:DOCX 页数:15 大小:29.30KB
下载 相关 举报
《教育测量与评价》期末考试指导带答案Word文件下载.docx_第1页
第1页 / 共15页
《教育测量与评价》期末考试指导带答案Word文件下载.docx_第2页
第2页 / 共15页
《教育测量与评价》期末考试指导带答案Word文件下载.docx_第3页
第3页 / 共15页
《教育测量与评价》期末考试指导带答案Word文件下载.docx_第4页
第4页 / 共15页
《教育测量与评价》期末考试指导带答案Word文件下载.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

《教育测量与评价》期末考试指导带答案Word文件下载.docx

《《教育测量与评价》期末考试指导带答案Word文件下载.docx》由会员分享,可在线阅读,更多相关《《教育测量与评价》期末考试指导带答案Word文件下载.docx(15页珍藏版)》请在冰豆网上搜索。

《教育测量与评价》期末考试指导带答案Word文件下载.docx

第三章教育测量与评价的质量特性

1.衡量测验质量的四个指标

从教育测量的理论上来讲,一个良好的测验应该具备恰当的难度和区分度,具备较高的信度和效度,也就是说,测验的信度、效度、难度和区分度是衡量测验质量的基本指标。

其中,前两个指标主要是对整个测验而言,后来两个指标主要是对测量的项目而言。

信度(reliability)简单地说就是测量结果的可信程度,指的是测量结果的稳定性程度,记为rxx。

具体地说,测验的信度是指同一组学生用同一测验实施两次后所得分数的一致性,或者同一组学生经过一次测验后,用另一个同质的测验再测一次,这两次测验所得分数的一致性。

估算测验的信度有三种方法:

重测信度、复本信度、同质性信度。

效度是指测量结果的准确性和有效性的程度,亦即测量是否达到了预期的目的。

效度分为三大类:

内容效度、效标关联效度和结构效度。

难度是指测验的难易程度。

在教育测量中,某测验的难度一般是用正确解答该测验题的人数与参与测验的学生数的比值来刻画的。

用公式表示即:

P=R/N,其中,P表示某测验题的难度,R表示答案对该测验题的人数,N表示参加测验的人数。

测验题目的难度必须根据测验的目的确定和评价。

难度是试题对学生知识和能力水平的适合程度的指标,是由参与测量的被试群体的整体水平决定的。

区分度,又叫鉴别力,是指测验对考生实际水平的区分程度,用符号D表示。

具有良好区分度的测验,实际水平高的应该得高分,实际水平低的应得低分。

它是评价试题质量,筛选试题的主要指标与依据。

2.信度的估算方法

根据统计学的基本原理,估算测验的信度有三种方法:

重测信度、复本信度和同质性信度。

重测信度也叫稳定性系数,它指的就是用同一量表(测验或评价表)对同一组被试施测两次所得结果的一致程度,其大小等于同一组被试在两次测验上所得分数的相关系数。

复本信度指的是两个平行测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。

同质性信度也叫内部一致性信度,它是指测验内部所有题目间的一致性程度。

这里题目间的一致性含有两层意思:

其一是指所有题目测的是同一种心理特质;

其二是指所有题目得分之间都具有较高的正相关。

也就是说,同质性信度就是一个测验所测内容或特质的相同程度。

3.提高测验信度的方法

(1)适当增加测验题目的数量;

(2)测验的难度要适中(测验的难度适中,能使测验的信度达到最大,也能使测验的区分度达到最大,所以,必须使测验的难度适中);

(3)测验的内容应尽量同质;

(4)测验的程序应统一;

(5)测验的时间要充分;

(6)评分要尽量做到客观化、减少评分误差;

(7)应试者参加测验的动机水平、积极性、疲劳程度也会影响测验分数,从而影响信度。

引起应试者参加测验的强烈动机,提高其积极性,使其保持旺盛的精力,都对提高测验信度有一定作用。

4.信度和效度的关系

在效度和信度之间,首先要重点保证是高效度,因为,高效度必然高信度;

反之,则不然。

特别是对于教育测量而言,效度问题显得更为重要。

在处理信度与效度的关系问题上,首先要保证高的效度。

信度是效度的必要条件。

虽然信度高的测验效度不一定高,但效度高的测验,信度却一定比较高。

效度和信度的关系是:

效度的最大值等于信度的平方根。

但是,既要有高效度,同时又要有高信度,是不大可能的。

例如,同质性测验(量表的所有题目测验相同的因素)信度较高,但对预测来说,效度却很低。

非同质性测验(其测验内容测量不同因素)预测效度高,但是信度却比较低。

所以,要提高预测效度的一个重要方法,是增加非同质性,即增加新因素。

5.难度

(1)难度对测验的影响:

影响测验分数的分布状态、影响测验的鉴别能力。

难度值过大或过小,都会造成测验分数的偏态分布。

难度值越接近0,测验的难度就越大,正确回答试题的人数就越少,测验分数就越是集中在低分段,其分数分布呈正偏态。

测验难度直接影响测验分数的离散程度,因为难度过大或过小,测验分数的分布都呈偏态分布,亦即测验分数都分布在高分段或低分段,这样,测验分数的离散程度就变小了。

适中的难度可使试题的区分度达到最大。

(2)影响题目难度的因素:

考查知识点的多少、考查能力的复杂程度或层次的高低、考生对题目的熟悉程度、命题的技巧、利用经验判断或者通过预测调整难度。

6.区分度与测验信度、难度的关系

(1)区分度与信度的关系:

提高区分度可以达到理想的测验信度。

(2)区分度与难度的关系:

难度适中,可使区分度达到最大值。

难度为1时,区分度为0。

7.提高区分度的方法

(1)使题目的难度适中,使整个考试难度适中;

(2)着重考察复杂的学习结果

第四章编制教育测验的一般原理与方法

1.布卢姆的认知领域的目标分类

布卢姆将认知领域的目标分为六个类别,按照由低级到高级的难易程度形成一种递进的等级关系,前一类别是后一类别的基础,后一类别又涵盖了前面的类别。

(1)知识/知道。

这是最低等级的认知目标。

此处的知识是指对具体事物和普遍原理的回忆,对方法和过程的回忆,或者对一种模式、结构或框架的回忆。

(2)领会。

这是最低层次的理解,指个人把某种材料与其他材料联系起来,也不必弄清它的最充分的含义,便知道正在交流什么,并能够运用正在交流的这种材料和观点。

(3)运用。

运用是指将抽象概念用于特定、具体的情境。

这些抽象的概念,可能是以一般的观念、程序的规则或概括化的方法等形式表现出来的,也可能是那些必须记住、能够专门运用的原理、观念和理论。

(4)分析。

分析是指把材料分解成各个组成部分,弄清各部分之间的相互关系及其构成的方式,以指出那些用来传递意义或确定交流结果的技术和手段。

(5)综合。

综合是指将各种要素和组成部分组合起来,以形成一个整体。

它是对各种要素和组成部分等进行加工的过程,是一个用这种方式将它们组合起来,以构成一种原先不那么清楚的模式或结构的过程。

(6)评价。

评价是指为了某种目的,对观念、作品、答案、方法和资料的价值及符合准则的程度作定量和定性的判断。

准则既可以是内在证据,如逻辑上的准确性、一致性等,也可以是外部准则,如根据挑选或回忆出来的相应领域的最高标准等。

2.测验题目基本上分为两大类:

选择型和供答型。

前者一般要求被试在几个选项中选择正确的答案,如是非题、匹配题、选择题等,后者要求被试自己提供答案,如论文题、简答题、填空题等。

第五章教育测验的常模及其建立方法

1.一个与被试同类的团体在相同测验上得分的分布状况与结构模式,成为常模。

所谓年级常模,就是不同年级学生在某种测验上的正常的一般的表现水平。

教育测量数据的特点

教育测量的数据,本质上不同于物理测量的数据,不能直接套用相应于物理测量数据的方法:

(1)教育科学研究中绝大部分数据属于等级变量,可以比较大小,不能加减更不能乘除;

(2)教育测量的多数数据从本质上说是主观的;

(3)教育测量的数据还具有随机性;

(4)教育测量的数据也具有模糊性。

2.常模参照测验与标准参照测验

在教育与心理测验中,可依据解释测验分数的参照点不同,把测验分成常模参照测验和标准参照测验。

即参照测验的常模,对测验的分数进行解释与评价的测验,称为常模参照测验;

参照测验的“标准”,对测验的分数进行解释与评价的测验,称为标准参照测验。

标准分数的使用是基于常模数据服从正态分布的假设。

标准分数是以标准差为单位表示测验成绩与平均分数之间的距离。

标准分数本身是关于原始分数的一种线性变换,因此,标准分数不改变原始分数的分布形态。

标准分数Z分数具有较好的可比性和可加性。

3.教育测量量表分类

按照测量的精确程度,将测量量表从低到高分为称名量表、顺序量表、区间量表/等距量表和比率量表。

4.等距变量

等距变量具有等级变量的特征,还要求连续数量之间的差距相等,亦即具有相等的单位。

因此,等距变量可以作加减运算,不能作乘除运算(因为等距变量并没有绝对零点)。

5.测验蓝图的设计一般采取的步骤

测测验的蓝图一般用反映测验内容和学习水平的命题双向细目表表示。

设计测验蓝图主要采用以下步骤:

(1)确定测验内容要目。

如何确定测验内容要目,必须依据课程标准或教学大纲、教学目标和学生的实际而定。

(2)确定该科目应考查的目标层次。

把这些目标层次从低级到高级依次安排在表中顶端第一行的有关格上。

(3)确定各项测验内容要目下的权重。

根据课程标准或教学大纲所规定的教学时间和分配比例,以及测验性质和其他因素,对列入测验范围的内容要目或内容点,赋以合适的相对比重即权重。

该比重是测验试题数量、测验时间、分数分配的依据。

(4)形成命题双向细目表。

把每一项考试内容的分数比重逐一分配到若干必要的测验目标层次上去,形成网格状的分数分配方案,即命题双向细目表。

第六章教育测验的标准及其建立方法

1.教育测验标准的含义

教育测验的“标准”指的是教育测验的成就标准,它对于编制标准参照测验以及解释标准参照测验的分数具有重要的意义。

第七章制定教育评价表的一般方法和步骤

1.教育评价表

教育评价表是根据教育教学的特性编制而成的,它由评价指标、评价项目(条目)、评价标准、评定等级、指标权重等构成。

它是进行教育测量与评价的工具,为了使评价的结果更为可靠,需要对教育评价表进行更深入的研究。

2.教育评价表的构成要素

(1)评价指标:

就是根据评价的目标,由评价指标的设计者分解出来的,能够反映评价对象某方面本质特征的具体化、行为化的主要因素,是对评价对象进行价值判断的依据。

(2)指标权重:

就是表示每项评价指标在指标体系中所占的重要性程度,并赋予相应的值,这个数值就叫做对应指标的权数,或叫做权重。

(3)评价标准:

衡量评价对象达到评价指标要求的尺度,是由强度和频率、标号、标度三个要素构成。

3.常见的指标权重分配方法

常见的指标权重分配方法有

(1)关键特征调查法

关键特征调查法是先请被调查者从所提供的备择指标中找出最关键、最有特征的指标,再对指标进行筛选并求出其权重的方法。

其操作步骤包括:

①提出备择指标。

②请被调查者从备择指标中找出一定数量的关键指标。

③计算人数和百分比。

④按一定的规则选取指标。

⑤计算各指标的权重系数:

(2)两两比较法

为了确定各指标的权重,可对指标进行逐对比较,并加以评分,重要者记为1分,次重要者记为0分;

然后分别计算各指标得分之和,再除以所有指标得分之总和。

这种方法叫两两比较法。

(3)专家评判平均法

对于已经确定的指标,分别请专家评判其权重,然后以专家评判结果的平均数作为各指标权重。

这种方法叫专家评判平均法。

这种方法的特点是简便易行,能够充分交流意见。

不足之处是:

主观随意性较大,容易受专家的素质、水平等因素的影响。

因此,要保证权重确定的合理性和准确性,使确定的权重具有一定的信度和效度,关键在于专家的素质和水平。

(4)倍数比较法

对已确定的指标,以每一级指标中重要性程度最小的指标为基础,记为1,然后将其他指标与它相比,作出重要性程度是它多少倍的判断,再经归一化处理,即获得该级各指标权重。

这种方法称倍数比较法。

(5)Q分类法

Q分类法是一种确定指标优先顺序及其权重的方法。

总的方法是将写有指标名称的一套卡片交给被调查者,请他们按指标重要性程度分组。

优点:

简便易行,在指标数目较多的情况下,更为适用准确性较低。

缺点:

准确性较低。

4.制定教育评价表需要遵循的原则

它是进行教育测量与评价的工具,制定教育评价表应遵循以下的原则:

(1)科学性与导向性原则

(2)完备性与独立性原则(3)发展性与整体性原则

(4)操作性与可测性原则(5)可行性与可比性原则(6)超前性和持续性原则

第八章学生评价

1.学生评价概述

Ø

学生评价的类型

(1)定位性评价:

又称安置性评价、预备性评价,主要是在特定的教学活动之前,判断学生的前期准备。

在这种评价里面要解决的问题是学生是否已经掌握了参加预定活动所需要的知识和技能,在多大程度上已经达到教学目标,学生的兴趣等基本情况等等。

(2)形成性评价:

主要是指不断地反映学生学习成功或者是失败的信息,特别注重强化学生学习的成功之处,显示学生学习过程中需要改进的具体的错误。

(3)诊断性评价:

诊断性评价对学生的学习进行进一步的评价,对于学习中错误的深层诊断。

(4)总结性评价:

在某个期末教师对学生的测验和评价。

对教学目标达到程度的判断,同时也提供教学目标适当性和教学策略有效性的信息。

2.现代学生评价的特点

(1)强调了评价功能的形成性

现代教育评价的目的中强调参与和推动教育的发展。

现代的学生评价,主要是用来诊断问题,改进教育,其目的则是创造适合儿童的教育。

对评价形成性功能的重视又反过来是现代教育评价发展的一个重要动因。

(2)重视评价内容的全面性

教育工作者要求评价须全面地反映教育目标,对学生认知、情感以及动作技能的发展做出全面的评价,以促进学生的全面发展。

因而,评价活动对教育活动能提供更大的帮助。

(3)重视评价类型的多样性

根据现代教育的需要,现代教育评价注意为教育提供全方位的服务,逐步地发展了包括定位性评价、形成性评价、诊断性评价在内的多种评价。

这种多样性的评价,在学校教育的不同阶段提供不同的评价服务,使得评价在推动教育的发展中能起到越来越大的作用。

3.学生课业发展的内容框架(评价学生的方面)

从综合的角度出发,提出学生课业发展的内容框架。

这个内容框架,除了学生的健康与体能发展目标外,还可包括如下九个方面:

(1)学生个体一般性发展

这主要是指学生的“个人一社会性”方面的发展,它是学生在学校教育背景下社会化的发展成果,也是教育具有社会性的体现。

一般性发展目标涉及到公民素质、社会责任、环保意识、学会学习、学会生活、学会做事、学会做人、学会合作、学会思考等等。

(2)学科理论知识和学科能力或技能的发展

对学科的理论知识,我们可以从四个层面加以把握:

体现学科基础性的理论知识、体现学科发展性的理论知识、体现学科一般性或苛刻性的理论知识、学科理论知识应用能力的发展。

课业考评必须树立新的知识观和价值观,对知识理论的应用可从三个水平来把握:

理论知识的简单应用、综合应用和创造性应用。

常见的学科能力或技能有:

听说技能、阅读技能、写作技能、创作技能、观察技能、操作技能、交流技能等。

(3)思维技能与品质的发展

学生思维技能的发展,既是学校各门课程共同的教学目标之一,又是影响各门课程教育目标达成的因素之一。

在评价学生的思维技能的发展时,除了解学生的不同思维方法之外,还要评价学生的思维品质。

(4)研究与学习技能

研究技能主要包括:

搜集、获取、整理、处理与利用信息的能力;

提出问题或提出有条理的假说的能力;

获取研究资料的能力;

设计实验与验证假说的能力;

统整资料与分析研究资料的能力等。

学习技能主要包括学习过程中的认知技能和学习策略应用两个方面。

(5)创新精神与实践能力的发展

在教育教学中,重视培养学生的创新精神与实践能力,这是实施素质教育的重点。

重视对学生创新精神与实践能力发展的评价,具有导向性和体现时代精神的重要意义。

(6)态度、观念与兴趣的发展

态度主要包括对学习、社会、社会道德伦理、科学、生活、人生、人际关系、自然界的态度等许多方面。

观念包括知识观、科学观、人生观、世界观、审美观、道德观、职业观、幸福观等许多方面。

学生兴趣的发展也表现出多样性,诸如对研究的兴趣、提出与众不同问题的兴趣、探索某领域问题的兴趣、对人际交流的兴趣、对对公益活动的兴趣、对某种学科或某种艺术活动的兴趣、对某种职业的兴趣等。

(7)欣赏与审美的发展

美育是重要的教育内容,它对学生的发展起着微妙的、重要的作用。

(8)适应与习惯的发展

学生的适应与习惯一方面是影响学校教育和学生个体发展的因素之一,同时也是学校教育的结果之一。

(9)个体独特性的发展

个体独特性发展目标在“以人为本”、“尊重学生需要”、“个性发展”以及关注“个体化目标”和“个体化评价”等理念下得到重视。

4.学生评价原则

(1)发展性原则:

学生评价要围绕学生的发展,为学生的发展服务,这是发展性原则的核心思想。

(2)全面性原则:

学生评价要紧扣教育目标,全面地反映教育目标。

学生评价不全面,必然会把学校教育引向片面。

(3)明确性原则:

评价的目的要明确,评价的要求也要明确,这是明确性原则的基本涵义。

(4)过程性原则:

学生评价作为促进学生发展的工具,要贯穿学生学习活动的全过程。

要充分利用定位性评价、形成性评价、诊断性评价与总结性评价的不同功能,在学生学习的各个过程提供各种不同类型的评价服务。

5.人格

人格即指人与社会性联系最为密切的心理特质的总和。

人格特征可以是外在的,也可以是隐藏在内部的。

人格的形成是由先天的遗传因素和后天的环境和教育因素相互作用的结果。

人格是在先天遗传因素的自然基础上形成和发展的,又主要由个体的生活史所决定,它受社会历史条件的影响。

人格有其不同的侧面,通常包括:

气质、性格、适应性、兴趣、态度等,所以说人格很重要的方面是自我与现实之间的和谐,以及自我和理想的自我之间的和谐。

6.在现代社会中,具有健康人格的学生具有的特征:

在现代社会中,青少年学生所具有的健康人格应是:

能客观地认识自我和外部世界;

情感和态度上是开放的;

对所承担的学习和其他活动有胜任感;

充分发挥自己潜能;

对父母、朋友有显示爱的能力;

有安全感;

喜欢创造;

有能力管理自己的生活;

有责任感等。

7.课业考评存在的问题

近几年来,校内考试制度与方法有许多重要的改进,但就学校教育整体来看,课业考评仍存在一些较严重的问题,主要表现在如下几个方面:

首先,课业考评指导思想与学校教育理念、目标不相适应,在考试设计及考试结果的使用过程中过分强调区分和选拔功能。

许多学校的教育人员还常常利用考分去夸大学生之间的差异和许多低考分学生的弱点,并把低考分的学生列为差生或落后生,使其蒙受许多羞辱。

在这样一种以考试为导向的教学及其评价模式中,学生从小学开始便经常接受考试的磨练,自觉不自觉地把学习的注意点和动机几乎全押在考试之上。

可以想到,在学生成长过程中,一旦有些个体在考试历程中屡遭挫折和失败,这意味着激烈竞争的现实在学校中是以考试作为唯一标准对他们进行淘汰,也意味着现实教育价值观体系及学校教育实践对他们的否定,更意味着教育追求和教育模式在这些学生个体身上的失效。

更令人痛心与不安的是,考试失败给这些学生带来“少年新烦恼”及意志消沉,而且他们还常因影响所在学校的升学率而遭一些人的嫌弃。

所有这些极端的现象,与学校教育的理念、目标尤其是与基础教育的性质及要求是格格不入的。

其次,课业考评方法单一,把考试的教育功能简单化,考试的评定功能绝对化。

长期以来,许多学校把书面考试作为学生课业和心智发展的唯一测评手段,而且考试设计和考试方法多局限于那些能够用纸笔材料加以测评的知识技能,对于那些没被测到的或者难以用纸笔测到高级心智技能,则在日常教学中不够重视。

这无形中强化了“分数至上”的人才评价观,使教师、学生乃至家长都在为高分而努力;

使学校的课程内容变得更加狭窄,考试和教学关系异化;

考试其他种种积极的教育功能受到弱化,背离了基础教育所应秉持的教育理念。

再次,课业考评抽象化和表征化。

长期以来,学校课业考评只重视考试结果量化的分数表达,不重视分析研究每个学生的试卷,不重视学习过程和发展进步在质性方面的描述评价;

只重视对认知领域可测性内容的考试测量,忽视了学校教育目标的广泛性和学习内容的丰富;

只重视用抽象概括化的考分来评价学生的学习结果,不重视采用多种方法对学生发展进步作实质性的描述评价;

只注意学习的共性目标,不重视对学生学习特点、发展进步以及潜能结构作个别化的评价。

在这种单调和抽象的课业考评方法下,必然丢失学习过程及考试过程业已显示出来的大量有用信息,并且把相同考分的学生看成相同的发展,忽视了学生心理发展和智能结构差异的多面性和客观性。

第九章教师评价

1.教师评价的种类

成果评价、教学行为评价、素质评价

2.教师评价的方法

研究结果表明,有多种途径可用于教师评价:

自我评价、家长评价、学生评教、同行评议、书面材料的收集与观察以及教学成果等等。

目前常用的教师评价方法主要有教师自评、学生评教、同行评议以及观察与会谈等。

在以上评价方法中,教师自评是教师评价中一个重要的方面,这不仅因为它是收集必要的信息的一个途径,而且因为它也是教师自我诊断的一个重要方面。

在一定意义上,甚至可以说,教师自我评价的过程就是教师自我激励与自我提高的过程。

在这多种资料的收集途径中,学生对课堂教学的评价也是最有力的材料。

同行评议不仅在形成性评价中有很大的潜在价值,而且对在教师中创造一种专业发展的气氛也有重要意义。

使用同行评议这一方法的基本观点,是在评价教师能力方面同行具有较大的发言权。

现场观察在教师评价中一直占有重要的位置,因为它具有相当的可靠性。

但研究表明,课堂观察的可靠性与有用性,直接地依赖于观察者在观察之前所掌握的信息量与信息的类型。

在实践中还没有任何一种方法,已被证明对总结性的判断来说,已达到必要的信度的要求。

然而,多渠道地收集信息,有助于提高评价的信度。

第十章课程方案评价

1.课程方案评价的内容

(1)课程计划的评价;

(2)学科教学大纲的评价;

(3)教材的评价

教材是教学大纲的具体化,因此,对教材的评价核心是教材与教学大纲的一致性、科学性与可读性。

2.教材评价的原则

教材评价的原则有科学性原则、教育性原则、思想性原则、学科先进性和艺术性原则、技术性原则等。

第十一章教学工作评价

1.教学工作评价的功能

教学工作评价的功能可以从不同角度去考察,主要有以下几个方面:

(1)检查:

教学工作评价是检查教学工作的重要手段。

(2)反馈:

教学工作评价可以给教学工作提供科学的反馈信息,从而

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工作范文 > 演讲主持

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1