评语大全之测量工作评语.docx
《评语大全之测量工作评语.docx》由会员分享,可在线阅读,更多相关《评语大全之测量工作评语.docx(14页珍藏版)》请在冰豆网上搜索。
评语大全之测量工作评语
评语大全之测量工作评语
测量工作评语
【篇一:
测量与评价问答题】
测量的要素单位,参照值,量表。
教育测量的含义它是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。
教育测量特点1测量结果的间接性2度量单位的相对性3测量对象的复杂性4测量目的的针对性)教育测量的功能:
1、有利于提高教育、教学的水平2、有利于提高教育管理的水平3、有利于发展教育研究的方法。
教育评价的含义是根据一定的教育价值或教育目标,运用可行的科学手段,通过系统的收集信息,分析解释,对教育现象进行价值判断,从而为不断优化教育和教育决策提供依据的过程。
意义它是教育管理的重要组成部分,是深化教育改革的重要措施,是全面提高教育质量的重要手段。
功能导向,监督检查,激励,筛选择优,诊断改进。
教育测评的历史测量萌芽时期1864以前,蓬勃发展1864-1940,深入发展;评价开创时期1930-1958,大发展1958-1972,专业时期。
衡量测量质量的四个指标信度,效度,难度,区分度
如何提高信效区分度;信度指的是测量结果的稳定性或可靠的程度,亦即测量的结果是否真实、客观地反映了考生的实际水平。
类型稳定性系数,等值性,内部一致性,论文式测验的信度系数,平分者信度1适当增加测验题目的数量2测验的难度要适中3测验的内容应尽量同质4测验的程序应统一5测验的时间要充分6评分要尽量做到客观化,减少评分误差效度指一个测验能够正确测量所要测量的属性或特征的程度。
1控制系统误差2精心编制量表3妥善组织测验4扩充样本容量和代表性5合理处理效度和信度的关系6适当增加测验的长度区分度指试题能否将考生区别开来的量度指数。
1使题目难度适中,是整个考试难度适中2着重考啥复杂的学习结果难度1考查知识点的多少2考查对题目的熟悉程度3考查能力的复杂程度或层次的高低4命题的技巧性
20世纪50年代国外的教育目标的分类法布卢姆认知目标分类1知识2理解3应用4分析5综合6评价加涅教育目标分类智力技能,认知策略,言语信息,运动技能和态度。
梶田叡一基础目标,提高目标,体验目标。
确定目标应注意的问题1深入分析课程教学目标2正确选择目标领域及其类目3正确理解各类目标之间的关系教通用的题型是非题,配对题,选择题,填空题,改错题,名词解释题,简答题,计算题,论述题。
怎样进行命题设计1)内容类测验目标模型的构建,
(2)内容点测试目标表的确定3)命题方案表的设计试题编制的质量要求1明确测验目标2题量尽可能大3掌握好试题的区分度4注意改进题型5每道试题的编写要讲究科学性6制定好标准答案,评分标准和评卷的具体要求7拼卷和检核
试题编制的组织管理1组织领导与命题人员2命题过程的组织管理测试实施要抓好如下工作1指定专人做好考务工作2确定测验形式和审查学生测验资格3考场的组织4测验评卷与测验质量检查5补考
教育评价的基本原则1方向性原则2公平性3客观性4科学性5可行性6指导性教育评价指标体系的结构1框架2模型3指标4标准(效能,素质,职责)5量化符号什么是评价指标体系的信度和效度?
检验评价指标体系信度有那些方法?
信度重评,评价者,事实信度。
效度是指评价指标,评价标准,评价的量化符号等元素书记的准确性和代表性。
如何构建教育评价指标体系?
1掌握构件建教育评价指标体系的依据2掌握评价对象逐级分解的方法3掌握评价等级和标准确定的方法4掌握指标和等级数值分配的方法有哪些评价标准的编制方法?
1期望评语式编写法2积分评语式编写法3隶属度式编写法4行为目标式编写法5量表式6量尺式教育评价方案的编写包括哪些部分?
是以教育评价指标体系的撰写为核心的,包括前言,评价指标体系,和附录部分的编写。
简述教育评价实施的基本步骤1准备工作(思想准备,材料和工具的准备,组织准备)2评价的实施(自评,他评)3评价结果的处理(评价结果的分析判断,作出综合评价的结论,评价结果的信息反馈,评价工作的总结)
五类教育评价方法1绝对评价法相对与个体内差异评价法2定性分析评价与定性综合判断法3行为目标评价法和临床督导评价法4指标评分法和等级还分法5加权平均法,模糊综合评判法,集体综合评价法和坐标综合图示法教育评价信息的收集标准1准确性2可靠性3时限性评价信息的收集方法1观察法2听汇法3调查访问4座谈会5收集文字资料6发问卷7测试教育评价定性分析描述方法等级评定法,评语鉴定法和写实分析法定量分析评判分为统计分析评判法1平均数2加权平均数3标准差4标准分数5t分数模糊综合评价法1确定判断的因素集u2确定因素权数2确定评价等级4建立因素集的模糊矩阵5选择评判模型6计算综合评价值教育评价结果的合成方法1单纯普通数据的合成方法2单纯模糊数据的合成方法3呼和数据的合成方法
教育测量的数据有何特点一是数据的波动性二是数据的规律性教育测量的数据有哪些种类按数据来源分1点击数据2度量数据按照数据的连续分1间断性数据2连续性数据按数据的精确程度分1类别变量2等级变量3等距变量4比率变量统计表的结构有哪些表序,表题,标目,线条,数字,表注如何编制频数分布表1求全距2定组数3求组据4定组限5求组中值6归类划记简述标准分数的意义和公式百分数等级
分数及计算教育测量分数的组合有哪些常用方法1直觉判断2加权求和3多重选择4多重回归多科测验分数加权平均标准化的意义和方法
教育评价心理的分类一根据心理学范畴可分为评价的心理过程,心理状态,心理特征二根据评价过程的阶段可分为组织过程心理,设计过程心理,实施过程心理,评价过程心理和被评价者准备心理,自评心理,受评过程心理,结果反馈心理三根据评价者或者被评价者的心理机制分为意识倾向,情意心理,认知倾向,个性心理特征评价者对被评价者的一般心理影响有哪些1对自信心和自我概念,自我知觉得影响2对情绪稳定和不安的影响3对意志和动机的影响4对要求水平和到达目标的影响5对评价者和被评价者之间关系的影响评价者心理对评价过程有何影响1对制定评价方案的影响2对收集和分析评价信息的影响3对测定与评价的影响4对评价结果解释的影响调控评价心理有何意义1通过心理调控,可以使教育评价的准备更加合理充分2通过心理调控,可以保证教育评价活动的事实得以顺利进行,更好的完成各个环节的任务3通过心理调控,可以使评价的功能得以全面发挥,圆满实现评价的目的评价者在准备过程中有何心理现象1角色心理2心理定势3新奇感4时尚效应5期望效应评价者在评价过程中有何心理现象1自尊心理2首因效应3近因效应4晕轮效应5参照效应6理想效应7顺序效应8趋中心理9成见效应10宽大效应11附和权威心理评价
者在结果处理过程中有何心理现象1类群心理2从众心理3逆反心理4本位心理5模式效应被评价者在受评过程中有何心理现象1应付心理2迎合心理3自卫心理被评价者在结果反馈中有何心理现象1敏感心理2护短心理3嫉妒心理4对评价进行评价心理
科举考试的内容贴经,墨义,策问,论,诗赋现代与古代语文考试的不同点1
品德测评的意义有利于学生思想上的自我教育和学校德育工作的顺利开展,2有利于激励先进和鞭策后进3有利于学生德育管理4品德测评时德育和行为科学研究的重要手段品德测评的类型1诊断性测评2形成性测评3总结性测评品德测评的要求1外显行为测评与道德认识测评相结合2单项测评与整体测评相结合3定性测评与定量测评相结合品德测评指标体系的依据1依据社会的需要2依据德育大纲3依据品德结构4依据学生年龄特征构建中小学生品德测评指标体系的基本要求1重视指标体系的开放性2重视指标体系的教育性3处理好普遍性和特殊性的关系4处理好稳定性和发展性的关系5处理好统一性和灵活性的关系品德测评的方法1定时考核法2问卷测评法3项目评分法4情境测验法
5社会关系测量法6意向测评法7行为观测法
教师评价的含义是对教师活动进行描述和价值判断的过程。
对象是教师活动中抽象存在物和非抽象存在物特点1教师被评价者评价是一个活动过程它是一种特殊的连续活动,包括一系列的步骤和方法。
2教师评价是有目的有计划的活动过程3教师评价的根本目标在与形成价值判断,进而做出选择4教师评价活动中评价者和被评价者事统一的教师评价的主体1教育行政部门,学校,教师参评2学生参评3家长参评4教师自评教师评价的模式有1实证范式评价(行为目标评价模式,操作主义评价模式)2人为范式评价(发展性评价模式,主体性评价模式,团体性评价模式,教师校本评价)教师评价的程序1确定评价目的2确定评价者3制定评价指标体系4确定评价方式5评价过程的实施教师评价指标体系应由三个维度素质评价指标(1思想道德素质2文化理论3身体心理)职责评价指标(1育人管理职责2教学科研3协同工作)绩效评价指标(育人管理成效2教学科研成效3协同工作)其中素质评价指标是教师实施教育教学的基础,职责评价指标是教师实施教育教学的关键,绩效评价指标是教师实施教育教学的最终目标。
什么是教学工作评价?
它有哪些主要功能?
是对教学工作的过程和结果进行的价值判断。
功能1检查2反馈3激励4研究5定向6管理教学工作评价应注意什么问题?
1关于教学工作量与质的关系问题2关于他评价和自评价的关系问题教学工作评价的宏观依据是什么?
1依据教育方针和政策法规2依据教学大纲和教科书3依据教学规律与教学原则4依据学生身心发展规律5参考新的思想观念教学工作评价的内容是什么?
包括对教师备课上课批改作业课外辅导命题考试等教学工作基本环节的评价内容。
还有两问
什么是课程评价?
泰勒目标达成模式的概括内容是什么?
对泰勒目标达成模式做简要评价。
简述课程评价模式的发展与课程,评价认识发展的关系?
我国学校体育评价应该遵循什么原则?
1自主性原则2动态性原则3人文化原则4多极化原则你如何看待江苏省江阴一中进行体育评价改革?
如何评价体育老师的教学质量?
学生在课堂上的行为表现,情绪体验,知识获得以及交流合作等方面,包括学生参与教育的机会,时间长短,积极性和效果,以及学生对课堂的情绪体验,对教师行为的反应,学生在教学结束时知识掌握的情况,学生在课堂终具体的合作,探究行为等等,成为判断一堂课成功的主要依据。
学校评价的目的及意义是什么?
目的1改进学校管理,充分发挥学校效能2判断学校工作的好坏
,评定学校的优劣。
意义1中小学学校评价是现代学校教育发展的客观要求,也是我国基础教育改革的迫切需要2学校评价对学校教育起着重要的定向引导作用3学校评价可以促进学校领导和教职员工的发展4学校评价有利于调动社会各方面的力量关心学校教育现代中小学学校评价的内容有哪些变化?
1学校的发展目标2学校的发展能力3学校发展的自我保障机制4学校的发展成效学校管理评价的涵义是什么?
它包括哪些内容?
含义指根据一定的教育目标,通过决策,计划,组织,指导和控制,有效地利用教育的各种要素,以实现培育人的学校管理活动。
发展性学校评价的基本理念是什么?
这些理念是如何指导学校评价的?
理念1变一元标准为多元标准2重视学校发展过程3发展学校自主评价你认为在建筑发展性学校评价的模式时要注意的问题有哪些?
1在学校自评与他评的关系上,要以学校自评为主,外部他评为辅2在形成性评价和终结性评价的结合上,要以注重过程的形成性评价为主3在发展过程和发展结果的关系上,要侧重于发展过程4在统一标准和办学特色的关系上,要强调办学特色5要重视评价结果的反馈
二、什么是形成性测量与评价、诊断性测量与评价和总结性测量与评价?
它们的使用有何重要意义?
答:
形成性评价是指在教育、教学活动计划实施的过程中,对计划、方案执行的情况进行的评价。
其目的是为了了解动态过程的效果,及时反馈信息,及时调节,使计划、方案不断完善,以便顺利达到预期的目的。
诊断性评价是指在教育、教学活动开始之前,为使计划更有效地实施而进行的预测性、摸底性评价。
其目的是为了摸清评价对象的基础和情况,分析存在的问题,为解决问题搜集必要的资料,以找到解决问题的办法。
总结性评价是指某一教育、教学活动项目告一段落或完成以后进行的评价。
其目的是为了了解这项活动达到预期目标的情况以及它的最终效果或效益。
六、如何理解教育目标与测验目标的关系?
答:
测验目标是测验编制者所编制的测验所要达到的某种具体的目的,它明确规定测验所要达到的预期结果或标准。
测验目标的确定是以教育目标分类理论为基础的。
布式的认知目标分类法一直被认为是测验目标分类的依据。
七、试述设计测验蓝图的主要步骤。
答:
(1)内容类测验目标模型的构建,
(2)内容点测试目标表的确定,(3)命题方案表的设计。
八、试述布卢姆关于认知领域的教育目标分类的内容。
答:
布卢姆把教育目标分为认知领域、情感领域和动作技能领域,把认知领域分为知识、理解、应用
、分析、综合和评价等六类。
九、测验试题主要有哪些类型?
试分析各类试题的测量功能与命题要求。
答:
题型可分为两大类,一类是封闭式,另一类是开放式。
封闭式题型的答案是固定的,十分正确,评分客观、可靠。
包括选择型和提供型,选择型包括是非题、配对题、选择题等,提供型包括填空题、改错题、名词解释题、简答题。
开放式题型正确答案的自由度比较大,由评分者掌握,不能用机器阅卷。
包括计算题、证明题、论述题、写作题、设计题、翻译题等。
是非题由一个陈述句构成,要求学生判断真或假,是或非,对或错,等等。
主要功能是测量学生判断陈述句子的正确性能力。
配对题是一种改造的选择题。
它把一系列的题干列成一列,把配备的选项列在另一列,即数个题干共同使用相同的几个选项,要求所有选项均构成每一题干的似真项。
主要功能是测量学生对字词的、事件、人物、地点、公式、原理等关系的识记能力和联结能力。
选择题是由一个题干和几个选项所组成的试题,其功能是迷惑那些无法确定正确答案的考生,测量学生对问题的理解、再认、比较与辨别的能力,以及思维的敏捷性和准确的判断力。
填空题是提供一个留有空隙的不完整的陈述句子,要求考生将空缺的字、词、句填补下去。
主要功能是测量学生的记忆能力。
改错题是提供有错误的陈述句子,要求考生在句子错误部分的下面画线,并将正确答案写在线下面。
功能是测量学生的判断能力、记忆能力和理解能力。
名词解释题是提供重要的名词或概念,要求考生作出正确的解释。
功能是测量学生对一些重要术语、概念的掌握情况。
简答题是提供问题要求考生对考题作出简要回答,它常常由一个直接问句或不完全叙述句构成。
功能是测量考生对重要知识的记忆程度。
计算题是在试题中提供计算条件,提出计算要求,要求考生计算结果,有时还要求作出解答。
功能是测量考生解决问题思维能力以及运算技巧的掌握程度。
论述题是向考生提出较为复杂的问题,要求作出分析、说明、解释、论证,或作出结论,或提出自己的观点和见解。
功能是测量考生组织知识、表达思维和分析问题、解决问题的能力。
十一、多元智力理论的基本观点。
答:
美国哈佛大学心理学教授贾德纳的多元智力理论强调人类智慧至少应包括以下7种不同的智力
(1)言语智力;
(2)数理逻辑智力;(3)空间智力;(4)音乐智力;(5)体能智力;
(6)人际智力;(7)自知智力。
贾德纳认为,传统的智力测验只是测试了言语智力和数理逻辑智力,忽视了其他的智力。
在
贾德纳的观念中,上述7种智力在人们的实际生活中是同等重要的,并无主次之分。
他还指出,由于时代的不同和文化上的差异,这7种智力在人们心目中的重要性是常有转移的。
十三、教育信息的特点和收集方法。
答:
特点:
(1)准确性
(2)可靠性(3)时限性。
方法:
(1)观察法
(2)听汇报(3)调查访问(4)座谈会(5)收集文字资料(6)发问卷(7)测试
【篇二:
测量正确度评价】
测量正确度评价
南通大学附属医院王惠民
测量正确度(measurementtrueness)简称正确度,指无穷多次重复测量所得值的平均值与一个参考值间的一致程度[1]。
正确度不是一个量,是个抽象概念,不能用数值表示,因为在实际工作中对同一被测对象不可能进行无穷次测量。
正确度与系统误差有关,与随机误差无关。
只可说正确度“好”或“差”,正确度的好差可用偏移来衡量,而偏移可用数量表示。
“测量正确度”不等同于“测量准确度”。
测量偏移(measurementbias)简称偏移,有的文献称为偏倚,指系统测量误差的估计值。
常通过将测量结果的平均值减去参考值(如有证参考物质的值)获得,偏移可为正数或负数。
可计算绝对偏移,也可计算相对偏移。
正确度是方法学评价的重要内容。
一、正确度评价的内容
正确度评价实际上就是进行实验设计并计算偏移的过程。
可通过与一个参考值比较计算偏移,该参考值可来自于参考物质、室间质量评价(eqa/pt)的靶值、方法学比较试验、回收试验等。
正规的方法比较实验是将常规测量程序与参考测量程序(rmp)比较。
建立rmp对于临床实验室来说,是一件十分困难的事,因此大多数情况下不能直接与rmp比较,而只能与较好的方法或原有的方法进行比较。
clsiep9-a2《用患者标本进行方法比较试验及偏移评估》[2]和ep15-a2《精密度和正确度性能的用户验证》[3]都介绍了用方法比较试验进行正确度评价,其主要差别是,前者要求的实验次数较多,每天测8个标本,5天完成,共测定40份标本;后者测定20份标本,可在1天内完成。
前者对数据进行严格的统计处理,而后者的计算较为简便。
因此,ep9-a2更适用于方法学的正确度确认,而ep15-a2仅适用于方法学验证。
clsiep10-a3《临床实验室定量检测方法的初步评价》[4]是同时评价精密度、正确度、线性、携带污染率的方法,是一种更简易评价正确度的方法。
二、正确度的判断
正确度的性能是通过偏移来进行判断的,对正确度性能进行评价也是通过实验确定偏移的大小,再根据相关原则进行判断。
测量程序的正确度是否可接受主要依据以下几种方法进
1
行判断:
①与实验室自定标准比较;②利用效能函数判断;③与国家标准比较;④与clia’88推荐的允许总误差比较;⑤与厂家声明的偏移比较;⑥通过方法性能决定图判断。
以往有作者在进行方法学比较时,用统计学处理方法如配对t检验、相关系数(r)分析,但统计学差异显著的,并不表示该试验方法在临床上不被接受,反之亦然。
t检验和相关系数不能用来进行正确度的判断。
1.与实验室自定标准比较
2.利用效能函数判断
en=
x1-x2+u
2
1
22
3.与国家卫生标准的要求比较
卫生部于2012年中华人民共和国卫生行业标准ws/t403-2012《临床生物化学检验常规项目分析质量指标》[7],规定了允许偏移的标准。
表1国家卫生标准允许偏移(%)
2
4.与clia’88的要求比较
与clia’88的允许总误差(tea)要求比较,一般偏移1/2tea时,被认为属于可接受水平。
5.与厂家声明的偏移比较
如实验室得到的偏移小于厂家声明的,表明该方法可在临床应用;如大于厂家声明的,则需进行统计学处理后再进行比较,如ep15-a2评价方案。
6.通过方法性能决定图判断
(1)方法性能决定图的意义
精密度和正确度是方法性能中最重要的指标。
应用westgard方法决定图,根据试验方法的偏移和不精密度找出其在方法决定图上的位置,用以判别方法性能。
方法决定图是以tea
为判断标准的一种方法,一般有四种判断标准:
①偏移+2s,即bias+2stea;②偏移+3s,即+3stea;③偏移+4s,即+4stea;④偏移+6s,即+6stea。
(2)方法性能决定图的使用
①若试验方法性能位于+2s线以外,属不可接受性能,该方法不能在临床应用;②方法性能点在+2s和+3s区域内被认为方法性能差;③方法性能点处于,方法性能属临界,该方法在实+3s和+4s线的区域(包括在+4s线上的)
际使用中需要进行严格的质量控制;④方法性能点越接近左下方,其方法性能越好,若方法性能点处于+6s以内,其方法性能已达到世界顶级水平(worldclassperformance),这样的方法很容易管理和控制。
3
图1方法性能决定图
(3)应用示例
某测定白蛋白的方法,测定值35g/l处的cv为1.8%,偏移为0.2%;clia’88的质量要求是10%;x取1.8%,y为0.2%,即图中的“1”点,如图2所示。
因此它在方法性能决定图上的性能点位置清楚说明方法的性能属于优秀。
图2方法性能决定图应用示例
三、与参考物质比较计算偏移1.常规方法
将有证参考物质连续测量3~5天,每天测量3~5次,直接计算偏移的绝对值或相对偏移。
用常规方法对标准物质连续进行5天测定,每天测定5次,获得如表2结果。
表2常规方法测定肌酐标准物质结果(mmol/l)测定序次第1天第2天第3天第4天第5天
1
2345
140140140141140
138139138137139
143144144145143
143143142143142
142143141142143
4
b=x-xcrm=141.4-142.1=-0.7(mmol/l)
b%=b/xcrm=-0.7/142.1=-0.49%
2.clsiep15-a2方法
连续测量5天,每天测量2次,每天尽量由不同的操作者进行操作。
根据可信限,计算出偏移的允许区间。
例2:
40mg/dl的血糖参考物质,试剂的来源及批号为mk243,校准品为rnc59lw。
测量结果及计算见表3。
表3血糖参考物质的测量结果及计算
(1)计算均值
x=
∑x
i
n
i
n
=
(x1+x2+x3+x4+x5+x6+x7+x8+x9+x10)
10
=
377
=37.7mg/dl10
(2)计算标准误
5
【篇三:
测量、测试与评价】
我们在工作中经常用到“测试”、“测量”、“考试”、“测验”、“评价”等术语或说法。
它们之间既有联系,又有区别,不能混为一谈。
1.测量
什么是测量?
stevens(195)认为,“广义而言,测量(measurement)就是根据法则赋予事物数量。
”也就是说,按照一定的规则给事物的属性指派数字或符号的过程就是测量。
这是迄今为止公认的测量定义。
举例来讲,要测量一下桌子的高度,我们可以拿尺子来量一量,看看它有多高。
尺子是人们根据一定的法则制定的量具,利用它就可以把事物的属性,即桌子的高度用数字表示出来,如,0.75米。
这种测量属于客观测量,因为它基本上不受观察者的主观判断的影响。
由此可以看出,测量这一定义包含三个要素:
①事物及其属性
这是测量的对象或目标。
上面提到的对桌子的高度进行测量,属于对物体进行测量,其属性——高度,是可以观察到的,可以进行客观测量的。
在外语教学领域,我们感兴趣的是学生的语言能力,而学生的语言能力属于人的心理特征,是无法直接测量的,但是人的心理活动会在人的具体活动和行为中体现出来,所以只能通过测量其外显行为或外在表现特征来推论一个学生语言能力的高低。
②指派数字或符号
所谓指派数字或符号,就是用数字或符号来代表某一事物或事物的某一属性的量。
如张三在本次阅读考试中得了87分,李四得了92分,我们说李四比张三多考了5分。
数字本身没有意义,只是一种符号。
我们用它来代表考生的阅读成绩,这时它就变成了量化的数,可以对其进行解释和分析。
在一定的条件下,还可以对数据进行运算从而对事物的属性进行推测。
③法则
法则是指测量所依据的规则和方法,是测量的关键。
法则不好或不可靠,得到的测量结果就会出偏差,失去测量的意义。
简单来说,尺子不准,测量的结果就无法使人信服。
对客观世界的物体进行测量时,由于有