教育测量.ppt - 冰豆网

资源描述

教育测量.ppt

《教育测量.ppt》由会员分享，可在线阅读，更多相关《教育测量.ppt（44页珍藏版）》请在冰豆网上搜索。

教育测量.ppt

如何进行教育测量华东师范大学教育学系陶保平教育测量n测量法是采用测验或量表的形式，对教育领域内的事物或现象作数量化描述的一种调查方法。

在教育研究过程中测量已成为不可缺少的一种研究方法。

另外，测量本身也是一种评价的方式，当我们要对学生的学习结果进行评定，了解教学目标与学习成果相符合的程度，了解教学方法是否符合学生身心发展状态，就需要测量。

测量调查的含义n测量调查法是采用测验或量表的形式，对教育领域内的事物或现象作数量化描述的一种调查方法。

n“偏见”可以测量吗?

n将一个抽象的术语，转换成具体可测量的指标，有以下几个步骤：

概念化抽象性定义操作性定义具体测量指标测量的定义n所谓测量就是按规则给对象或事件赋值。

通俗地说，就是根据一定的规则，给事物分派数字。

1、2、3、4、5这些数字本身是没有数量或质量意义的，只是个符号。

当我们规定1代表学业成绩的最低等级“不及格”；2代表“及格”；3代表“中等”；4代表“良好”；5代表“优秀”，这时1、2、3、4、5才具有实际意义，数字按规则被赋予了意义。

测量的要素

（1）测量客体。

指测量的对象。

测量的客体可以是人，也可以是教育研究中的事物或现象。

（2）测量内容。

指测量客体的属性和特征。

测量内容可以是外显的，如学生的性别、年龄、身高、体重等，也可以是内隐的，如学习兴趣、动机、态度、价值观等。

（3）测量规则。

指测量的法则或方法。

也就是说，要构建一套如何分派数字或符号的准则，按准则对测量内容进行规范化、标准化的操作。

（4）测量工具。

指测量的指标体系。

没有工具，测量难以进行。

测量调查的优点1、科学性较强，测验量表的编制过程客观、严谨，效果准确可靠，测验结果直观形象。

2、标准化程度较高，施测、计分、评价等均有统一标准，容易控制，便于操作。

3、定量化水平较高，测量所获得的均为客观的数据资料，便于记录和分析和计算机处理。

4、能直接进行对比研究，标准化测验一般都有常模，只需将所测得的数据资料直接与常模比较，便可知差异。

5、经济实用，省时省力，研究者只需根据研究需要直接选择合适的测验量表施测即可。

测量法的缺点和不足1、测验编制难度较大，费时费力。

测验编制专业化程度高，非专门机构、专业人员不能胜任。

2、教育测验通常是间接测验。

测量涉及的心理、智力、能力、知识、技能、性格等因素难以直接测量，因此测量的结果往往是相对的。

3、难以进行整体定性的分析。

结果采用定量分析，结果多在静止的表面水平上描述和解释。

4、测验研究灵活性较差。

测验量表题目内容固定，无法根据研究的实际需要增删内容。

5、测验研究对研究者要求较高。

要具有专业知识，了解测验的有关情况，熟悉测验的技能等。

什么是量表n测量需要有测量的工具，测量的工具应具有单位和参照点，并且有表示量数的方法，我们把这种工具称之为量表。

n如，尺是度量长度的量表，血压计是测量血压高低的量表，智力测验是测量智商高低的量表。

量表的四种不同水平n类别量表（nominalscale）、n顺序量表（ordinalscale）、n等距量表（intervalscale）、n等比量表（ratioscale）。

类别量表（称名量表）是根据事物的某一特点，对事物属性进行分类，用名称或数字来代表事物或性质，是给事物进行简单归类的一种量表形式。

如运动员的号码，学生的学号等。

又如，对于性别，我们可以用数字1表示男生，用数字0表示女生，在这里1和0只是代表事物的性质，只是起到给事物分类的作用，数字本身并不具有数量意义，没有大小、高低、优劣之分，只是为了给对象分类，采用数字来代表罢了。

顺序量表（等级量表）n只有等级顺序而无等距的单位和绝对零点，只是按研究对象的某一种属性的顺序排列出等第次序。

如根据学生的测验成绩排出名次，成绩最好的为1，成绩次之为2，再次之为3，依次类推。

又如，对于生活水平，我们可以给出四个等级：

贫困；温饱、小康、富裕。

等距量表（间距量表）n是具有相等的单位，但没有绝对零点的量表。

等距量表的数量单位之间的间距是相等的。

如，温度摄氏30度至32度与摄氏18度至20度的温差是相等的，都是相差2度。

三个儿童在智商测验中分别得分105、110、115，在智商测验分数体系中，分数差距是相等的。

等距量表在学校教育系统运用广泛，一般将百分制评分看作等距量表。

等比量表（比率量表）除了具有类别、顺序、等距量表的特征外，还有一个具有实际意义的绝对零点。

零点是指测量的起点或参照点。

有些零点是人定的，称相对零点，如摄氏零度，这里零度并不意味着没有一点温度，而是以人定的冰点为参照标准。

像学生的考试成绩、智商的0分都是相对零点。

有些零点具有实际意义，称绝对零点。

如年龄、身高、经费开支等都有绝对零点，0岁、0米、0元中的“零”都表示真实的“无”，表示一点都没有。

智力测验n测被试的智力高低，其结果常以智商（IQ）来表示，此类测验比较多，其中比较著名的有：

斯坦福比纳智力测验、韦克斯勒儿童智力测验量表（WISC-CR）、瑞文推理测验等。

能力倾向测验n测被试潜在的某种能力，以了解其发展的可能性，预测个人能力发展倾向。

如音乐、美术、体育、创造力、想象力、记忆力等方面的能力倾向测验。

成就测验n测被试经某种形式的学习或训练后对知识、技能的掌握程度或熟练水平。

如识字量、阅读、算术测验等，成就测验可以是学科成就测验或综合成就测验。

人格测验n测被试的需要、动机、兴趣、态度、气质、性格、人际关系等人格心理特征，较为著名的有明尼苏达多相个性测验（MMPI）、艾森克人格问卷（EPQ-R）卡特尔16项人格因素测验（16PF）等。

个别测验n指主试与被试一对一进行的测验。

个别测验的可靠性比较高，主试能有效地观察控制被试的行为反应，但个别测验费时费力，短时间内难以获得大量的资料，并且对主试的要求较高。

团体测验n指一个主试能同时对许多被试进行的测验。

团体测验节省人力与时间，在短时间内能收集到大量的资料，效率较高，但被试的反应不容易控制，并且测验效果不及个别测验可靠。

语言文字测验n指测验内容是以语言、文字形式构成，被试要用语言、文字作答，主要为纸笔测验。

语言、文字测验实施比较容易，在学校系统广泛应用，适宜于进行团体测验，但它易受被试的教育程度和不同文化背景的影响。

非语言文字测验n操作测验，它是以图形、模型、实物、工具等作为测试材料，被试需要动手操作才能完成的测验。

由于被试不需要用文字作答，因而特别适合文字表达有困难的被试，适合于不同文化背景的比较研究。

比较著名的测验有：

瑞文标准推理能力测验、画人测验等。

常模参照测验n常模参照测验是一种衡量被试相对水平的测验，是将被试的测验成绩与同类对象在同一测验上的平均分（常模）相比较，从而解释分数，确定被试在总体中的相对位置的测验方法。

常模参照测验要有常模对照表。

常模有地区性常模和全国性常模，地区性常模只适用于特定的区域，如在城市获得的常模就不一定适用于农村或边远地区，而全国性常模适用于全国所有的同类个体。

如，儿童的身高、体重就有全国性常模，中国儿童发展量表（3-6岁）就有全国性常模。

只要我们将个体实际测量的数据与常模一对照，就可以知道个体所处的地位。

目标参照测验n又称标准参照测验，是衡量被试实际水平的测验，将被试在测验上的分数与事先制定好的某种标准进行比较，看被试是否达到了目标规定的要求。

目标参照测验的特点是依据标准，判断被试的达标程度，而不是将被试的成绩与他人成绩做比较。

如，英语水平测试、毕业考试、动作技能测试、体育达标测试等。

标准化测验n由专家学者或专门机构采用系统的科学程序编制的、在测验实施过程、评分手续、分数的解释上具有统一标准的，并对测验误差做了严格控制的测验。

n编制和施测有一套标准程序。

测验编制包括确定测验目的、科学命题、选取有代表性的样本进行试测；根据数量化指标筛选测验题目；鉴定整个测验的信度和效度；建立常模、确定指导语、时限和施测条件；规定评分标准、分数转换和解释方法等。

标准化测验所获得的测量结果比较客观、可靠、应用范围较广，一般测量调查应尽可能选用标准化的测验工具。

非标准化测验n指测验的编制和实施不按标准程序进行的测验，通常由教师或研究人员自编的、为临时测验所用的简单测验。

如课堂测验、考试、等级评定量表等。

这些测验是教师根据教学目标和自己的教学经验编制而成，它通常与日常教学工作紧密联系；测验内容与教材内容、教学进度一致；难易程度由教师把握；针对性较强。

n编制省时、省力、灵活、方便。

不足之处在于测验的客观性和标准化程度不如标准化测验，测验的实施和记分也不甚严格。

测验编制的步骤：

1、确定测验目标（测什么、测验目的等）；2、拟定编题计划（怎么测、具体项目等）；3、编制测验题目（题目数量、形式、时间安排、分数分配、复本等）；4、试测和项目分析（样本、题目的难度、区分度、被试的反应等）；5、修订、筛选测验题目（施测程序、指导语、时限、计分标准等）；6、组成正式测验（建立常模、测验手册等）；7、检验测验的可靠性和有效性（建立测验的信度、效度等）。

衡量测验工具性能的标准n客观性-指测量的科学化程度，测试结果真实可靠，能准确反映被测对象的真实情况，能达到测量的目的。

有些测验客观性较低，实施条件和评分都比较灵活，主试比较容易产生偏见。

如果测验的评分标准统一，测验的客观性就好些。

一个好的测验应对所有被测对象是客观公正的，同时在操作上简便易行。

标准化n好的测验工具应具有标准化的实施程序和评分系统，因为这些能增加测验的客观性。

如果一个测验能保证实施和评分的一致性，那么这就是一个标准化测验。

标准化测验的优势就是研究结果可以重复，可以验证。

常模n常模是解释测验分数的参照系。

有了常模，测验分数就可以比较、解释，可以了解发展变化情况。

一般回答以下问题：

被测者的测验成绩与其他学生的测验成绩相比情况如何？

被测者的测验成绩在团体中的相对位置如何？

选择测验工具，最好能有年级常模或年龄常模，百分等级常模和标准分数常模（T量表）。

效度n测验的有效程度，是指测验结果的正确性或准确性。

也就是测验分数能正确反映测量想要得到的内容和特征。

如果一个测验能真实地测出所要测量的特性，这个测验或量表就是有效的。

n比如，用尺来测量一个人的体重就是无效的。

原想测量学生的英语语法知识，但实际测验考察的是英语词汇知识，这样的测量有效性就值得怀疑。

信度n测验结果的可信程度，是指测验结果的稳定性或一致性。

从被试来说，在同一测验的多次测试中能获得相似的分数；从主试来说，不同的测量人员能给出相似的分数。

如，测量一个物体的长度，用标准的钢尺去测量肯定要比用有伸缩性的一根绳去测量可信程度要高。

因为用钢尺测量的结果更接近物体的实际长度，每次测量的结果基本一致。

而用绳子测量，因其有弹性，每次测量的结果会有出入，与物体的实际长度会有较大差异。

一个测验的信度可以通过重测信度、复本信度、评分者信度进行考察。

怎样进行测量n1、选择合适的测验工具n2、按标准化测验的要求施测n3、客观准确地记录被试的反应n4、合理解释测验结果n5、测量调查的注意事项标准化测验工具举例n瑞文标准推理测验n小学生识字量题库及评价量表

展开阅读全文