测量Word下载.docx

上传人:b****6 文档编号:21880332 上传时间:2023-02-01 格式:DOCX 页数:63 大小:222.58KB
下载 相关 举报
测量Word下载.docx_第1页
第1页 / 共63页
测量Word下载.docx_第2页
第2页 / 共63页
测量Word下载.docx_第3页
第3页 / 共63页
测量Word下载.docx_第4页
第4页 / 共63页
测量Word下载.docx_第5页
第5页 / 共63页
点击查看更多>>
下载资源
资源描述

测量Word下载.docx

《测量Word下载.docx》由会员分享,可在线阅读,更多相关《测量Word下载.docx(63页珍藏版)》请在冰豆网上搜索。

测量Word下载.docx

1.主观经验性考试阶段(1864年以前)

2.客观标准化测验阶段(1864年——1940年)

3.客观测验的深入发展阶段(1940年——)

4.西方心理测量的发展

5.心理测验在我国的发展

(五)心理测量的道德准则

1.心理测量工作者的素质要求

(1)心理测量工作的知识结构.

(2)对心理测量的态度

2.心理测量工作者的道德准则

(1)测验的保密和控制原则

(2)测验中个人隐私的保护

考核要求:

1.心理测量的种类

2.测量与测验(Test)、考试(Examination)、评价(Evaluation)联系与区别

3.测量的要素及量表类型

单位,参照点,量表,称名量表,顺序变量,等距变量,比率变量

4.心理测量的本质、基本条件及功能

5.心理测量发展简史

第二章经典测验理论的基本假设

教学要点:

通过本章的学习,掌握经典测验理论的基本假设,心里特之及其特性,心里测量的误差和种类,以及真分数的含义等内容。

[6学时]

教学内容:

一、心理特质(Trait)及其可测性假设

1.经典测验(ClassicalTestTheory,CTT)理论

2.特质假设

二、测量误差及其来源

1.测量误差的含义

2.误差种类

随机误差,系统误差

3.误差来源

(1)来自心理测量工具,

(2)来自测量对象,(3)来自实测过程

(二)真分数模型及其假设

1.真分数的含义

2.真分数数学模型解析

领会:

(1)几个推理,

(2)CTT的基本含义,(3)CTT的基本公式

3.经典测验理论的不足

1.心理特质(Trait)及其可测性假设

2.测量误差及其来源

3.真分数模型及其假设

4.经典测验理论的不足

第三章测验信度

通过本章的学习,掌握信度的意义,信度系数的计算,了解影响信度的主要因素以及提高信度的常用方法等内容。

[4学时]

一、信度的意义

1.信度指实测值和真值相差的程度

2.信度指统计量与参数之间的接近程度

3.信度是指一种测验对相同的应试者再次测验时引起同样反应的程度

二、信度系数的计算

1.稳定性系数

2.等值性系数

3.等值稳定性系数

4.内部一致性系数

5.评分者的信度系数

三、提高测验信度的方法

1.信度系数以多大为宜

2.影响信度的因素

3.提高测验信度的方法

考核要求:

1.信度的意义

2.信度系数的计算

稳定性系数,等值性系数,等值稳定性系数,内部一致性系数,评分者的信度系数

3.提高测验信度的方法

请列举一些你所使用过或接触过的量表

思考:

量表的作用是什么?

你如何解释下述现象?

一个很聪明的孩子,测得智商是80分

一个学习很好的学生,考试成绩为60分

一个人缘很好的人,人际关系测量低于常模值

量表帮助我们了解心理现象(心理特质),就像尺子帮助我们测量身高。

我们如何知道我们有多高?

有两个工具:

尺子/秤

尺子的数据与我们的目测更一致,而秤盘的数据则与我们的目测不一致。

因此,尺子是测量身高的有效工具——效度。

什么材料的尺子?

——钢铁(热胀冷缩)

涉及到一致性的问题。

——信度

•物理不等于数学

•1.70与1.7的关系

•总结:

量表是我们用来了解心理特质的工具,但这个工具是有误差的。

误差要控制在一个许可的范围内。

•什么是误差?

•误差的种类?

•误差是在测量中与目的无关的变因所产生的不准确或不一致的效应。

•误差分为随机误差和系统误差。

•高尔顿的智力观

•比奈的智力观

•判断题、选择题和问答题

•SX2=ST2+SE2

ST2=SV2+SI2

SX2=SV2+SI2+SE2

ST2

SX2

 

•稳定性\可靠性\一致性

•信度乃是一个被测团体真分数的变异数与实得分数的变异数之比。

•rXX=ST2/SX2

•信度乃是一个被测团体真分数与实得分数的相关系数的平方。

•rXX=P2TX

•思考:

相关系数的平方?

•信度乃是一个测验X与它的任意一个平行测验X'的相关系数。

•rXX=PXX'

•重测信度(Test-RetestReliability)

•定义:

同一量表,同一被试群体,在不同时间,两次施测,求其相关。

•实质:

表示测验结果的稳定性。

故称之为稳定性系数(CoefficientofStability)

•形式:

施测—适当时间—再施测

•间隔时间越长,稳定性系数越低。

适宜时间间隔依照测验目的、性质及被试特点而定。

几分钟至几年。

•年幼儿童,间隔要小;

年长群体,间隔可大。

智力测验的间隔不能太短,成就测验的间隔不能太长。

•一般间隔时间不超过六个月。

(即不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘)

•在一般情况下,间隔施测的副本信度最低,因为很多因素有机会影响到分数。

相反,校正过的分半相关,因为影响的因素少,所得的信度估计为最高。

•实际上,有多少种误差来源,便有

•多少种估计信度的方法。

一个测验

•哪种误差大,便应该用哪种误差估

•计。

有时一个测验需要有几种信度

•系数,这样我们就把总分数的变异

•数分成不同的分支。

•假设对100个六年级学生以两个月的时间间隔先后施测一个创造力测验的A\B两个复本,所得的等值性与稳定性系数为0.70。

我们还根据

•被试对每个复本的反应计算出分半信度为0.80

•(先计算每个复本的分半相关系数。

将二者平

•均后再用斯皮尔曼-布朗公式校正)。

同时,

•我们让另一个评分者随机抽取50份卷子另外评

•分,得到评分者信度为0.92。

然后,我们对这

•三种方法所产生的误差变异进行分析。

一个假想测验的误差变异来源分析

信度类型

误差变异量

误差变异来源

复本信度(间隔施测)

1-0.70=0.30

时间与内容取样

分半信度

1-0.80=0.20

内容取样

上述二者差异

0.30-0.20=0.10

时间取样

评分者信度

1-0.92=0.08

评分者差异

误差变异总和

0.20+0.10+0.08=0.38

真实变异

1-0.38=0.62

误差变异

时间上的稳定性,复本之间的一致性,评分者之间的一致性

内容取样误差

时间取样误差

评分者间差异

62%

20%

10%

8%

第四章测验的效度

通过本章的学习,掌握效度的含义,效度估计方法,了解影响信度与效度的关系,影响效度的因素以及提高信度的几种方法等内容。

一、效度概述

1.效度的一般定义及其内涵

效度是指测验的准确性,即测验能够测出他们所欲测的特质的程度。

2.效度的统计与原理

3.效度的信度关系

(1)高效度,高信度

(2)高信度,低效度(3)低信度,低效度

二、效度的估计

1966年美国心理学会在《教育心理测验值标准》中将效度分为三大类:

1.内容效度(ContentValidity)

内容效度指测验实际测到的内容与所要测量的内容之间的吻合程度。

2.结构效度(ConstructValidity)

结构效度是指测验对于被称作构想的某一理论概念或特质测量的程度。

3.实证效度(CriterionrelatedValidity)

实证效度是指一个测验对处于特定情景中的个体的行为进行估计的有效性。

三、提高测量效度的方法

1.各种测量效度的要求

2.提高效度的方法

(1)控制系统误差,

(2)精心编制量表,(3)妥善组织测验,(4)扩充样本容量,(5)适当增加测验的长度

3.效度的一般定义及其内涵

4.效度的统计与原理

5.效度与信度的关系

四、效度的估计

五、提高测量效度的方法

1.效度的一般定义及其内涵

2.效度的统计与原理

3.效度与度的信度关系

4.效度的估计

内容效度,结构效度,实证效度

5.提高测量效度的方法

第五章测验的难度和区分度

通过本章的学习,掌握测验难度和区分度的含义,以及难度、区分度的计算,了解难度、区分度对测验质量的影响等内容。

[10学时]

一、测验难度的计算

1.计算难度的基本公式

(1)以试题通过率计算难度:

P=R/N,

(2)用平均数计算试题的难度

2.用极端分组法计算难度

二、难度的转换

难度转换的方法

三、测验题目难度水平的确定

四、区分度的定义

1.定义:

区分度是指测验对于考生实际水平的区分度程度或鉴别能力。

2.区分度与测验信度、难度的关系

五、区分度计算

1.用极端分组法计算

(1)客观题计算,

(2)论文题计算

2.用内部一致性系数(InternalConsistency)计算区分度

(1)用点二列相关计算区分度

(2)用二列相关计算区分度

(3)用Φ相关计算区分度

(4)用四分相关计算区分度

(5)用皮尔逊相关法计算区分度

(6)D(鉴别指数)的经验标准

1.测验难度的计算

2.计算难度的基本公式

3.难度的转换

4.测验题目难度水平的确定

5.区分度的含义

6.区分度与测验信度、难度的关系

7.区分度计算

用极端分组法计算,用内部一致性系数(InternalConsistency)计算区分度

第二编测量的一般步骤和方法

第六章测验的编制与实施

通过本章的学习,掌握编制测验的基本程序,测验的实施过程及须注意的事项等内容。

教学时数:

第一节编制心理与教育测验的基本程序

一、确定测验的目的

1.明确测量对象

2.明确测量目标

3.明确测量用途

二、制定编题计划

三、编辑测验项目

1.收集测验资料

2.选择项目形式

3.编写测验项目

四、测验与项目分析

1.预测

2.项目分析

五、合成测验

1.测验项目的选择

2.测验项目的编排

3.编制副本

六、测验标准化

1.测验内容

2.实测过程

3.测验评分

4.测验分数解释

七、鉴定测验

1.信度

2.效度

3.测验量表与常模

八、编写测验说明书

第二节测验的实施

一、测验的实施过程

1.实测前的准备工作

2.指导语

3.测验情境

4.测验焦虑

5.与受测者建立良好的协调关系

6.评分技术

二、测验分数的解释

1.如何看待测验分数的意义

2.如何向受测者报告测验分数

1.编制测验的基本程序

确定测验的目的,制定编题计划,编辑测验项目,测验与项目分析,合成测验,测验标准化,鉴定测验,编写测验说明书

2.测验的实施过程及须注意的事项等内容

3.测验分数的解释

第七章测验分数的解释与应用

通过本章的学习,掌握测验分数的类型,常模及常模类型,以及测验分数的解释和常模的应用等内容。

一、分数与常模

1.分数的种类和含义

(1)原始分数,

(2)导出分数

2.常模

3.年龄常模

4.年级常模

5.百分等级常模

6.标准分数常模

二、测验的等值

1.测验等值的实质

2.测验等值的条件

(1)同质性,

(2)等信度,(3)公平性,(4)可递推性,(5)对称性,(6)样本不变性

3.测验等值的基本算法

(1)百分位等值

(2)线性等值

4.常用等值设计

5.测验等值误差估计

1.分数

原始分数,导出分数

2.常模

年龄常模,年级常模,百分等级常模,标准分数常模

3.测验的等值的实质与条件

4.测验等值的基本算法:

百分位等值,线性等值

第八章测验的项目分析

项目分析包括定性分析和定量分析。

定性分析包括考虑内容效度、题目编写的恰当性和有效性等;

定量分析主要是指题目难度和区分度的测量。

对项目进行筛选和修订,可以提高测验的信度和效度。

第一节测验的难度

一、难度(difficulty)的意义

难度,指项目的难易程度。

在最高作为测验中,称为“难度”,而在典型作为测验中,则指“通俗性”。

两者都是指在总体中,能够正确或确切回答某项目的人数。

二、难度的计算

(一)二分法记分项目的难度

1.通过率

P=R/N

2.极端分组法(上下27%)

P=(PH+PL)/2

(二)非二分法记分项目的难度

P=X/Xmax

X为所有被试在该项目上的平均得分,Xmax为该项目的满分。

三、测验难度水平的确定

▪效标参照测验、掌握测验:

不考虑难度;

▪选拔测验:

难度=录取率;

▪ 

对于选择题来说,难度一般应大于猜测概率;

▪无论是速度测验,还是难度测验,一般都应防止被试得满分,因为满分的意义是不明确的。

大体而言,难度为0.50时最理想,此时项目具有最大的鉴别力。

但在实际操作中,让所有项目难度都到达0.50困难很大,而且也不必要,一般只需使项目的平均难度接近0.50,而各个项目的难度在0.50±

0.20之间变化。

四、难度的等距变换

根据正态分布表,将难度P作为正态曲线下的面积,转换成相应的Z分数,这就是等距量表。

PY

0Z

美国教育服务中心以Δ作为难度指标:

Δ=13+4Z

P=.0013Z=+3Δ=25

P=.16Z=+1Δ=17

P=.50Z=0Δ=13

P=.84Z=-1Δ=9

P=.9987Z=-3Δ=1

五、难度对测验的影响

(一)测验难度影响测验分数的分布形态

难度大,正偏态

▪难度低,负偏态

(二)测验难度影响测验分数的离散程度

测验过难或过易,分数全距缩小,信度降低。

P=0.50时最佳

第二节测验的区分度

一、区分度的意义

区分度(discrimination)是指测验项目对被试心理品质水平差异的区分能力或鉴别能力。

项目的区分度是测验是否有效的“指示器”。

二、区分度的计算

(一)项目鉴别指数法

1.鉴别指数(indexofdiscrimination,D)的计算

D=PH-PL

取值范围:

-1~+1

2.极端组的划分

27%规则

一般情况下,取上下25%~33%均可。

样本少时,可以取50%

注意:

由于计算机的方便使用,可以上下50%作为划分高低组的标准,或者多分几组,对区分度和难度作详细分析。

因为只取上下两端,只利用了一部分资料,浪费了很多信息,有可能得出错误结论。

(二)相关法(项目-总分相关)

1.点二列相关

Xp-Xq

rpb=√pq

St

2.二列相关

Xp-XqpqXp-Xtp

rb=•或rb=•

StySty

3.φ相关

ad-bc

rφ=

√(a+b)(c+d)(a+c)(b+d)

4.四分相关

5.项目和总分相关重叠的校正

当测验项目超过20个项目时,校正法通常毫无意义。

rtpSt–Sp

rpq=

√St2+Sp2–2rtpStSp

(三)项目特征曲线(itemcharacteristiccurve,ICC)

项目特征曲线描述了效标分数不同的被试在该项目上的通过率。

曲线坡度越陡,鉴别力越好,预测的误差越小。

三、区分度与难度的关系

难度和区分度都是针对一定团体而言的。

一般来说,较难的项目对高水平被试区分度高,较易的项目对低水平被试的区分度高。

四、区分度的相对性

(一)不同的计算方法,所得区分值不同

区分度有几种计算方法?

(二)样本容量大小影响相关法区分度值的大小

样本越大,区分度越……

(三)分组标准影响鉴别指数

分组越极端,区分度越……

(四)被试样本的同质性程度影响区分度值的大小

样本越同质,区分度越……

第三节项目分析的特殊问题

一、多重选择题的项目分析(诱答分析)

对于多重选择题,除了分析难度和区分度外,还要对每个选项进行分析。

下列哪一个最有可能是偏执型精神分裂症患者的次级症状:

A幻听

B瘫痪

C记忆丧失

D厌食

▪如果所有被试都选择某一正确的选项,说明该选项……

▪如果没有一个被试选择某个错误选项,说明该选项……

▪如果所有被试都选择某个错误选项,说明该选项……

▪如果高分组被试的选择集中在两个选项上,说明该选项……

▪如果高分组和低分组对正确选项的选择没有区别,说明该选项……

▪如果所有被试都未回答某个题目,说明该题……

▪如果选择各个选项的人数几乎相等,说明该题……

二、速度测验的项目分析

▪对前面部分的测验项目,难度和区分度都……

▪对后面部分的测验项目,难度和区分度都……

三、标准参照测验的项目分析

在标准参照测验中,无须考虑项目的难度和区分度,只要项目的内容很重要就行。

也可以通过比较教学或训练的前测和后测结果来进行项目分析,用来说明教学或训练的效果以及项目编制是否适当。

四、项目-团体的相互作用

具有不同性质(性别、种族、职业等)的团体,在测验得分上也存在差异,即同样的项目可能有不同的难度。

▪如果测验要求对所有个体都相对“公平”,那么,就应该排除那些有利于或不利于不同性质的亚团体的项目;

▪如果测验的目的就是为了考察不同亚团体的差异,那么,就应选择使团体差异尽可能大的题目。

五、有效性与可靠性的矛盾

o同质性信度要求项目之间有高相关,各项目的难度均等;

•对于预测效度来说,因为效标的变异范围较大,如果项目越同质,那么效标关联效度则低;

因此,效标关联效度要求各项目之间要有一定的差异,即项目之间相关低,这样才能保证测验得分与效标之间有高相关,即高的效标关联效度。

因此,对于多数心理测验来说,项目之间中等程度的相关,可使二者调和,获得较为满意的(同质性)信度和(效标关联)效度。

第九章学绩测验

第一节学绩测验概述

一、学绩测验的性质

最高作为测验可以分为:

学绩测验、能力测验、能力倾向测验。

学绩,指经过一定的教学或训练后所学到的东西,是在一个比较明确的、相对限定的范围内的学习结果。

能力倾向指学习的能力,是在给予适当的机会时获得某种知识或技能的能力。

能力介于学绩和能力倾向之间,指的是当前的知识或技能的水平,既有正式学习的,也有非正式学习的结果,既包括学术技能,又包括非学术技能。

学绩测验用来描述现状,指明一个人已经学会了什么和能做什么。

二、学绩测验的基本假设

1学绩测验所测量的知识和技术的范围能明确界定。

2测验所测量的是研究者认为重要的东西,而不是与测量目的无关的东西。

3被试有同样的机会学习测验所包含的材料。

三、学绩测验的分类

(一)按测验的编制方法分

教师自编课堂测验,标准化学绩测验

(二)按测验内容分

单科测验,多科测验

单元测验,总测验

(三)按测验的用途分

考察性测验,诊断性测验,准备性测验,选拔与安置测验,职业水平测验,用于研究的测验

(四)按测验评分的参照系分

常模参照性测验,目标参照性测验

(五)按测验的题型分

客观测验,论文式测验

四、学绩测验的应用

1反馈功能

2诊断功能

3辅助教学管理

4研究工具

5

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 党团工作 > 入党转正申请

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1