测量心理学.docx

资源描述

测量心理学.docx

《测量心理学.docx》由会员分享，可在线阅读，更多相关《测量心理学.docx（29页珍藏版）》请在冰豆网上搜索。

测量心理学.docx

测量心理学

第五章心理测量学知识

重点在于理解和掌握心理测量的定义、测验的常模、信度、效度以及项目分析等基本概念。

第一节概述

第一单元测量与测量量表

一、什么是测量

测量：

就是依据一定的法则用数字对事物加以确定。

①事物：

指的是要测量的事物的属性或特征。

该定义包括三个元素

②数字：

代表某一事物或事物某一属性的量。

③法则：

代表的是测量所依据的规则和方法。

二、测量要素：

①参照点②单位

（一）参照点：

参照点：

绝对参照点、相对参照点

（二）单位：

好的单位必须具备两个条件：

①一是有确定的意义②二是有相同的价值

心理测量的单位不够完善，如智力年龄以年龄为单位，～5 岁之间的差别大于 14～15 岁之间。

三、测量量表

·测量的本质是根据某一法则在一个定有单位和参照点的连续体上把事物的属性表现出来。

·量表是一个定有单位和参照点的连续体。

·斯蒂文斯，按从低级到高级划分的四种水平：

①命名量表——最低水平分两种：

代号（如学生编号）；类别（如 1 代表男，2 代表女）

不能做数量化分析，既不能比大小，也不能加减乘除

四种水平

②顺序量表——次低水平（短跑名次）心理测量是在顺序量表上进行

③等距量表——较高水平

（温度计），其数值可做加减，不能做乘除。

④等比量表——最高水平

第二单元：

心理测量的基本概念

一、心理测验的定义

■·所谓心理测验，就是依据心理学理论，使用一定的操作程序，通过观察人的少数有代表性的

行为，对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。

①测量的对象是人的做测验的行为

·从心理测验的定义看出

②选取的是行为样本

③测量要标准化

④测量的原始分数没有意义，要与其他人的分数相比较

二、■心理测验的性质：

①间接性 ②相对性 ③客观性

- 1 -

第三单元心理测验的分类

①按测验功能分类：

智力测验特殊能力测验人格测验

■

心理测验分类

②按测验的材料分类：

文字测验操作测验

③按测验材料的严谨程度分类：

客观测验投射测验

④按测验的方式分类：

个别测验团体测验

⑤按测验的要求分类：

最高行为测验典型行为测验

第四单元：

纠正错误的测验观

一、■错误的测验观：

①测验万能论 ②测验无用论③心理测验即智力测验

二、正确的测验观：

①心理测验是重要的心理学研究方法之一，是决策的辅助工具（例如，升学指导测验）

②心理测验作为研究方法和测量工具尚不完善

第五单元心理测验在心理咨询中的应用

■较多地使用以下三类测验：

①智力测验 ②人格测验 ③心理评定量表

第六单元心理测验的发展史

一、科学心理测验的产生与发展

①高尔顿（F.Galton）19 世纪 80 年代（达尔文的表弟）

三个重要人物

②卡特尔（J.M.Cattell） 19 世纪 90 年代

③比内（A.Binet） 20 世纪头十年

①操作测验的发展

20 世纪心理测验的主要发展

二、现代心理测验在我国的发展

②团体智力测验的发展（诞生于美国）

③能力倾向测验的发展

④人格测验的发展

·源于 1914 年前后。

·20 世纪二、三十年代两次修订比内-西蒙量表。

·1979 年后，协作修订国外智力和人格测验工具。

·近年来致力于编制适合我国文化背景的测验工具。

- 2 -

第二节测验的常模

第一单元：

常模团体

一、常模团体的性质

■常模团体是由具有某种共同特征的人所组成的一个群体，或者是该群体的一个样本。

它用一个标准的、规范的分数表示出来，以提供比较的基础。

■确定常模团体时，先确定一般总体，再确定目标总体，最后确定样本。

①群体的构成必须明确界定

二、常模团体的条件

②常模团体必须是所测群体的代表性样本

③样本的大小要适当

④标准化样组是一定时空的产物

■③样本的大小要适当：

·如果总体数目小，只有几十个人，则需要 100%样本；如果总体数目大，相应样本也大。

一般不小于 30 或 100 个，全国性常模，一般应有 2000—3000 人为宜。

·样本大小适当的关键是样本要有代表性

三、取样的方法取样即：

从目标人群中选择有代表性的样本。

■（多选）

取样方法：

①简单随机抽样

■②系统抽样（又叫等距抽样）首先计算组距：

K＝N/n

③分组抽样

④分层抽样两种方法：

分层比例抽样、分层非比例抽样

四、常模分数与常模

（一）常模

常模：

是一种供比较的标准量数，由标准化样本测试结果计算而来，它是心理测验时用于比

较和解释测验结果的参照分数标准。

■按照样本的大小和来源：

全国常模、区域常模和特殊常模。

■根据具体应用标准和分数特征：

百分位常模和标准分常模等。

（二）常模分数（也叫导出分数，又叫标准分数，也叫量表分）

·常模分数：

就是施测常模样本后，将受测者的原始分数按照一定规则转换出来的导出分数。

·导出分数具有一定的参照点和单位，它实际上是一个有意义的测验量表，它与原始分数

等值，可以进行比较。

·从原始分数转换为导出分数时，既要根据原始分数的分布特点，又要按照现代统计方法的

基本原理，才能转换出等单位、带参照点的有意义的导出分数。

- 3 -

第二单元：

■常模的类型（很重要）

常模的类型有：

①发展常模 ②百分位常模 ③标准分常模 ④智商及其意义

①发展顺序量表

一、发展常模（也叫年龄量表）

②智力年龄（简称智龄）比内—西蒙

③年级当量（又叫年级量表）

①百分等级指在常模样本中低于这个分数的人数百分比

②百分点是百分点也称百分位数，与百分等级的计算方法正好相反。

百分等级是

二、■百分位常模计算低于某测验分数的人数百分比，而百分点则是计算处于某一百分比

例的人对应的测验分数是多少

③四分位数和十分位数

–·百分位数是将量表分成 100 份，而四分位数是将量表分成四等份，相当于

–百分等级的 25%、50%和 75%对应的三个百分分成的四段。

十分位数也可

–以依此类推出，1%～10%为第一段，91%～100%为第十段。

三、■标准分常模（必考）

·标准分数是将原始分数与平均数的距离以标准差为单位表示出来的量表。

因为它的基本单位是标准差，所以叫标准分数。

·标准分常模分两类：

①线性转换的标准分数 ②非线性转换的标准分数

（一）线性转换的标准分数

z =

X - X

Z=A+BZ

·T 分数：

平均数为 50，标准差为 10

·标准九分：

平均数为 5，标准差为 2

·标准十分：

平均数为 5.5，标准差为 1.5；

·标准二十分：

平均数为 10，标准差为 3。

·离差智商：

平均数为 100，标准差为 15

（二）非线性转换的标准分数

·当原始分数不是常态分布时，也可以通过非线性转换使之常态化。

常态化过程主要是

将原始分数转化为百分等级，再将百分等级转化为常态分布上相应的标准分数。

■·计算步骤如下：

①对每个原始分数值计算累积百分比；（二级多选）

–②在常态曲线面积表中，求出对于该百分比的标准 z 分数。

- 4 -

四、智商及其意义

·比率智商（只适合年轻人测试）（斯坦福大学推孟教授修订提出）

IQ =⨯ 100

·离差智商（韦克斯勒提出）

IQ = 100 + 15 （ X - X ）

·必须指出，从不同测验获得的离差智商只有当标准差相同或接近时才可以比较，

标准差不同，其分数的意义便不同（见附表）。

P367

注意事项：

①发展常模换算及解释时需要注意的问题

–只适合于所测特质随年龄发生变化的情况，对成人不适用；

–只适用于在典型环境下成长的儿童；

–一年的差异在不同年龄有不同的含义。

②百分位常模换算及解释时需要注意的问题

–属于顺序量表，缺少相等单位；

–靠近中央的原始分数差异扩大，而两极端的差异缩减；

–不能比较和说明不同被试间分数差异的数量。

③标准分常模换算及解释时需要注意的问题

–计算非线性转换的标准分数时，特质的分数实际上应该是常态分布；

–标准差不同，其分数的意义不同。

第三单元常模分数的表示方法

■①转换表法：

（特点：

简明）（转换表也叫常模表）

–也叫常模表。

一个转换表显示出一个特定的标准化样组的原始分数与其相对应的等值

分数——百分位、标准分数、T 分数或者其它任何分数。

因此测验的使用者利用转换

表可将原始分数转换为与其对应的导出分数，从而对测验的分数作出有意义的解释。

②剖面图法：

（特点：

直观）

–剖面图是将测验分数的转换关系用图形表示出来。

从剖面图上可以很直观地看出被试

在各个分测验上的表现及其相对的位置。

- 5 -

第三节：

测验的信度

第一单元：

信度的测验

一、信度的定义

■·信度是指同一受测者在不同时间内用同一测验（或用另一套相等的测验）重复测量，

所得结果的一致程度。

■·信度只受随机误差的影响，随机误差越大，信度越低。

因此，信度亦可视为测验结果受机遇

影响的程度。

系统误差产生恒定效应，不影响信度。

（八两秤系统误差）

二、信度的指标

（一）信度系数与信度指数

·通常情况下，信度是以信度系数为指标，它是一种相关系数。

常常是同一受测者样本所得的

两组资料的相关。

■·信度指数的平方就是信度系数。

（二）测量标准误

■·测量误差分布的标准差，（也叫）即为测量的标准误。

SE = Sx 1 - r

■ ·信度越高，标准误越小；信度越低，标准误越大。

■ ·心理测量信度也叫心理测验的信度·

■ ·心理测量信度是效度的必要而非充分条件，效度受信度的制约。

■ ·没有信度就一定没有效度，有信度不一定有效度

第二单元：

信度评估的方法

信度评估的方法：

①重测信度 ②复本信度 ③内部一致性信度 ④评分者信度

信度的类型与估计方法

一、■重测信度（test-retest reliability）

■·又称稳定性系数。

它的计算方法是采用重测法，即使用同一测验，在同样条件下

对同一组受测者前后施测两次测验，求两次得分间的相关系数。

∑

（ X 1 - X 1 ）（ X 2 - X 2 ）

N · S · S

1 2

■·最适宜的时距随测验的目的、性质和受测者特点而异，一般是两周到四周较宜，

间隔时间最长不超过六个月。

- 6 -

二、复本信度（alternate-form reliability）

·又称等值性系数，它是以两个等值但题目不同的测验（复本）来测量同一群体，然后求得

受测者在两个测验上得分的相关系数，这个相关系数就代表了复本信度的高低。

■·如果两个复本的施测相隔一段时间，则称重测复本信度或稳定与等值系数。

·在计算复本信度时，应该有半数的受测者先作 A 本再作 B 本，另一半受测者先作 B 本

再作 A 本，由此可以抵消施测顺序的效应。

三、内部一致性信度（internal consistency reliability）

①分半信度（split-half reliability）

·是在测验实施后将测验按奇、偶数分为等值的两半，并分别计算每位受测者在两半测验上

的得分，求出这两半分数的相关系数。

·分半法经常会低估信度，必须修正，借以估计整个测验的信度。

②同质性信度（homogeneity reliability）

·同质性主要代表测验内部所有题目间的一致性。

当各个测题的得分有较高的正相关时，不论

题目的内容和形式如何，则测验为同质的。

相反，即使所有题目看起来好象测量同一特质，

但相关很低或为负相关时，则测验为异质的。

四、评分者信度（scorer reliability）

·随机抽取若干份测验卷，由两位评分者按评分标准分别给分，然后再根据每份测验卷的两个

分数计算相关，即得评分者信度。

·一般要求在成对的受过训练的评分者之间平均一致性达 0.90 以上，才认为评分是客观的。

·当多个评分者评定多个对象，并以等级法记分时，可采用肯德尔和谐系数作为评分者信度的估计。

K 2 （ N 3 - N ）

2 i

第三单元：

信度与测验分数的解释

①解释真实分数与实得分数的相关②确定信度可以接受的水平

③解释个人分数的意义④比较不同测验分数的差异

一、解释真实分数与实得分数的相关

信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的，

也就是测验的总变异中真分数造成的变异占百分之几。

- 7 -

二、确定信度可以接受的水平

■当 rxx<0.70 时，测验不能用于对个人作出评价或预测，而且不能作团体比较；当 0.70≤

rxx<0.85 时，可用于团体比较；当 rxx≥0.85 时，才能用来鉴别或预测个人成绩或作为。

·信度不能低于 0.7

三、■解释个人分数的意义（多选）

其一是估计真实分数的范围；

其二是了解实得分数再测时可能的变化情形。

这就是测量标准误的应用。

·VIQ 是言语智商，PIQ 是操作智商，

四、比较不同测验分数的差异

这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。

这就是差异分数的标准误问题。

第四单元：

影响信度的因素

一、样本特征:

① 样本团体异质性的影响

■能力低者两次分数都低，虽然处在同一水平的受测者其分数也受机遇影响，但从整体上

来看，两次分数的相关是很高的，因此信度就高。

②样本团体平均能力水平的影响

二、测验长度:

①测验越长测题取样或内容取样越有代表性。

②测验越长被试的猜测因素影响就越小。

三、测验难度：

·难度与信度不存在简单的对应关系。

·如果因为难度过大或过小，造成分数范围缩小，可使信度降低。

四、时间间隔

再测法求信度，间隔时间越短信度系数越大；间隔时间越久，信度系数越低。

注意事项：

（看看）

·斯皮尔曼-布朗公式为校正分半信度的经验公式，它的假设是两半测验分数的变异数相等。

当

假设不成立时，可用下列两种公式之一，直接求得测验的信度系数。

弗朗那根（Flanagan）公式：

卢伦（Kulon）公式：

⎛ S 2 + S 2

a b

⎫

⎪⎪

⎭

= 1 -

S 2

·对于一些复杂的、异质的心理学变量，采用单一的同质性测验是不行的，因而常常采用若干

- 8 -

相对异质的分测验，使每个分测验内容具有同质性。

第四节：

测验的效度

第一单元：

测验的效度

一、效度的定义

·在心理测验中，效度是指所测量的与所要测量的心理特点之间的符合程度，

或者简单地说是指一个心理测验的准确性。

·测量的效度除受随机误差影响外，还受系统误差的影响。

可信的测验未必有效，而有效的测验必定可信。

二、■效度的性质（多选）

①效度具有相对性任何测验的效度都是针对一定的目标而言。

②效度具有连续性测验效度通常用相关系数表示，它只有程度上的不同，不是“全有”或“全无”的区别。

三、信度和效度的关系

■信度是效度的必要而非充分条件

■效度受信度制约

第二单元：

效度评估的方法

效度分为三大类：

内容效度、构想效度、效标效度

一、内容效度

（一）什么是内容效度

指的是测验题目对有关内容或行为取样的适用性，从而确定测验是否是所欲测量的行为领域的代表性取样。

这种测验的效度主要与测验内容有关，故而得名。

（二）■内容效度的评估方法：

（多选）

1、专家判断法（三个步骤）

–·定义好测验内容的总体范围；

–·编制双向细目表，确定内容的具体细节各自所占的比例；

–·由每位评判者在评定量表上作出判断。

2、统计分析法

–·计算两个评分者之间评定的一致性（评分者信度）

–·两个测验复本上得分之相关（复本信度）

–·再测法也可用于内容效度的评估（测验-学习-再测验）

3、经验推测法

–·这种效度是通过实践来检验效度

- 9 -

（三）内容效度的特性

·内容效度与所有效度一样，并非普遍适用。

只有编制者与使用者定义的内容范围相同，

编制者报告的内容效度对使用者才有意义。

·内容效度也有时间上的特定性。

·内容效度与表面效度不同。

二、构想效度

（一）什么是构想效度

·是指测验能够测量到理论上的构思或特质的程度，即测验的结果是否能证实或解释某一理论

的假设、术语或构思，解释的程度如何。

·要回答的问题是：

该测验欲测量什么心理构想？

对该构想测得有多好？

测验分数中有多少比

例的变异数是来自测验所欲测之构想？

①测验的内容效度

①对测验本身的分析②测验的内部一致性指标

（二）

■（多选）

构想效度的评估方法

③分析被试者对题目的反应特点

·相容效度是构思效度的一个证据

②测验间的相互比较 ·区分效度是构思效度的又一个证据

·因素分析法也是建立构思效度的常用方法

③效标效度的研究证明 ·根据效标分成相对照的两组，比较测验成绩

·观察分析测验高分组与低分组的心理特质

④实验法和观察法证实

三、效标效度

（一）什么是效标效度

·亦称实证效度，反映的是测验预测个体在某种情境下行为表现的有效程度。

·分为同时效度和预测效度。

·一个好的效标必须具备 4 个条件。

①效标本身必须有效

好效标的 4 个条件

②效标必须具有较高的信度，不随时间等因素而变化

③效标可以客观地加以测量，可用数据或等级来表示

④效标测量的方法简单，省时省力，经济实用

- 10 -

（二）①相关法：

·相关法是评估效标效度最常用的方法，它是求测验分数与

效标资料间的相关，这一相关系数称为效度系数

效标效度的评估方法②区分法：

·分析高分组与低分组分布的重叠量，或者计算每一组内得

分超过（或低于）另一组平均数的人数百分比，或者计算

两组分布的共同区的百分比。

重叠量越大，说明两组分数

差异越小，即测验的效度越差

③命中率法：

·命中率法是当测验用来做取舍的依据时，用其正确决定的

比例作为效度指标的一种方法

■·命中率的计算有两种方法：

①计算总命中率（Pcr）②计算正命中率（Pcp）（见 P385）

·正命中率高低常随划分测验分数成功与失败的临界分数的高低而变化，

临界分数越高，正命中率越高；临界分数越低，则正命中率也越低

第三单元：

效度的功能

一、预测误差

效度系数的实际意义常常以决定性系数来表示，意旨相关系数的平方，其表达式是 rxy2，它

表示能够正确预测或解释效标的测验分数的方差占总方差的比例。

另一种表达方法是估计的标准误，简写为 Sest，它是指所有具有某一测验分数的被试其效标

分数（Y）分布的标准差，也即真正效标分数落在某一范围内有多大可能性。

二、预测效标分数

·在测验工作中，人们感兴趣的是从测验分数预测效标成绩，因此最常用的是 Y 对 X 的回归方程。

■·Y 是预测的效标分数，a 是纵轴的截距，用来纠正平均数的差异；b 是斜率，亦即 Y 向 X 回归

的系数；X 为测验分数。

■·为了得到这个回归方程，必须确定 a 和 b，这两个常数的值，在计算中必须用到效度系数 R

三、预测效率指数

■E 值的大小表明使用测验比盲目猜测能减少多少误差。

E=100（1—K）

第四单元：

影响效度的因素（为了提高效度，要做到以下 5 条）

①测验材料必须对整个内容具有代表性

②测题设计时应尽量避免容易引起误差的题型（如是非题）

一、测验本身的因素

③测题难度要适中，具有较高的区分度

④测验长度要恰当，即要有一定的测题量

⑤测题的排列按先易后难顺序

- 11 -

二、测验实施中的干扰因素：

①主测者的影响因素：

主试不符合标准化要求的任何做法

②受测者的影响因素：

兴趣、动机、情绪、态度和健康状况等

三、样本团体的性质

（一）样本团体的异质性

异质性越高，分数分布范围大，测验效度越高。

1、如果只以选拔出来的被试为样本团体参加研究，会降低测验的效度。

2、选拔标准太高，样本团体的同质性增加，会降低测验的效度。

（二）干涉变量

包括年龄、性别、教育水平、智力、动机、兴趣、职业等。

美国心理学家吉塞利（E.E.Ghiselli）寻找干涉变量的方法：

1、用回归方程求每个人的预测效标分数，与实际效标分数相比较；

2、根据样本团体的组成，设立对照组，分别计算效度。

3、根据显而易见的干涉变量将其分为预测性高和预测性低的两个亚团体。

三、效标的性质

效标效度是以测验分数与效标测量的相关系数来表示，所以，效标测量本身的可靠性如何亦是

值得考虑的问题。

如果效标测量的信度不可靠，它与测验分数之间的关系也就失去了可靠性。

①信度是效度的必要而非充分条件

·效度高必然信度高，而信度高并不一定保证效度高，说明信度高只是

效度高的必要条件，并不是效度高的充分条件

信度与效度的关系②效度是受信度制约的

·信度系数与效度系数之间有这样一种关系：

信度系数的平方根是效度系数的最高限度。

·用公式表示如下：

·信度系数的平方根又称信度指数，也就是说，效度系数的最高限度是信度指数

- 12 -

第五节：

项目分析

第一单元：

项目的难度

一、难度的定义 ■

·定义：

是指项目的难易程度。

·难度的指标通常以通过率表示，通过人数越多（即 P 值越大），难度越低；P 值越小，难度越高

二、计算方法（难度的计算）

①二分法记分的项目②非二分记分的项目

三、难度水平的确定：

①项目的难度，P 值越接近于 0.50，区分力越好

■ ②测验的难度，最好使测验中所包含的试题的难度在 0.50±0.20 之间，平均难度接近 0.50

第二单元：

项目的区分度

一、区分度的定义

项目区分度也叫鉴别力。

取值范围在 –1 至+1 之间。

二、计算方法

①鉴别指数D = PH —PL

D 为鉴别指数，PH 为高分组在该项目上的通过率或得分率，PL 为低分组在该项目上的通过率或得分率

②相关法常用的计算方法：

点二列相关二列相关中相关法：

三、区分度与难度的关系见 P392

注意事项：

（看看）

① 当测验用于选拔或诊断时，应较多地选择难度值接近录取率的项目。

如选拔提高难度，

诊断应降低难度。

②对于选择题来说，P 值一般应大于概率水平。

如是非题，难度应该为 0.75 最为合适；而对于四

选一的题目，其难度约为 0.63 时最为合适。

③为了使测验具有更大的鉴别力，应该选择难度在 0.50 左右的试题比较合适。

但是，在实际工作

中并非如此简单。

如果难度都是 0.50，而试题间都完全相关，则易形成“U”分布。

④区分度取值范围介于-1～+1 之间，假如项目得分与实际能力之间呈负相关，则区分度为负。

这

种情况一般很少发生，如果出现，该题目应该淘汰。

- 13 -

第六节：

检测编制的一般程序

第一单元：

测验的目标分析

一、测验的对象韦氏成人智力量表分为城市版和农村版

二、测验的用途：

①显示性测验②预测性测验

三、测验的目标

目标分析以测验不同而异，分三种情况：

（一）工作分析（用于预测性测验）（两个步骤：

）

1. 确定哪些心理特征和行为可以使要预测的活动达到成功

2. 建立衡量受测者是否成功的标准——效标

（二）对特定概念下定义（用于测量心理特质）

必须发现所要测量的心理

展开阅读全文