4第五章心理测量学主要知识点.docx

资源描述

4第五章心理测量学主要知识点.docx

《4第五章心理测量学主要知识点.docx》由会员分享，可在线阅读，更多相关《4第五章心理测量学主要知识点.docx（27页珍藏版）》请在冰豆网上搜索。

4第五章心理测量学主要知识点.docx

4第五章心理测量学主要知识点

第五章心理测量学知识

第一节

一、测量：

就是依据一定的法则用数字对事物加以确定。

测量三元素：

1、事物：

2、数字：

具有自然数的特点：

（1）区分性

（2）序列或等级性

（3）等距性

（4）可加性。

3、法则：

测量的要素：

（一）参照点：

为计算事物的量而设置的计算的起点。

1、绝对零点：

2、相对零点：

（二）单位：

1、要有明确的意义；

2、要有相同的价值。

测量量表：

即在一个有单位和参照点的连续体上把事物的属性表现出来，这个连续体就称为量表。

按照制定量表的单位和参照点的不同可将量表分为四种水平，从低到高依次为：

（一）命名量表：

1代表男，2代表女

（二）顺序量表：

考试名次，数字仅表示等级，一般来说，心理测量是在顺序变量上进行的。

（三）等距量表：

具有相等的单位。

其数值可以互相作加减运算。

如温度。

0度并不意味着没有温度。

（四）等比量表：

有相等的单位、绝对零点。

数值可以做加减乘除运算。

如重量等。

二、心理测验：

就是依据心理学理论，使用一定的操作程序，通过观察人的少数有代表性的行为，对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种手段。

心理测验的性质：

（一）间接性

（二）相对性：

（三）客观性：

1、测验的刺激是客观的

2、测验的量化是客观。

3、测验的结果是客观的

心理测验的分类1、按测验的功能分类：

（1）智力测验：

（2）特殊能力测验

（3）人格测验

2、按测验材料的性质分类：

（1）文字测验：

（2）操作测验：

3、按测验材料的严谨程度分类：

（1）客观测验：

（2）投射测验：

4、按测验的方式分类：

（1）个别测验：

（2）团体测验：

5、按测验的要求分类：

（1）最高作为测验：

（2）典型行为测验：

四、纠正错误的测验观

（一）错误的测验观：

（1）测验万能论

（2）测验无用论

（3）心理测验即智力测验

（二）正确的的测验观

（1）是一种重要的心理学研究方法，是决策的辅助工具。

（2）这种研究方法和辅助工具尚不完善。

五、在门诊中使用较多的三类心理测验：

1、智力测验

2、人格测验

3、心理评定量表

六、心理测验的发展史

（一）科学心理测验的产生与发展

1、高尔顿：

（1）提出了人的不同气质特点和智能是按身体特点的不同而遗传的；

（2）为了研究差异的遗传性，设计了测量差异的方法；

（3）为心理测验奠定了统计学基础，提出了相关的概念，

2、卡特尔：

（1）使心测验首次出现在心理学文献中，在《心理》杂志上发文章，开先河；

第五章心理测量学知识

（2）认为心理学应立足于实验和测验

（3）认为心理测验应有统一的标准；。

3、比内：

（1）1905年在《心理学报》上发表＜诊断异常儿童智力的新方法＞包含30个题目。

（2）是世界上第一个正式的心理测验。

（二）20世纪二十年代后心理测验的发展趋势1、操作测验的发展

2、团体智力测验的发展

3、能力倾向测验的发展

4、人格测验的发展

第二节测验的常模

一、常模团体：

是由具有某种共同特征的人所组成的一个群体，或者是该群体的一个样本。

常模团体的选择：

1、确定一般总体

2、确定目标总体

3、确本样本

常模团体的条件：

1、群体构成的明确界定

2、对群体具有代表性

3、样本的大小要合适：

最低不小于30或100个。

全国性常摩，一般应有2000~3000人为宜。

（1）经济

（2）实用

（3）减少误差

（4）关键是有代表性

4、具有新近性

取样：

即从目标人群中选择有代表代表性的样本。

取样的方法：

1、简单随机取样：

随机号码表法

2、系统抽样：

要求目标总体无序可排，无等级结构存在。

关键是计数组距。

先编号然后隔段抽取K=N/nN总体数目K组距n样本数目

3、分组抽样：

先将群体分组，再在组内进行随机进行取样的方法。

4、分层抽样：

分为分层比例抽样和分层非比例抽样。

常模分数：

是施测常模样本被试后，将被试者的原始分数按一定规则转换出来的导出分数。

导出分数：

是根据原始分数的分布特点使用现在统计学的方法转换出的具有一定的参照点和单位的测验量表。

是一个有意义的测验量表，与原始分数等值，可以进行比较。

常模：

常模分数构成的分布，就是通常据说的常模。

二、常模的类型

（一）发展常模（年龄量表）：

个人的分数指出其行为在按正常途径发展时处于什么样的发展水平。

1、发展顺序量表：

告诉人们儿童发育与其年龄相比是正常、超前、滞后

（1）最早的范例是葛塞尔发展程序表：

按月份显示儿童在运动水平、适应性、语言、社会性方面的大致发展水平。

4周，能控制眼睛运动；

16周，能使头保持平衡；

28周，能用手抓握东西并玩弄它；

40周，能控制躯干、坐立或爬行；

52周，能控制腿脚运动、站立和行走。

（2）皮亚杰：

提出守恒定律。

5岁时才会理解质量守恒，

6岁才会掌握重量守恒，

7岁时才有容量守恒概念。

2、智力年龄：

一个儿童在年龄表上所得的分数，就是最能代表他的智力水平的年龄。

这种分数叫智力年龄，简称智龄。

比内—西蒙量表中首先使用智力年龄的概念。

吴天敏修订的比内—西蒙量表中，每个年龄都有6个测题，答对每题得智龄2个月。

智力年龄＝基本年龄（全对题年龄）+各非基本年龄所答对题之和*2/12

如：

通过4岁组全部题目，5岁组通过3题，6岁组通过2题，7岁组通过1题，

则智力年龄＝4+（3+2+1）*2/12＝5

第五章心理测量学知识

3、年级当量：

6年级的算术平均分为35，某儿童的算术测验中得35分，则该儿童的算术年级当量是6年级水平

（二）百分位常模包括：

百分等级、百分点、百分位数、四分位数、十分位数

1、百分等级

（1）一个测验的百分等级是指在常模中低于这个分数的百分比。

如：

55的百分等级表示常模样本中55%的人比这个分数低

是应用最广的表示测验分数的方法。

（2）未分组资料的计算公式：

PR=100-（100R-50）/NR是原始分数排列顺序数，N是指总人数（样本总人数）

如王红得80分，在30名同学中排第5名，则百分等级＝100-（100*5-50）/30＝85，表示低于80

分的有85人。

2、百分点或百分位数

百分点是计算处于某一百分比例的对应的测验分数是多少。

相对于某一百分等级的分数点就叫百分点或百分位数。

是与求百分等级相反的过程。

公式：

（100-pr）/（sh-pp）=（pr-1）/（pp-sl）

如：

高考最高分为650，其百分等级为100，最低分为105，其百分等级为1，要录取20%的学生，百

分等级为80的百分位数。

则（100-80）（/650-PP）=（80-1）/（PP-100），则PP＝540

3、四分位数：

将量表分不是分成100份而是4等份。

相当于25%、50%、75%

十分位数：

将量表分分成十等份。

相当于1%－10%、11%－20%、91%-100%

（三）标准分常模

标准分常模就是将原始分数与平均分数的距离以标准差为单位表示出来的量表，

因为它的基本单位为标准差，所以叫标准分数。

常见的标准分数有z分数、Z分数、T分数、标准九分数、离差智商等。

标准分数可以通过线性转换，也可以通过非线性转换得到。

1、线性转换的标准分数

转换公式：

z=X-X/SD，SD为样本标准差

Z＝A＋Bz，加上一个常数是为了去掉负数，乘以一个常数是为了去掉小数点

2、非线性转换的标准分数

当原始分不是常态分布时，也可以使之常态化，这一转换过程是非线性的。

常态化过程：

主要是将原始分数转换成百分等级，再将百分等级转化为常态分步上相应的离均值，并可以表示为任何平均数和标准差。

常见的常态化标准分数：

标准九分：

Z=5+2z

标准十分：

Z＝5＋1.5z

标准二十分：

Z＝10＋3z

离差智商：

IQ=100+15z

T分数:

Z=50+10z

（四）智商及其意义

心理年龄：

最早的比内－西蒙量表使用心理年龄，存在缺乏不同年龄儿童之间的可比性问题。

比率智商：

是心理年龄与实足年龄之比。

两者不同步增长，不适用于年龄较大的被试。

公式：

IQ=（MA/CA）×100

离差智商：

是一种以年龄组为样本计算而得的标准分数。

公式：

IQ=100+15z=100+15（X-X）/SD

（1）建立在统计学的基础上

（2）表示个体智力在年龄组中所处的位置

（3）表示智力高低的一种理想指标

（4）不同测验获得的离差智商只有当标准差相同或相近时才可以比较

三、常模分数的表示方法

1、转换表：

也叫常模表，是一种最简单、最基本的且常用的呈现常模资料的方法。

测验的使用者利用转换表可以将原始分数转换为与其对应的导出分数，从而使对测验的分数作出有意义的解释。

常模表的构成要素：

（1）原始分数

心理测量学知识第五章

2）导出分数（3）对常模团体的有关具体描述（发展量表中的年龄量表最基本的假设是所测量的特质随年龄有系统地改变。

1）一组可以区分不同年龄组的题目年龄量表的基本要素：

（2）一个常模团体（3）常模表（表示出来。

从而可以很直观地看出被试在各个分测验上的表现是将测验分数的关系用图形2、剖面图：

及其相对位置。

特殊常模。

3、对于某些特殊的群体来说，情况很具体而特殊，我们就需要制定测验的信度第三节是指同一被试在不同时间内用同一测验（或用另一套相等的测验）重复测验，所得结果的一致一、信度：

性程度。

的影响，随机误差越大，信度越低。

信度只受随机误差T＝E）两部分构成的。

即X真分数理论：

一个测验的实得分数（X）总是由真实分数（T）和误差分数（

E可以用各数据组的方差（标准差的平方）代表具体分数。

变为方差形式＋

信度被定义为：

一组测量分数的真分数方差与总分数方差（实得分数的方差）的比率。

信度公式

222/s、信度系数：

r=r=s信度的指标：

1xxTTxx（信度指数的平方等于信度系数）、信度指数：

r=s/s2xTxTr为测量的标准误，S是所得分数的标准差，为测:

SE=S1—r，SE3、标准误公式xxxxxx量的信度系数。

分数测量值的标准误与信度成反比：

信度越高，标准误越小；信度越低，标准误越大。

T，X同时变大为正相关，T，X同时变小时为负相关。

相关系数最大是1；相关系数最小是-1。

二、信度评估的方法1、重测信度：

（1）又称稳定性系数。

是使用同一测验，在同样条件下对同一组被试前后施测两次测验，求得两次得分间的相关系数。

（2）最适宜的时距随测验的目的、性质和被试特点而异，一般是2周到4周较宜，间隔时间最好不超过6个月。

2、复本信度：

（1）又称等值性系数。

是以等值但题目不同的测验（复本）来测同一群体，求得被试者在两个测验上得分上相关系数。

（2）反映的是测验在内容上的等值性

（3）如果复本信度考虑到两个复本实施的时间间隔，并且两个复本的施测相隔一段时间，则称重测复本信度或稳定与等值系数。

（4）优点：

能够避免重测信度的一些问题，如记忆效果、学习效应。

（5）缺点：

①如果测量的行为易受练习的影响，则复本信度只能减少而不能消除这种影响

②由于第二个测验只改变了题目的内容，已经掌握解题原则，可以很容易迁移到同类问题

③对于许多测验验来说，建立复本是十分困难的

3、内部一致性信度

（1）分半信度：

A通常是在测验实施后将测验按奇、偶数分为等值的两伴，并分别计算每位被试在两半上得分，求出这两伴分数的相关系数。

B这个相关系数就代表了两半测验内容取样的一致程度。

C斯皮尔曼－布朗公式：

r=2r/（1+r）hhxxhh4

第五章心理测量学知识

r为一半分数的相关系数，hhr为测验在原长度时的信度估计值。

（2）同质性信度:

A主要表示测验内部所有题目间的一致性。

B库德－理查逊公式:

K－R20和K－R21，只适用于是非题

4、评分者信度：

（1）一般要求在成对的受过训练的评分者之间平均一致性达0.9以上。

（2）方法是随机抽取若干份测验卷，由两位评分者按评分标准分别，再根据每份试卷组成的两列分数计算相关系数。

（3）所有题目看起来好象测量同一特质，但相关很低，或为负相关时，则测验为异质的

（4）人的多数心理特征如智力、性格、兴趣等，具有相对的稳定性，间隔一段时间，不会有很大变化

（5）不同的信度反应误差的不同来源

三、信度与测验的解释

r＝0极端情况xx当r＜0.70测验不能用于对个人作出评价或预测，而且不能xx作团体比较；

0.70≤r＜可用于团体比较xx0.85

r≥0.85才能用来鉴别或预测个人成绩或作为xxr＝1极端情况xx信度系数r解释个人分数的意义：

1、估计真实分数的范围；xx2、了解实得分数再测时可能的变化情形。

测量标准误：

SE=S1-rxx

大约有95%的可能性真实在所得分数±1.96SE的范围内，或有5%的可能性落在范围之外。

置信区间：

X－1.96SE＜X≤X＋1.96SE

T比较不同测验分数的差异：

＠甲被试在韦氏成人智力测验中言语智商为102，操作智商为110，已知两个分数都是以100为平均数，15为标准差的标准分数，假设言语测验和操作测验的分半信度分别为0.87和0.88，那么假被试的操作智商不显著高于言语智商。

四、影响信度的因素：

1、标本特征：

（1）样本团体异质性的影响：

一般而言，若获得信度的取样团体较为异质的话，往往会高估测验的信度

（2）样本团体平均能力水平的影响:

对于不同水平的团体，题目难度会影响信度相关系数受样本是否异质性及样本团体平均能力水平的影响。

2、测验长度：

（1）在一个测验中增加同质的题目，可以使信度提高。

（2）测验越长，测验的测题取样或内容取样就越有代表性。

（3）测验越长，被试的猜测因素影响就越小

（4）增加测验长度的效果应遵循报酬递减率原则

（5）测验过长，有时反而会引起被试的疲劳和反感而降低可靠性

＠40题目的测验信度为0.80，欲将信度提高到0.9，则需增加60个题目。

3、测验难度：

各类选择题平均难度为：

（1）五择一测题，0.70；

（2）四择一测题，0.74；

（3）三择一测题，0.77；

（4）是非题，0.85。

4、测验的时间间隔

（1）以再测法或复本法求信度，两次测验相隔时间越短，其信度系数越大；间隔时间越久，其他变因介入的可能性越大，受外界的影响也越大，信度系数便越低。

第四节测验的效度

一、效度：

是指所测量的与所要测量的心理特点之间的符合程度，或者简单地说是指一个心理测验的准确性。

第五章心理测量学知识

（有效方差）与总方差的比率。

效度定义公式：

在一组测量中，与测量目标有关的真实方差

代表总方差代表有效方差，S2其中r2代表测量的效度系数，S2XVxy目的

（1）1、效度具有相对性：

在评鉴测验时，必须考虑测验的效度的性质：

功能

（2）连续性2、效度具有、效度结果的有效性。

3信度是效度的必要而非充分条件；1）信度和效度的关系：

（效度是受信度制约的2）（发行的《教育与心理测量之标准》一书中将效度分为三类二、效度的评估方法：

按美国心理学会1974指测验题目对有关内容或行为取样的适用性，从而确定测验是否是所测量行为领域的、内容效度：

1代表性取样。

）专家判断法：

请有关专家对测验题目与原定内容的符合性做出判断，看测1内容效度的评估方法：

（

验的题目是否代表规定的内容。

则测验具有内容效度。

因此内容效如果专家认为测验题目恰当地代表了所测内容,逻辑效度。

度又称A定义好测验内容的总体范围专家判断法的步骤：

B编制双向细目表制定评定量表来评估测验的整个效C度，D由每位评分者在评定量表上做出判断A计算两个评分者一致性。

（2）统计分析法：

B复本相关再测法C）经验推测法（3不是普遍适用的。

内容效度的特性：

A内容效度有时间上的特定性。

B在编制测验时，表面效度是一个必须考虑的特性。

最高行为的测验要求有较高C的表面效度）也叫构思效度，或结构效度。

（12、构想效度：

）主要涉及的是心理学的理论概念问题

（2）指测验能够测量到理论上的构想或特质的程度（34）测验的结果是否能证实或解释某一理论的假设、术语或构想，解释的程度如何。

（A用测验的内容效度可以作为构想效度的证据。

构想效度的估计方法：

1、对测验本身的分析法B测验的内部一致性指标可以作为构想效度的证据分析被试者对题目的反应特点可以作为构想效度C的证据相容效度：

计算两种测验之间得分的相关，其中一种测验是待研A2、测验间相互比较法：

究效度的，是一种是已有效度证据的成熟测验。

但相者测量的是同一种心理特质，假如相关高，说明新测验所测量的特质确实是老测验所反映的特质或行为。

区分效度：

B因素分析法：

C、效标效度的研究证明法3=经验推测法）4、实验和观察法证实法（实验法=再测法；观察证实法同时效度：

是测验预测个体在某种情境下行为表现的有效性程度。

分为：

A3、效标效度（实证效度）B预测效度效标必须能最有效地反映测验的目标。

A一个好的效标必须具备的条件：

效标测量本身必须有效。

B效标必须具有较高的信度，稳定可靠。

效标是可以测量的，即可用数字和等级表示。

第五章心理测量学知识

D效标测量的过程要是方法简单，节省实用。

效标效度的评估方法：

1、相关法：

相关法是求分数与效标资料间的相关，结果称为效度系数。

最常用的方法：

A积差相关

B二列相关公式

C点二列相关公式

D贾斯朋多系列相关公式。

2、区分法：

是检验测验分数能否有效地区分由效标所定义的团体的一种方法

3、命中率法：

是指当测验用来做取舍的依据时，用其正确决定的比例作为效度指标的一种方法。

命中的情况是指：

（1）预测成功而且实际也成功

（2）预测失败而且实际也失败

三、效度的功能

预测误差：

1、效度系数的实际意义常常以决定系数来表示，如测验的效度是0.80，则测验的总方差中

64%的方差是测验分数的方差。

有S代表效标成绩的标准差2代表效度系数的平方，即决定系数；2、ryxy

是纵轴的截距，b是斜率的回归方程：

X其中Y是预测的效标分数，a预测效标分数：

Y对

1-K）（预测效率指数：

E=100

的大小说明使用测验比盲目猜测能减少多少误差。

预测效率指数E，这表明由于该测验的使用，使得我们在估计被试的效标分数时，如一个测验的效度系数为0.80E=40减少了40%的误差。

四、影响效度的因素：

（一）测验本身的因素：

1、测验材料必须对整个内容具有代表性。

2、测题设计时避免误差题型的使用。

（如事非题）3、测题难度适中，有区分度。

4、测验长度要恰当。

5、测题的排列按先易后难的顺序。

、主试的影响因素。

（二）测验实施中的干扰因素：

1、被试的影响因素。

2）团体越同质，分数分布范围越小，测验效1、样本团体的异质性：

（1（三）样本团体的性质：

度起低，团体越异质，分数分布范围越大，测验效度越高、干涉变量：

团体的性质包括年龄、性别、教育水平、智力、动机、兴趣、职业和2任何有关的特征，使得测验对于不同团体具有不同的。

预测能力，故测量学上称这些特征为干涉变量找出干涉变量的方法（美国心理学家吉赛利）：

、用回归方程求得每个人的预测效标分数，将该分数与与实际效标分数相比1的绝对值很大，说明测验中可能存在干涉变DD较，获得差异分数，如果量7

第五章心理测量学知识

2、根据样本团体的组成分析，找出对照组，分别计算效度，从而找出干涉变量。

3、对于欲测团体，根据某些易见的干涉变量将其区分为预测性高和预测性低两个亚团体，对于预测性高的团体，获得的测验效度会有所提高。

效标的性质：

（1）使用皮尔逊积差相关系数的的前提条件是：

假设两个变量的关系呈线性分布。

（2）效标测量本身的可靠性如何亦是值得考虑的一个问题，效标测量的可靠性即效标测量的信度。

第五节项目分析：

项目分析：

1、定性分析：

包括内容效度，题目编写的恰当性和有效性等。

2、定量分析：

包括题目难度和区分度的分析。

一、项目的难度

难度：

1、是指项目的难易程度。

2、难度的指标通常以通过率表示，即答对或通过该题的人数百分比来表示：

P＝（R/N）×100%，P代表难度，R代表通过的人数，N代表总人数，P值越大，难度越低

3、通俗性：

在非能力测验中与难度类似的指标，

难度的计算

（1）定义公式P＝（R/N）×100%〖200学生，答对某项目120人，则该项目难度120/200＝0.6〗

（2）二分法公式：

：

P＝（Ph+Pl）/2〖370名被试，高分低分组各100人，高分组70人答对1题，低分组40人答对1题，则1题难度（0.7+0.4）/2＝0.55〗

（3）非二分公式：

：

P＝（X/X）X100%〖某题满分15，考生平均分9.6分，则该题难度9.6/15max平＝0.64〗

排除猜测对结果的影响的矫正公式：

Cp＝（KP-1）/（K-1），Cp为较正后通过率，P为实际通率，K为备选答案题目

难度水平的确定1、难度P值越接近0或1，越无法区分被试之间能力的差异，

2、P值越接近0.5，区别力越高

3、为了使测验具有更大区别力，应选择平均难度在0.50左右的试题比较合适

4、各题的难度在0.30-0.70之间。

5、

对于选择题，其难度应该大于概率水平，如是非题为0.75，四选一题为0.63左右

二、项目的区分度：

项目的区分度也叫鉴别力，是指测验项目对被试的心理特性的区分能力。

鉴别指数的计算步骤：

（1）按测验总分高低排列答

（2）确定高分组、低分组，每一组取答卷总数的27%，

（3）分别计算高分组和低分组在该项目上的通过率或得分率

（4）按下列公式估计出项目的鉴别指数：

D＝Ph-PL，D为鉴别指数，

Ph为高分组在该项目上的通过率或得分率，

PL低分组在该项目上的通过率或得分率

1965年美伊贝尔鉴别指数的标准：

其中鉴别指数D在0.19以下，说明该项目差，必须淘汰。

鉴别指数项目评

0.4以很

0.30-0.39良好，修改后会更佳

0.20-0.29尚可，但需修改

0.19以下差，必须淘汰