心理测量学复习要点Word下载.docx

资源描述

心理测量学复习要点Word下载.docx

《心理测量学复习要点Word下载.docx》由会员分享，可在线阅读，更多相关《心理测量学复习要点Word下载.docx（26页珍藏版）》请在冰豆网上搜索。

心理测量学复习要点Word下载.docx

2、心理测量必须选择有代表性的样本；

3、心理测量必须有相同的条件；

4、心理测量必须以常模作为测量依据。

二、心理测验的性质

（一）间接性：

只能通过一个人对测验项目的反应来推论出他的心理特质。

特质是个人对刺激作反应的一种内在倾向。

是个体特有的、稳定的、可辩别的特征，它又是一个抽象产物，一个构思，而不是一个直接测量到的有实体的个人特点。

（二）相对性：

对人的行为做比较，没有绝对标准。

（三）客观性：

包括

（1）测验的刺激是客观的；

（2）对反应的量化是客观的；

（3）对结论的推论是客观的。

测验的客观性实际上就是测验的标准化问题。

包括测验用的项目或作业标准化、评分记分的原则和手段的标准化、分数转换和解释经过了标准化。

[测验的客观性不包括（）的客观性。

绝对的标准]

第三单元心理测验的分类

一、按测验的功能分类

（一）智力测验：

其功能是测验人的一般智力水平。

（二）特殊能力测验：

如音乐、绘画、机械技巧、文书才能测验。

（三）人格测验：

个性中除能力以外的部分的测验。

二、按测验材料的性质分类

（一）文字测验：

儿童和成人智力量表中的言语量表部分均属文字测验。

缺点是容易受被试者文化程度的影响。

（二）操作测验：

操作测验也称非文字测验。

多属于对图形、工具、模型的辨认和操作，无须使用言语作答，所以不受文化因素的限制，可用于学前儿童和不识字的成人。

三、按测验材料的严谨程度分类

（一）客观测验：

无须发挥想像力来猜测和遐想。

（二）投射测验

1．概念：

投射法是指向被试者提供一些未经组织的刺激情境，让他在不受限制的情境下，自由地表现出他的反应，分析反应的结果，便可推断出他的人格结构。

2．投射技术的种类

（1）联想法——罗夏墨迹测验

（2）构造法——主题统觉测验

（3）表露法——主要有：

a.画人测验b.知觉—运动测验

（4）完成法——（句子填充测验、逆境对话测验）

句子填充测验：

我最喜欢＿＿＿＿。

我最讨厌＿＿＿＿。

四、按测验的方式分类

（一）个别测验：

以一对一的形式来进行。

优点在于主试对被试的言语和情绪状态有仔细的观察，并且有充分的机会与被试者合作，所以结果可靠。

缺点是时间不经济。

（二）团体测验：

一个主试者同时对多个被试者实施的测验。

如著名的陆军甲种和乙种测验。

五、按测验的要求分类

（一）最高行为测验——成就测验、学绩测验。

（二）典型行为测验——一般人格测验等。

第四单元如何看待心理测验

一、错误的测验观

（一）测验万能论

（二）测验无用论

二、正确的测验观

（一）心理测验是重要的心理学研究方法之一、是决策的辅助工具

（二）心理测验作为研究方法和测量工具尚不完善。

第五单元心理测验在心理咨询中的应用

在我国目前情况下，心理门诊中运用较多的大致有这样3类心理测验：

一、智力测验；

二、人格测验；

三、心理评定量表。

心理测验在咨询和心理治疗过程中并不是必不可少的一个环节，如果通过与咨询或治疗对象的交谈，对其问题已形成明确的看法，就可以放弃不必要的心理测验。

有时过多的使用还会影响咨询、治疗的过程和效果。

第六单元心理测验的发展史

一、科学心理测验的产生与发展

（一）三个重要人物：

1、高尔登（F.Galton），首先倡导科学心理测验的学者。

[英国生物学家和心理学家高尔顿的主要贡献]：

（1）提出了不同气质特点和智能是按身体特点的不同而遗传的；

（2）研究差异的遗传性，便设计了测量差异的方法，典定了统计学基础；

（3）第一个提出了相关的概念，创立了积差相关法，这使判定心理测验的信度、效度和进行因素分析成为可能。

2、卡特尔（J.M.Cattell），卡特尔

（1）在《心理》杂志上发表“心理测验与测量”一文，这是心理测验第一次出现于心理学文献中；

（2）认为心理学应立足于实验与测验；

（3）认为心理测验应有统一的标准。

3、比内（A.Binet），编写了世界上第一个正式的心理测验。

（二）20世纪心理测验的主要发展：

1、操作测验的发展

2、团体智力测验的发展

3、能力倾向测验的发展

4、人格测验的发展

二、现代心理测验在我国的发展（参见本课程教学参考资料：

专栏5-1中国古代的心理测验思想）

九连环是一种中国民间的智力游戏，其设计之巧妙，也可和现代的魔方、魔棍相配美。

称为“中国的迷津”。

七巧板被称为唐图，即“中国的图板”。

近些年来我国的心理学学正在致力于测验的本土化。

第二节测验的常模

常模参照分数解释的测验：

律师考试就是这样，即使大家考试都考得特别好，也只要前面的百分之几。

根据大家的成绩。

标准参照分数解释的测验：

国家心理咨询师的考试，出了两份卷子：

基础理论，操作技能，满分一百，及格六十。

两科都满60，可以得到分数。

门槛已经设好了。

大家都能跳过门槛，就都能通过。

很多人都没有通过，也就不能过去了。

通过与不通过，参照一个事先设定好的标准，来解释分数。

叫做标准参照分数解释。

第一单元常模团体

一、常模团体的性质

常模团体是由具有某种共同特征的人所组成的一个群体，或者是该群体的一个样本。

它用一个标准的、规范的分数表示出来，以提供比较的基础。

任何一个测验都有许多可能的常模团体。

对测验编制者而言，常模的选择包括：

确定一般总体、确定目标总体、确定样本。

对测验的使用者来说，要考虑的问题是，现有的常模团体哪一个最合适。

二、常模团体的条件

（一）群体的构成必须明确界定

（二）常模团体必须是所测群体的代表性样本

（三）样本的大小要适当。

总体数目小，只有几十个人，则需要100%的样本。

如果总体数目大，相应的样本也大，一般最低不小于30或100个。

全国性常模，一般应有2000~3000人为宜。

[在实际工作中，应从经济的或实用的可能性和减少误差这两个方面来综合考虑样本的大小。

（四）标准化样组是一定时空的产物（具有新近性）

三、取样的方法

㈠简单随机抽样

㈡系统抽样：

系统抽样方法的关键是计算组距。

系统抽样要求目标总体无序可排，也无等级结构存在。

㈢分组抽样：

㈣分层抽样：

有分层按比例抽样与分层非比例抽样之分。

此方法最常用。

四、常模分数与解释

㈠常模分数：

常模分数就是施测常模样本被试后，将被试者的原始分数按一定规则转换出来的导出分数。

㈡常模：

常模分数构成的分布，就是通常所说的常模（norm），它是解释心理测验分数的基础。

[常模表示一种最简单、最基本的且常用的呈现常模资料的方法，它的构成要素是：

①对常模团体的具体描述；

②原始分数；

③导出分数。

[导出分数的特性：

①具有意义；

②与原始分数等值；

③等单位；

④具有参照点。

[取样是指从（）中选择有代表性的样本。

目标人群]

第二单元常模的类型

一、发展常模（年龄量表）

（一）发展顺序量表。

最早的一个范例是葛塞尔发展程序表。

按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致发展的水平。

4周能控制眼球运动；

16周能使头部保持平衡；

28周能用手抓握东西并玩弄；

40周能控制躯干、坐立或爬行；

52周能控制腿脚运动、站立和行走。

皮亚杰发现，儿童不同时期出现不同的守恒概念：

5岁时理解质量守恒；

6岁时掌握重量守恒；

7岁时有容量守恒概念。

[皮亚杰的研究着重于从婴儿到十多岁儿童认知过程的发展，尤其注重某些特殊概念的形成，其中最著名的工作就是对（）概念的研究。

守恒]

（二）智力年龄

比内-西蒙量表中首先使用智力年龄的概念。

计算方法：

假如某儿童6岁组的题目全部通过，7岁组通过4题，8岁组通过3题，9岁组通过2题，其智龄为：

6（岁）+4×

2（月）+3×

2（月）+2×

2（月）=6岁+18月=7岁6个月。

智力年龄，简称智龄，一个儿童在年龄量表上所得到的分数，就是代表他的智力水平的年龄。

（三）年级当量：

年级当量实际上就是年级量表，测验结果说明属哪一年级的水平，在教育成就测验中最常用。

[发展量表的基本要素；

（1）一组可以区分不同年龄组的题目；

（2）一个常模团体；

（3）常模表。

二、百分位常模

（一）百分等级：

指在常模样本中低于这个分数的人数的百分比。

公式（5-1）：

PR＝100－（100R－50／N）

[王红在30名同学中的物理成绩是80分，排名第5名，则其百分等级为（85）。

（二）百分点：

也称百分位数。

计算处于某一百分比例的人对应的测验分数是多少。

直线内插法：

例：

高考的最高分为695，其百分等级为100，最低分为103分，百分等级为1，要录取20％的学生进入大学，百分等级为80的百分位数（PP）。

按直线内插法：

100－80／695－PP＝80－1／PP－103得PP＝575

（三）四分位数和十分位数：

四分位数和十分位数只是百分位数的两个变式，其含义相似。

百分位数是将量表分成100份，而四分位则是将量表分成四等份，十分位则是分成十等份。

三、标准分常模

标准分数是将原始分数与平均数的距离以标准差为单位表示出来的量表。

因为它的基本单位是标准差，所以叫标准分数。

标准差的作用：

一是可以直接反映被测值的离散程度；

二是可以直接作为一个单位反映被测值偏离平均值的情况。

1.线性转换的标准分数

公式（5-2））Z=（X-X）/SD

其中X为任一原始分数，X样本平均分数，SD为样本标准差。

由此可见Z可以用来表示某一分数与平均数之差的几倍。

因为存在小数和负数，而且单位过大，通常将z转换成另一形式：

公式（5-3）：

Z=A+BZ

Z为转换后的标准分数，A、B为根据需要指定的常数。

2.非线性转换的标准分数。

当原始分数不是常态分布时，也可以使之常态化，这一转换过程就是非线性的。

步骤为：

A、对每个原始分数值计算累计百分比；

B、在常态曲线面积中，求出位于该百分比的z分数。

（1）T分数：

以50为平均数（即加上一个常数50），以10为标准差（乘以一个常数10）来表示。

（麦柯尔最早使用）

公式（5-4）：

T=50+10z`

[最早使用T分数的是麦柯尔。

（2）标准九分：

是以5为平均数，以2为标准差的一个分数量表。

（3）标准十分：

以5（5.5）为平均数，以1.5为标准差的一个分数量表。

（4）标准二十分：

以10为平均数，以3为标准差的一个分数量表。

四、智商及其意义

1.比率智商（斯坦福大学推孟教授于1916年修订而成斯坦福-比内量表）。

比率智商（IQ）等于心理年龄（MA）与实足年龄（CA）之比。

为小数将商乘以100。

公式（5-5）IQ=MA/CA×

100

缺点：

由于智力是由快到慢再到停止的一个过程，所以不适合年龄较大的被试。

2.离差智商（韦克斯勒）：

表示的是个体智力在年龄组中的位置。

离差智商的平均数为100，标准差定为15。

公式（5--6）：

IQ=100+15Z`=100+15（X-X）/SD

必须指出：

从不同的测验获得的离差智商只有当标准差相同或接近时才可以比较，标准差不同，其分数的意义便不同。

（参见本课程教学参考资料：

专栏5-2几种导出分数间的相互关系）

[离差智商的优点：

（1）建立在统计学基础之上；

（2）它表示的是个体智力水平年龄组中所处的位置；

（3）是表示智力高低的一种理想指标。

[若儿童的心理年龄高于其生理年龄，则智力较一般儿童高，若心理年龄低于其生理年龄，则智力较一般儿童低。

但在实践中发现，单纯用心理年龄来表示智力高低的方法缺乏不同（）儿童间的可比性。

年龄]

五、注意的问题

1、发展常模换算及解释时需要注意的问题：

只适合于所测特质随年龄发展变化的情况，对成年人不适用；

只适用于在典型环境下成长的儿童；

一年的差异在不同年龄有不同的含义。

2、百分位换算及解释时需要注意的问题：

顺序量表，缺少相等单位。

靠近中央的原始分数差异扩大，而两端的差异缩减。

不能比较和说明不同被试间分数差异的数量。

3、标准分数换算及解释时需要注意的问题：

计算非线性转换的标准分数时，特质的分数实际上应该是常态分布。

标准差不同，其分数的意义不同。

第三单元常模分数的表示方法

一、转换表法：

最简单而且最基本的表示常模的方法就是转换表，有时也叫常模表。

二、剖面图法：

剖面图就是将测验分数的转换关系用图形表示出来，效果更直观。

第三节测验的信度

第一单元信度的概念

一、信度的定义

信度是指同一被试者在不同时间内用同一测验（或用另一套相等的测验）重复测量，所得结果的一致程度。

信度只受随机误差的影响。

随机误差越大，信度越低。

第一个测试的实际分数（X）总是由真实分数（T）和误差（E）两部分构成。

（公式5-7）：

X=T+E

如果用方差代表具体分数，就得到（公式5-8）。

在测量理论中，信度被定义为：

一组测量分数的真实分数方差与总方差（实得分数的方差）的比率。

（公式5-9）。

真实分数是无法统计的，因此公式5-9还可以转化为（公式5-10）。

二、信度的指标

1.信度系数与信度指数：

大部分情况下，信度是以信度系数为指标，它是一种相关系数。

是真分数方差与实得方差的比值。

（公式5-11）。

信度指数的平方就是信度系数。

（公式5-12）

2.测量标准误

测量的标准误与信度之间有相互消长的关系：

信度越高，标准误越小；

信度越低，标准误越大。

第二单元信度评估的方法（四个）

一、重测信度：

使用同一测验，在同样条件下对同一组被试者前后施测两次测验，求两次得分间的相关系数，叫重测信度，又称稳定性系数。

一般是两周到四周较宜，间隔时间最好不超过六个月。

由于人的多数心理特征如智力、性格、兴趣等，具有相对的稳定性，间隔一段时间，不会有很大的变化。

二、复本信度：

又称等值性系数。

它是以两个等值但题目不同的测验（复本）来测量同一群体，然后求得被试者在两个测验上得分的相关系数。

这个相关系数就代表了复本信度的高低。

复本信度反映的是测验在内容上的等值性，故又称等值性系数。

复本信度也要考虑两个复本实施的时间间隔。

如果两个复本几乎是在同一时间内施测的，相关系数反映的才是不同复本的关系，而不掺有时间的影响。

如果两个复本的施测相隔一段时间，则称重测复本信度或稳定与等值系数。

[复本信度的缺点：

（1）如果测量的行为易受练习的影响，则复本信度只能减少而不能完全消除这种影响；

（2）由于第二个测验只改变了题的内容，已经掌握的解题原则可以迁移到同类的问题；

（3）对于许多测验来说，建立复本是十分困难的。

三、内部一致性信度

1.分半信度：

分半信度指采用分半法估计所得的信度系数。

这种方法估计信度系数只需一种测验形式，实施一次测验。

通常是在测验实施后将测验按奇、偶分为等值的两半，并分别计算每位被试在两半测验上的得分，求出这两半分数的相关系数。

这个相关系数就代表了两半测验内容取样的一致程度，因而属于内部一致性系数。

修正公式是斯皮尔曼-布朗公式：

（公式5-14）。

斯皮尔曼--布朗公式为经验公式，它的假设条件是两半测验的变异数相等，但实际资料有时未必完全符合这一条件。

当假设不成立时，可采用弗朗那根公式或卢伦公式，直接求得测验的信度系数。

2.同质性信度：

同质性主要代表测验内部所有题目间的一致性。

当各个题目的得分有较高的正相关时，不论题目的内容和形式如何，则测验为同质的。

相反，即使所有题目看起来好象测量同一特质，但相关很低或为负相关时，则测验为异质的。

几个计算同质性信度的公式如下：

（1）库德-理查逊公式（用于0、1记分）计算同质性信度，常用的是K-R20公式，在各测题难度相同或近似的情况下，还可采用计算更为简便的K-R21公式。

[K-R20公式、K-R21公式有别于克伦巴赫α系数的是，它们只能用于（）。

是非题]

（2）克伦巴赫α系数（不适用于多重记分）

四、评分者信度：

用于测量不同评分者之间所产生的误差。

（0.90以上，才认为是客观的）。

为了衡量评分者之间的信度高低，可随机抽取若干份测验卷，由两位评分者按评分标准分别给分，然后再根据每份测验卷的两个分数计算相关，即得评分者信度。

当多个评分者评定多个对象，并以等级法记分时，可采用肯德尔和谐系数作为评分者信度的估计。

[下列描述中正确的是：

（1）随机抽取若干份测验卷，由两位评分者按评分标准分别给分，然后再根据每份测验卷的两个分数计算相关，即得评分者信度；

（2）所有题目看起来好象测同一特质，但相关很低或负相关时，则测验为异质的；

（3）人的多数心理特征如智力、性格、兴趣等，具有相对的稳定性，间隔一段时间，不会有很大的变化；

（4）不同信度反映测验误差的不同来源。

第三单元信度与测验分数的解释

一、解释真实分数与实得分数的相关

信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的，也就是测验的总变异中真分数造成的变异占百分之几。

二、确定信度可以接受的水平

当rxx﹤.70时，测验不能用于对个人作出评价或预测，而且不能做团体比较；

当.70≤rxx<

.85时，可用于团体比较；

当rxx≥.85时，才能用来鉴别或预测个人成就或作为。

三、解释个人分数的意义

作用：

其一是估计真实分数的范围；

其二是了解实得分数再测时可能的变化情形。

测量标准误可以通过第一次测验的结果及信度估计到：

（公式5-15）。

例：

在一个智力测验中，某个被试的iQ为100，这是否反映了他的真实水平？

如果再测一次，他的分数将改变多少？

X―1.96SE＜XT≤X+1.96SE（公式5-16）

已知该智力测验的标准差为15，信度系数为.84，则其iq的测量标准误和可能范围为：

套（公式5-15）得SE=6，即：

IQ=100±

1.966＝100±

11.76≈88～112

我们可以说这个被试的真实性IQ可能性落在88与112之间，即若再测一次，他的智商低于88、高于112的可能性不超过5％。

四、比较不同测验分数的差异

差异分数的标准误：

（公式5-17）。

例；

某被试在韦氏成人智力测验中言语智商为102，操作智商为110。

已知两个分数都是以100为平均数，15为标准差的标准分数。

假设言语测验和操作测验的分半信度分别为0.87和0.88。

问其操作智商是否显著高于言语智商呢？

首先计算出差异分数的标准误：

SED=7.5

在统计上，经常要求两个分数的差异程度达到0.05的显著水平，才能承认不是误差的影响。

因此，将差异标准误（7.5）乘以1.96，结果为14.7，这表明个体在韦氏测验两半得分的差异高于大约15分，才能达到0.05显著水平。

上述被试的差异分数110-102=8是不显著的。

第四单元影响信度的因素

一、样本特征

（一）样本团体异质性的影响

若获得信度的取样团体较为异质的话，往往会高估测验的信度，相反则会低估测验的信度。

（二）样本团体平均能力水平的影响

因为每个题目具有不同的难度，对幼年者和能力水平较低者，其信度值相对较低。

二、测验长度

（一）测验越长，测题取样或内容取样越有代表性

（二）测验越长，被试的猜测因素影响就越小。

（三）测验太长，有时反而会引起被试者疲劳和反感而降低可靠性。

通过斯皮尔曼--布朗公式的导出公式可计算出最少应增加的题数：

（公式5--18）。

一个包括40个题目的测验信度为0.80，欲将信度提高到0.90，问至少需要增加多少题目？

根据斯皮尔曼布朗公式：

K=0.90（1—0.80）/0.80（1—0.90）=2.25

即要取得0.90的信度，测验长度就为原来的2.25，即需要增加40×

2.25=50个题目。

三、测验难度（地板效应与天花板效应）

洛德（Lord）提出在学绩测验中，为了保证其可靠性，各类选择题的理想平均难度为：

五择一测题，0.70；

四择一测题，0.74；

三择一测题，0.77；

是非题，0.85。

只有平均难度水平为50％时，才能使测验分数分布范围最大。

四、时间间隔：

两次测验相隔时间越短，其信度系数越大

注意事项

斯皮尔曼-布朗公式为校正分半信度的经验公式，它的假设是两半测验分数的变异数相等。

当假设不成立时，可以采用弗朗那根（Flanagan）公式或卢伦（kulon）公式之一，直接求得测验的信度系数。

对于一些复杂的、异质的心理学变量，采用单一的同质性测验是不行的，因而常常采用若干个相对异质的分测验。

第四节测验的效度

[美国心理学会在1974年发行的《教育与心理测量之标准》一书中将效度分为：

（1）内容效度；

（2）构想效度；

（3）效标效度。

第一单元效度的概念（有效性或者说准确性）

一、效度的定义：

在心理测验中，效度是指所测量的与所要测量的心理特点之间符合的程度，或者简单地说是指一个心理测验的准确性。

（是科学测量工具重要的必备条件）。

因为测验分数的总方差等于真实方差与误差方差之和（公式5-8），而真实方差又分成两部分，即有关方差与无关的但稳

展开阅读全文