第五章心理测量学知识.docx

资源描述

第五章心理测量学知识.docx

《第五章心理测量学知识.docx》由会员分享，可在线阅读，更多相关《第五章心理测量学知识.docx（27页珍藏版）》请在冰豆网上搜索。

第五章心理测量学知识.docx

第五章心理测量学知识

第一节概述

第二节测验的常模

第三节测验的信度

第四节测验的效度

第五节项目分析

第六节测验编制的一般程序

第七节心理测验的使用

对心理测量的认识

人格心理学与心理测量的关系

1、人格心理学在心理学的地位（心理现象）；

2、人格心理学研究的方向（差异和功能）和目的（解释和预测）

心理测量的作用

1、开发功能；

2、完善功能；

3、干预功能；

4、诊断功能；

5、评估功能。

第一节概述

第一单元测量与测量量表

一、什么是测量

测量就是依据一定的法则用数字对事物加以确定。

该定义包括三个元素：

1、事物：

指的是我们要测量的事物的属性或特征。

2、数字：

代表某一事物或事物某一属性的量区分性、序列性、等级性、等距性、可加性）。

3、法则：

代表的是测量所依据的规则和方法。

二、测量要素

两个要素：

参照点（起点）、单位。

（一）参照点

绝对参照点相对参照点

（二）单位

好的单位必须具备两个条件：

一是有确定的意义，二是有相同的价值

三、测量量表

量表是一个定有单位和参照点的连续体。

斯蒂文斯（S.Stevens）划分的四种水平：

（一）命名量表——最低水平

（二）顺序量表——次低水平

（三）等距量表——较高水平

（四）等比量表——最高水平

第二单元心理测验的基本概念

一、心理测验的定义

所谓心理测验，就是依据心理学理论，使用一定的操作程序，通过观察人的少数有代表性的行为，对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。

心理测验的基本要素：

1、测量的对象是人的行为

2、选取的是行为样本

3、测量要标准化

4、测量要有常模

二、心理测验的性质

（一）间接性

（二）相对性

（三）客观性

第三单元心理测验的分类

一、按测验功能分类

智力测验特殊能力测验人格测验

二、按测验的材料分类

文字测验操作测验

三、按测验材料的严谨程度分类

客观测验投射测验

四、按测验的方式分类

个别测验团体测验

五、按测验的要求分类

最高行为测验典型行为测验

第四单元纠正错误的测验观

一、错误的测验观

（一）测验万能论

（二）测验无用论

二、正确的测验观

（一）心理测验是重要的心理学研究方法之一，是决策的辅助工具

（二）心理测验作为研究方法和测量工具尚不完善

第五单元心理测验在心理咨询中的应用

较多地使用以下三类测验：

一、智力测验

二、人格测验

三、心理评定量表

第六单元心理测验的发展史

一、科学心理测验的产生与发展

三个重要人物：

高尔登（F.Galton）

卡特尔（J.M.Cattell）

比内（A.Binet）

20世纪心理测验的主要发展：

1、操作测验的发展

2、团体智力测验的发展

3、能力倾向测验的发展

4、人格测验的发展

二、现代心理测验在我国的发展

源于1914年前后。

20世纪二、三十年代两次修订比内-西蒙量表。

1979年后，协作修订国外智力和人格测验工具。

近年来致力于编制适合我国文化背景的测验工具。

第二节测验的常模

第一单元常模团体

一、常模团体的性质

常模团体是由具有某种共同特征的人所组成的一个群体，或者是该群体的一个样本。

它用一个标准的、规范的分数表示出来，以提供比较的基础。

对测验编制者而言，常模的选择主要是基于对测验将要施测的总体的认识，常模团体必须能够代表该总体。

这种工作包括：

确定一般总体、确定目标总体、确定样本。

对测验的使用者来说，要考虑的问题是，现有的常模团体哪一个最合适。

标准化测验中，通常提供许多原始分数与各种常模团体的比较转换表，被试者的分数必须与合适的常模比较。

二、常模团体的条件

（一）群体的构成必须明确界定

（二）常模团体必须是所测群体的代表性样本

（三）样本的大小要适当

（四）标准化样组是一定时空的产物

三、取样的方法

（一）简单随机抽样

（二）系统抽样

（三）分组抽样

（四）分层抽样

取样的方法

•简单随机抽样

–在简单随机抽样中，每个人或抽样单位都有相同的机会作为常模中的一部分。

•系统抽样

–有时在总体数目为N的情况下，若要选择K分之一的被试作为样本，则可以在抽样范围内选择每个第K个人来构成样本。

•分组抽样

–有时总体数目较大，无法进行编号，而且群体又有多样性，这时可以先将群体进行分组，再在组内进行随机取样。

•分层抽样

–它是先将目标总体按某种变量（如年龄）分成若干层次，再从各层次中随机抽取若干被试，最后把各层的被试组合成常模样本。

包括分层比例抽样和分层非比例抽样

第二单元常模的类型

一、发展常模

（一）发展顺序量表

（二）智力年龄

（三）年级当量

二、百分位常模

三、标准分常模

四、智商及其意义

一、发展常模

（一）发展顺序量表

–它告诉人们多大的儿童具备什么能力或行为就表明其发育正常，相应能力或行为早于某年龄出现，说明发育超前，否则即为发育滞后。

（二）智力年龄

–基础年龄与在较高年龄水平的题目上获得的附加月份之和。

–将标准化样本中每个年龄组的平均原始分数作为年龄常模。

通过将原始分数与年龄常模对比，便可求得每个人的智龄。

（三）年级当量

二、百分位常模

•百分等级

–指在常模样本中低于这个分数的人数百分比。

•百分点

–百分点也称百分位数，与百分等级的计算方法正好相反。

百分等级是计算低于某测验分数的人数百分比，而百分点则是计算处于某一百分比例的人对应的测验分数是多少。

•四分位数和十分位数

–百分位数是将量表分成100份，而四分位数是将量表分成四等份，相当于百分等级的25%、50%和75%对应的三个百分分成的四段。

十分位数也可以依此类推出，1%～10%为第一段，91%～100%为第十段。

三、标准分数常模

•标准分数是将原始分数与平均数的距离以标准差为单位表示出来的量表。

因为它的基本单位是标准差，所以叫标准分数。

•1．线性转换的标准分数Z=A+BZ

•2．非线性转换的标准分数

–对每个原始分数值计算累积百分比；

–在常态曲线面积表中，求出对于该百分比的标准（z’）分数。

•T分数：

平均数为50，标准差为10

•标准九分：

以5为平均数，以2为标准差

•标准十分：

平均数为5.5，标准差为1.5；

•标准二十分：

平均数为10，标准差为3。

四、智商的计算及其意义

•比率智商

•离差智商

•必须指出，从不同测验获得的离差智商只有当标准差相同或接近时才可以比较，标准差不同，其分数的意义便不同（见附表）。

注意事项

•发展常模换算及解释时需要注意的问题

–只适合于所测特质随年龄发生变化的情况，对成人不适用；

–只适用于在典型环境下成长的儿童；

–一年的差异在不同年龄有不同的含义。

•百分位常模换算及解释时需要注意的问题

–属于顺序量表，缺少相等单位；

–靠近中央的原始分数差异扩大，而两极端的差异缩减；

–不能比较和说明不同被试间分数差异的数量。

•标准分常模换算及解释时需要注意的问题

–计算非线性转换的标准分数时，特质的分数实际上应该是常态分布；

–标准差不同，其分数的意义不同。

第三单元常模分数的表示方法

•转换表表示法

–一个转换表显示出一个特定的标准化样组的原始分数与其相对应的等值分数——百分位、标准分数、T分数或者其它任何分数。

因此测验的使用者利用转换表可将原始分数转换为与其对应的导出分数，从而对测验的分数作出有意义的解释。

•剖面图表示法

–剖面图是将测验分数的转换关系用图形表示出来。

从剖面图上可以很直观地看出被试在各个分测验上的表现及其相对的位置。

第三节测验的信度

•第一单元信度的概念

•一、信度的定义

•信度是指同一被试者在不同时间内用同一测验（或用另一套相等的测验）重复测量，所得结果的一致程度。

•在测量理论中，信度被定义为：

一组测量分数的真分数方差与总方差（实得分数的方差）的比率。

•二、信度的指标

•

（一）信度系数与信度指数

•信度指数是真分数标准差与实得分数标准差的比值。

•信度指数的平方就是信度系数

•

（二）测量标准误

•测量误差分布的标准差，即为测量的标准误。

•第二单元信度评估的方法

•一、重测信度

•二、复本信度

•三、内部一致性信度

•四、评分者信度

•第三单元信度与测验分数的解释

•第四单元影响信度的因素

第一单元信度的概念

一、信度的定义

信度是指同一被试者在不同时间内用同一测验（或用另一套相等的测验）重复测量，所得结果的一致程度。

在测量理论中，信度被定义为：

一组测量分数的真分数方差与总方差（实得分数的方差）的比率。

二、信度的指标

（一）信度系数与信度指数

信度指数是真分数标准差与实得分数标准差的比值。

信度指数的平方就是信度系数。

二、信度的指标

（二）测量标准误

测量误差分布的标准差，即为测量的标准误。

第二单元信度评估的方法

信度的类型与估计方法

一、重测信度

二、复本信度

三、内部一致性信度

四、评分者信度

•重测信度（test-retestreliability）

–又称稳定性系数。

它的计算方法是采用重测法，即使用同一测验，在同样条件下对同一组被试者前后施测两次测验，求两次得分间的相关系数。

–最适宜的时距随测验的目的、性质和被试特点而异，一般是两周到四周较宜，间隔时间最长不超过六个月。

信度的类型与估计方法

•复本信度（alternate-formreliability）

–又称等值性系数，它是以两个等值但题目不同的测验（复本）来测量同一群体，然后求得被试者在两个测验上得分的相关系数，这个相关系数就代表了复本信度的高低。

–如果两个复本的施测相隔一段时间，则称稳定与等值系数。

–在计算复本信度时，应该有半数的被试先作A本再作B本，另一半被试先作B本再作A本，由此可以抵消施测顺序的效应。

信度的类型与估计方法

•内部一致性信度（internalconsistencyreliability）

–分半信度（split-halfreliability）

•是在测验实施后将测验按奇、偶数分为等值的两半，并分别计算每位被试在两半测验上的得分，求出这两半分数的相关系数。

•分半法经常会低估信度，必须修正，借以估计整个测验的信度。

–同质性信度（homogeneityreliability）

•同质性主要代表测验内部所有题目间的一致性。

当各个测题的得分有较高的正相关时，不论题目的内容和形式如何，则测验为同质的。

相反，即使所有题目看起来好象测量同一特质，但相关很低或为负相关时，则测验为异质的。

信度的类型与估计方法

•评分者信度（scorerreliability）

–随机抽取若干份测验卷，由两位评分者按评分标准分别给分，然后再根据每份测验卷的两个分数计算相关，即得评分者信度。

–一般要求在成对的受过训练的评分者之间平均一致性达0.90以上，才认为评分是客观的。

–当多个评分者评定多个对象，并以等级法记分时，可采用肯德尔和谐系数作为评分者信度的估计。

第三单元信度与测验分数的解释

信度与测验分数的解释

•解释真实分数与实得分数的相关

–信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的，也就是测验的总变异中真分数造成的变异占百分之几。

•确定信度可以接受的水平

–当rxx<0.70时，测验不能用于对个人作出评价或预测，而且不能作团体比较；当0.70≤rxx<0.85时，可用于团体比较；当rxx≥0.85时，才能用来鉴别或预测个人成绩或作为。

信度与测验分数的解释

•解释个人分数的意义

–其一是估计真实分数的范围；其二是了解实得分数再测时可能的变化情形。

这就是测量标准误的应用。

•比较不同测验分数的差异

–这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。

这就是差异分数的标准误问题。

第四单元影响信度的因素

一、样本特征

（一）样本团体异质性的影响

（二）样本团体平均能力水平的影响

二、测验长度

（一）测验越长测题取样或内容取样越有代表性。

（二）测验越长被试的猜测因素影响就越小。

三、测验难度

难度与信度不存在简单的对应关系。

如果因为难度过大或过小，造成分数范围缩小，可使信度降低。

四、时间间隔

再测法求信度，间隔时间越短信度系数越大；间隔时间越久，信度系数越低。

注意事项

•斯皮尔曼-布朗公式为校正分半信度的经验公式，它的假设是两半测验分数的变异数相等。

当假设不成立时，可用下列两种公式之一，直接求得测验的信度系数。

弗朗那根（Flanagan）公式：

卢伦（Kulon）公式：

•对于一些复杂的、异质的心理学变量，采用单一的同质性测验是不行的，因而常常采用若干相对异质的分测验，使每个分测验内容具有同质性。

第四节测验的效度

•第一单元效度的概念

•一、效度的定义

•在心理测验中，效度是指所测量的与所要测量的心理特点之间的符合程度，或者简单地说是指一个心理测验的准确性。

•在测验理论中，效度被定义为在一组测量中，与测量目标有关的真实方差（或称有效方差）与总方差的比率。

•二、效度的性质

•

（一）效度具有相对性

•任何测验的效度都是针对一定的目标而言。

•

（二）效度具有连续性

•只有程度上的不同，没有“全有”或“全无”的区别。

•测验效度是测验结果的有效性程度。

•第二单元效度评估的方法

•一、内容效度

•

（一）什么是内容效度

•指的是测验题目对有关内容或行为取样的适用性，从而确定测验是否是所欲测量的行为领域的代表性取样。

•这种测验的效度主要与测验内容有关，故而得名。

•

（二）内容效度的评估方法

•1、专家判断法

•定义好测验内容的总体范围；

•编制双向细目表，确定内容的具体细节各自所占的比例；

•由每位评判者在评定量表上作出判断。

•2、统计分析法

•计算两个评分者之间评定的一致性（评分者信度）

•两个测验复本上得分之相关（复本信度）

•再测法也可用于内容效度的评估（测验-学习-再测验）

•3、经验推测法

•这种效度是通过实践来检验效度

•（三）内容效度的特性

•内容效度与所有效度一样，并非普遍适用。

只有编制者与使用者定义的内容范围相同，编制者报告的内容效度对使用者才有意义。

•内容效度也有时间上的特定性。

•内容效度与表面效度不同。

•二、构想效度

•

（一）什么是构想效度

•是指测验能够测量到理论上的构思或特质的程度，即测验的结果是否能证实或解释某一理论的假设、术语或构思，解释的程度如何。

•要回答的问题是：

该测验欲测量什么心理构想？

对该构想测得有多好？

测验分数中有多少比例的变异数是来自测验所欲测之构想？

•

（二）构想效度的评估方法

•1、对测验本身的分析

•测验的内容效度

•测验的内部一致性指标

•分析被试者对题目的反应特点

•2、测验间的相互比较

•相容效度是构思效度的一个证据

•区分效度是构思效度的又一个证据

•因素分析法也是建立构思效度的常用方法

•3、效标效度的研究证明

•●根据效标分成相对照的两组，比较测验成绩

•●观察分析测验高分组与低分组的心理特质

•4、实验法和观察法证实

•三、效标效度

•

（一）什么是效标效度

•亦称实证效度，反映的是测验预测个体在某种情境下行为表现的有效程度。

•分为同时效度和预测效度。

•一个好的效标必须具备4个条件。

•效标本身必须有效；

•效标必须具有较高的信度，不随时间等因素而变化；

•效标可以客观地加以测量，可用数据或等级来表示；

•效标测量的方法简单，省时省力，经济实用。

•二）效标效度的评估方法

•1、相关法：

•相关法是评估效标效度最常用的方法，它是求测验分数与效标资料间的相关，这一相关系数称为效度系数。

•2、区分法：

•分析高分组与低分组分布的重叠量，或者计算每一组内得分超过（或低于）另一组平均数的人数百分比，或者计算两组分布的共同区的百分比。

重叠量越大，说明两组分数差异越小，即测验的效度越差。

•3、命中率法：

•命中率法是当测验用来做取舍的依据时，用其正确决定的比例作为效度指标的一种方法。

•第三单元效度的功能

•一、预测误差

•效度系数的实际意义常常以决定性系数来表示，意旨相关系数的平方，其表达式是rxy2，它表示测验正确预测或解释的效标的方差占总方差的比例。

•另一种表达方法是估计的标准误，简写为Sest，它是指所有具有某一测验分数的被试其效标分数（Y）分布的标准差，也即真正效标分数落在某一范围内有多大可能性。

•二、预测效标分数

•在测验工作中，人们感兴趣的是从测验分数预测效标成绩，因此最常用的是Y对X的回归方程。

•三、预测效率指数

•第四单元影响效度的因素

一、测验本身的因素

为了提高效度，要做到：

1.测验材料必须对整个内容具有代表性；

2.测题设计时应尽量避免容易引起误差的题型（如是非题）；

3.测题难度要适中，具有较高的区分度；

4.测验长度要恰当，即要有一定的测题量；

5.测题的排列按先易后难顺序。

二、测验实施中的干扰因素

（一）主试的影响因素

主试不符合标准化要求的任何做法

（二）被试的影响因素

兴趣、动机、情绪、态度和健康状况等。

三、样本团体的性质

（一）样本团体的异质性

异质性越高，分数分布范围大，测验效度越高。

1、如果只以选拔出来的被试为样本团体参加研究，会降低测验的效度。

2、选拔标准太高，样本团体的同质性增加，会降低测验的效度。

三、样本团体的性质

（二）干涉变量

包括年龄、性别、教育水平、智力、动机、兴趣、职业等。

美国心理学家吉塞利（E.E.Ghiselli）寻找干涉变量的方法：

1、用回归方程求每个人的预测效标分数，与实际效标分数相比较；

2、根据样本团体的组成，设立对照组，分别计算效度。

3、根据显而易见的干涉变量将其分为预测性高和预测性低的两个亚团体。

三、效标的性质

包括年龄、性别、教育水平、智力、动机、兴趣、职业等。

效标与测验分数之间是否呈线性关系是很重要的因素。

皮尔逊积差相关系数的前提是假设两个变量的关系是线性的分布。

效标测量本身的可靠性如何亦是值得考虑的问题。

专栏5-4信度与效度的关系

•信度是效度的必要而非充分条件

–效度高必然信度高，而信度高并不一定保证效度高，说明信度高只是效度高的必要条件，并不是效度高的充分条件。

•效度是受信度制约的

–信度系数与效度系数之间有这样一种关系：

信度系数的平方根是效度系数的最高限度。

用公式表示如下：

信度系数的平方根又称信度指数，也就是说，效度系数的最高限度是信度指数。

第五节项目分析

第一单元项目的难度

一、难度的定义

二、计算方法

三、难度水平的确定

第二单元项目的区分度

一、区分度的定义

二、计算方法

三、区分度与难度的关系

第五节项目分析

第一单元项目的难度

一、难度的定义

二、难度的计算

（一）二分法记分的项目

（二）非二分记分的项目

第五节项目分析

第一单元项目的难度

三、难度水平的确定

（一）项目的难度

P值越接近于0.50，区分力越好。

（二）测验的难度

第五节项目分析

第二单元项目的区分度

一、区分度的定义

项目区分度也叫鉴别力。

取值范围在–1至+1之间。

二、计算方法

（一）鉴别指数D=PH-PL

（二）相关法

点二列相关二列相关相关法：

三、区分度与难度的关系

注意事项

•当测验用于选拔或诊断时，应较多地选择难度值接近录取率的项目。

如选拔提高难度，诊断应降低难度。

•对于选择题来说，P值一般应大于概率水平。

如是非题，难度应该为0.75最为合适；而对于四选一的题目，其难度约为0.63时最为合适。

•为了使测验具有更大的鉴别力，应该选择难度在0.50左右的试题比较合适。

但是，在实际工作中并非如此简单。

如果难度都是0.50，而试题间都完全相关，则易形成“U”分布。

•区分度取值范围介于-1～+1之间，假如项目得分与实际能力之间呈负相关，则区分度为负。

这种情况一般很少发生，如果出现，该题目应该淘汰。

第六节测验编制的一般程序

•第一单元测验的目标分析

•第二单元测验的编写

•第三单元测验的编排和组织

第六节测验编制的一般程序

第一单元测验的目标分析

一、测验的对象

韦氏成人智力量表分为城市版和农村版

二、测验的用途

（一）显示性测验

（二）预测性测验

第一单元测验的目标分析

三、测验的目标

目标分析以测验不同而异，分三种情况：

（一）工作分析

1.确定哪些心理特征和行为可以使要预测的活动达到成功

2.建立衡量被试是否成功的标准——效标

（二）对特定概念下定义

必须发现所要测量的心理特质所包含的维量将通过什么行为表现出来或怎样进行测量。

（三）确定测验的具体内容

编制双向细目表（例如表5-8）

涉及从写出、编辑到预试、修改等一个循环过程。

一、搜集资料

（一）已出版的标准测验

（二）理论和专家的经验

（三）临床观察和记录

二、命题原则

（一）内容方面

符合测验目的；取样有代表性；题目间相互独立

（二）文字方面

准确；简明；一句话说明一个概念；尽量少用双重否定句

（三）理解方面

应有确切答案；题目内容不超出受测团体的知识水平和理解力；题目格式不会被人误解

（四）社会敏感性方面

菲利普（Philips,D.L）提出的几条策略：

1.命题时假定被试有某种行为，使他不得不在确实没有该行为时才否定。

如“你平均多久手淫一次？

”

2.命题时假定规范不一致，如“有的医生认为吸烟有害，另一些医生认为有益，你呢？

”

3.指出该行为时常见的，“多数人在看色情电影是有性冲动，你呢？

”

三、编制要领

（一）选择题

1.题干明确，意义完整

2.选项简明扼要

3.每题只给一个正确答案

4.各选项长度尽量相等

5.避免题干含有选择答案的线索

6.选项最好用同一形式，随机排列

（二）是非题

1.内容应以有意义的概念、事实或基本原则为基础；

2.每道题只能包含一个概念；

3.尽量避免否定的叙述，尤其要避免用双重否定的叙述；

4.若是表达意见的题目，最好说明意见的来源和根据；

5.“是”“非”题的数目应有适当比例，基本相等，随机排列。

（三）简答题

1.宜用问句形式。

如果用填充形式，空格尽量放到最后；

2.如果是填充形式，空格不宜太多，空出来的应是关键词句；

3.每题应只有一个正确答案，而且答案要简短而具体。

对不完整的答案，应事先规定评分标准。

（四）操作题

1.明确所要测的目标，将其操作化；

2.尽量

展开阅读全文

第五章 心理测量学知识.docx

第五章心理测量学知识.docx