04心理测验学.docx

资源描述

04心理测验学.docx

《04心理测验学.docx》由会员分享，可在线阅读，更多相关《04心理测验学.docx（48页珍藏版）》请在冰豆网上搜索。

04心理测验学.docx

04心理测验学

心理测验学

第一章总论

第一节心理测验的历史回顾

一、孔子根据自己的观察，把人分为中人，中人以上和中人以下三个类别，这实际上相当于现代测量学中的命名量表和次序量表。

二、孟子明确指出了心理能力和心理特征与物理现象一样，具有可测量的特性。

三、刘勰观察到左手画方右手画圆不易实现这种现象，而且认为其原因是一心不能二用，这恐怕应算是世界上最早的“分心测验”了。

刘勰的著作《新论`专学》中提到了类似现代“分心测验“的思想。

中国古代，“七巧板”是很常见的一种儿童玩具，其实它可以作为创造力测量的工具。

四、科举考试中的帖经和对偶，类似于现代西方言语测验中常见的填字和类比。

五、中国古代心理测验的特点：

（1）他们都是描述性的，没有定量的标准；

（2）中国古代的心理测验往往将心理特点与道德观念联系起来。

六、科学心理测验的产生与发展

1、科学心理测验产生的原因

（1）对智力落后者分类和训练的早期关注

1838年法国医生埃斯克罗第一次明确的对智力落后与精神病人做出了区分。

结论是个提示

用言语的能力是衡量他智力水平的最可靠标准。

（2）冯特的实验心理学

实验心理学的诞生是心理测验产生的另一个重要原因。

其主要目标是发现人们行为的一般规

律，关心的是行为的共同性而不是差异性。

后来发现各被试对于同一刺激的反应常常不同，并且这种差别反映了个体能力上的差别，因此就引发了个别差异的研究。

实验心理学的诞生和发展，还给心理测验带来了另一个副产品：

（严格的标准化程序）。

2、西方早期心理测验的尝试

（1）高尔顿的贡献

英国生物学家和心理学家高尔顿是倡导测验运动的主要人物。

高尔顿也是评定量表和问卷法应用的先驱，他为心理测验奠定了统计学基础。

（2）卡特尔和早期心理测验

另一个对促进心理测验发展做出巨大贡献的是美国心理学家卡特尔。

1890年，卡特尔在《心理》杂志上发表“心理测验与测量”一文，这是心理测验第一次出现于心理学文献中。

3、比内和世界上第一个智力测验

比内与助手西蒙经过精心研究，次年在《心理学年报》上发表了一个包括30个项目的量表。

这个量表很粗糙，尚不能准确地测量智商，但它在心理测验史上极其重要，是世界上第一个正式的心理测验。

比内–西蒙量表自1905年发表后，比内和西蒙亲自主持过两次修订，一次在1908年，一次在1911年。

此外，测验的结果用“智力水平”表示，但表示通常的翻译和提法为“智力年龄”。

七、心理测验的蓬勃发展

（1）操作测验的发展，由于理论上的缺陷和实际上的需要，所以就有操作测验的问世和发展。

（2）团体智力测验的发展，运用团体测验则在同一时间可以测量许多被试，这是心理测验方式的极大进步，也扩大了测验的应用范围。

（3）能力倾向测验的发展；20世纪30年代是因素分析盛行的10年，在此期间多项能力倾向测验被编制出来。

（4）人格测验的发展

心理测验的另一领域是涉及情感或行为等非智力方面的人格评估，通常包括对性格、气质、情绪状态、人际关系、动机、兴趣和态度的测量。

人格测验的先驱是（克雷佩林），他最早将自由联想测验施测于精神病人。

而且920年问世的罗夏测验则是投射测验的发端。

人格测验有：

MMPI、16PF、EPQ。

影响人格发展的几个因素：

①受到计算机的产生和发展影响。

②受到统计方法的改进影响。

③“因素分析”的理论从1904年斯皮尔曼提出智力二因论开始。

八、现代心理测验在中国的发展

（1）1916年，樊炳清先生首先介绍了比内-西蒙智力量表。

（2）1924年，陆志韦发表了《订正比内西蒙智力测验说明书》，30年代吴天敏再次作了修订。

（3）1931年，由艾伟、陆志韦、阿婆鹤琴、等倡议，组织并成立了中国测验学会。

（4）1979年，林传鼎、张厚粲等以国外资料为参考，编制了少年儿童学习能力测验。

第二节心理测验的性质、种类和功能

一、心理测验的概念及性质

1、什么是测量

（1）测量的定义

测量就是根据一定的法则，用数字对事物加以确定。

测量的三个因素：

所谓“一定的法则”，是指测量行为发生时采用的规则或方法。

所谓“事物”，是指我们要测量的感兴趣的事物的属性或特征。

还有一个数字问题，这里的数字可以表示数量，也可以不表示数量。

（2）测量的要素

测量有两个要素：

一是参照点，二是单位。

参照点可以分为两种，一种是绝对的零点；另一种是相对参照点。

最理想的参照点是绝对零点。

心理测验中所用的参照点都是相对的，很难找到绝对的零点，因而测量的结果常常不能以“倍数”的方式解释。

理想的单位需要有具备两个条件：

有明确的意义和有相等的价值。

（3）测量的量表

①命名量表是水平最低的一种测量量表，只是用数字来代表事物或对事物进行分类。

②顺序量表比命名量表高，它不仅表明类别，还能表明不同类别的大小等级，或具有某种属性的程序。

③等距量表又比顺序量表高一级。

它不仅有大小关系，而且又有相等的单位，因此可以加减运算，但没有绝对零点，所以不能做乘除运算。

④比例量表（又叫等比量表）是最精确的测量，即有相等的单位，又有绝对零点。

因此，可以进行乘除运算。

（4）心理量表的性质

一般来说，心理测验是在顺序量表上进行的。

最常用的转换方法是转换为标准分数

2、什么是心理测验

阿娜斯塔西认为心理测验实质上是行为样本的客观和标准化的测量。

心理测验三个基本的要素：

（1）行为样本，心理测验在测量个别差异的时候，往往也只是对少数经过慎重选择的样本进行观察，来间接推知被试的心理特征。

（2）标准化，标准化是指测验编制、实施、记分以及测验分数解释程序的一致性。

标准化的另一个重要步骤是建立有代表性的常模。

（3）客观性，客观的两个方面，一是在不受被试主观判断支配的范围内，测验的实施、评分、解释应是客观的，要尽量减少主试和被试的随意程度；二是客观性的另一个主要方面是测题或整个测验的难度水平的确定必须客观。

常模是否可靠，关键是有无一个代表性的被试样本，是依据随机抽样和分层抽样的原则挑选出来的。

3、心理测验的性质：

（1）心理测验的间接性；还无法直接测量人的心理，只能通过测量人的外显行为，即测量人们对测验题目的反应来推论出他的心理特质。

（2）心理测验的相对性；每一个人被测得的结果，都是与他所在团体或人群的大多数人的行为，或某种人为确定的标准相比较而言的。

（3）心理测验的客观性；测验的刺激是客观的，对反应的量化是客观的，对结果的推论是客观的。

二、心理测验的种类

1、按测验的功能分类：

①智力测验；②特殊能力测验；③人格测验。

（MMPI、16PF、EPQ、TAT、罗夏墨迹测验）

2、按测验材料的性质分类：

①文字测验；②操作测验。

3、按测验的严谨程度分类：

①客观测验；②投射测验。

4、按测验的方式分类：

①个别测验；②团体测验。

三、心理测验的功能：

心理测验最根本的功能是测量个体差异或行为反应，但从理论和实际应用角度看，它又有许多具体功能。

1、从实际应用角度看

（1）人才选拔：

根据对各种活动的分析，找出各自活动所要求的心理特征，然后根据这些特征设计出各种能力、人格和成就测验，以便预测人们从事各种活动的适宜性，从而提高人才选拔和职业训练的效率。

（2）岗位安置：

借助心理测量，我们可以做到人与工作的较好匹配。

（3）临床诊断：

在临床科研中，借助心理测验也可以观察病情程度，比较疗效。

根据测验结果，将障碍程度加以数量化，代替笼统的描述，更便于比较。

（4）教育评价：

通过测验，教师可了解学生的能力水平、性格特点、兴趣爱好、学习动机等多种资料，这有利于教师因材施教。

（5）心理咨询和治疗：

可以有助于求助者发现自己未知的潜能以及情绪困扰和人格方面的问题所在，以便于提供适当的指导、帮助和进行行为矫正训练。

2、从理论研究角度看

（1）搜集资料：

是收集个体差异资料最快捷的办法，如对智力的发展的速率、智力的个体差异、团体差异，以及影响智力发展的环境和遗传等问题的研究，大量资料都是由心理测验获得的。

（2）提出和验证假设：

心理学中的许多理论是在测验资料的基础上提出来的，并且用测验来验证。

（3）实验分组：

在心理学研究中，根据心理测验的结果，可以对被试进行分类，满足实验设计的要求。

总之，心理测验充实了心理研究的方法，在解决实际问题中发挥了较广泛的作用。

第三节正确对待和使用测验

一、错误的测验观

1、测验万能论；

有人认为心理测验可以解决一切问题，对测验甚至顶礼膜拜，奉若神明。

2、测验无用论

（1）某些人格测验侵犯了个人隐私

（2）测验为宿命论和种族歧视提供了心理学依据

3、心理测验即智力测验

有些人脑子中有这样一个公式：

心理测验=智力测验=智商（IQ）=遗传决定论。

二、正确的测验观

1、重要的心理学研究方法和决策的辅助工具。

除实验法之外，心理测验法的出现是心理科学发展史上的一大进步，是心理学研究中不可缺少的研究方法之一。

在进行升学、就业、招聘、晋级等工作时，若有相应的心理测验，就可以帮助有关部门作出科学的决策。

2、作为研究方法和测量工具尚不完善。

尽管心理测验是心理学研究的必要手段，而且实际生活中也在广泛应用，但是心理测验从理论到方法都还存在许多问题，尤其过分夸大心理测验的科学性和准确性是不对的。

3、科学地看待心理测验，防止乱用测验

（1）测验使用者必须具备一定的资格；

（2）慎重选择测验量表；

（3）与被试建立良好的协调关系；

（4）正确解释测验结果；

（5）注意测验的保密。

第二章心理测验的编制

第一节心理测验的对象、目的及目标

一、心理测验的对象

在编制测验前首先要明确测量的对象，也就是该测验编成后要用于哪些团体。

三个重要的维度：

①年龄；②教育水平；③文化背景。

二、测验的目的可分两类：

①显示性测验；②预测性测验。

显示性测验，是指测验题目和所要测量的心理特征相似的测验。

预测性测验，是指预测一些没被测量的行为的测验。

三、心理测验的目标是指编制的测验是测什么的，即用来测量什么样的心里变量或行为特征。

四、目标分析以测验不同而异，一般可分为3种情况：

1、工作分析

对于选拔和预测功用的预测性测验，它的主要任务就是要对所预测的行为活动作具体分析，我们

称之为任务分析或工作分析。

2、对特定概念下定义

如果测验是为了测量某种特殊的心理品质或特点，那么测验编制者就必须给所要测量的心理或行为物质下定义，然后必须发现该物质所包含的维量将通过什么行为表现出来或怎样进行测量。

3、确定测验的具体内容

如果测验是描述性的显示测验，它的目标分析的主要任务则是确定显示内容和技能，从中取样。

第二节测题的编写技术

题目的来源可分为三个方面：

已出版的标准测验、理论和专家的经验、临床观察和记录。

一、命题的原则及编写要领

1、命题的原则

（1）内容方面

在内容方面最主要是要求题目的内容符合测验的目的，避免贪多而乱出题目；其次，内容取样要有代表性；第三，题目间内容相互独立。

（2）文字方面

使用准确的当代语言；语句要简明扼要；最好是一句话说明一个概念。

（3）理解方面。

题目应有确切的答案，除创造力测验和人格测验外不应具有引起争议的可能；题目的内容不要超出受测团体的知识水平和理解能力；题目的格式要不被人误解。

（4）社会敏感性方面

在人格和态度等测量中，有时会不可避免的涉及一些敏感性问题，对于这种问题的解决方法：

①命题时假定被试具有某种行为，使他不得不在确定没有该行为时才否定，可避免答案过多的倾向；

②命题时假定规范不一致

③指出该行为是常见的，虽然是违规的。

2、测题的编制要领

对心理测验的题目进行分类的标准很多，常见的分类是根据对被试的要求不同来分，可以分为两大类：

提供型和选择型。

选择题我们比较熟悉，它由两部分构成：

题干和选项。

二、对选择题，我们既要编好题干，也要编好选项，有几点必须注意

1、题干所提的问题必须明确，尽量使用简单而且明晰的词语

2、选项切忌冗长，要简明扼要

3、每题只给一个正确答案，其它属诱答

4、各选项长度应相等，尽量不要有长有短

5、避免题干用词与选项用词一致，否则成了选择答案的线索。

6、选项最好用统一形式，如同是人名，同是日期，同是物理现象等等。

第三节测验的编排和组织

一、测验编排的一般原则：

（1）测题的难度排列易逐步上升。

（2）尽可能将同类型的测量组合在一起。

（3）各种类型测量本身的特点。

两种常见的试题排列方式：

并列直进式、混合螺旋式。

第三章测验的信度

第一节信度的概念

一、什么是信度

信度是指同一被试在不同时间内用同一测验（或用另一套相等的测验）重复测量，所得结果的一致程度。

（描述定义）

每一个测验的实得分数（X）总是由真实分数（T）和误差（E）两部分构成的，用公式表示如下：

X=T+E。

其中可用方差代表具体分数，公式如下：

Sx2=ST2+SE2

信度就可以被定义为：

一组测量分数的真分数方差与总方差（实得分数的方差）的比率，或者是真分数方差占总方差的百分比。

（操作定义）

二、信度的指标，信度有三种表示方法：

1、信度系数与信度指数。

。

信度指数的平方就是信度系数；

2、测量标准误；公式：

，

测量的标准误与信度之间成反比关系：

标准误越小，信度越高；标准误越大，信度越低。

三信度与测验分数的解释

1、解释真实分数与实得分数的相关

信度系数或以解释为总的方差中有多少比例是由真实分数的方差决定的，也就是测验的总变异中真分数造成的变异占百分之几。

2、比较信度可以接受的水平

一般原则是：

当rxx<0.70时，测验不能用于对个人作出评价或预测，而且不能作团体比较；当0.70≤rxx≤0.85时，可用于团体比较；当rxx≥0.85时，才能用来鉴别或预测个人成绩或作为。

3、解释个人分数的意义

从信度可以解释个人分数的意义，这就是测量标准误的应用。

它有两个作用：

其一是估计真实分

数的范围；其二是了解实得分数在测试可能的变化情形。

4、比较不同测验分数的差异

测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。

这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。

这就是差异分数的标准误问题。

第二节信度的类型及估计方法

一、重测信度

重测信度又称稳定性系数。

它的计算方法是采用重测法，即使用同一测验，在同样条件下对同一组被试前后施测两次测验，求两次得分间的相关系数。

最适宜的时距随测验的目的、性质和被试特点而异，一般是两周到四周较宜，间隔时间最好不超过六个月。

二、重测信度的前提假设是：

1、所测量的特性必须是稳定的；

2、每个人对前一次反应的遗忘程度相同；

3、在时间间隔中没有学习另外的与测验有关的东西，或者说每人学习其他东西的程度都一样。

二、复本信度

复本信度又称等值性系数。

它是以两个等值但题目不同的测验（复本）来测量同一群体，然后求得被试在两个测验上得分的相关系数，这个相关系数就代表了复本信度的高低。

复本信度反映的是测验在内容上的等值性，故称等值性系数。

如果两个复本的施测相隔一段时间，则称重测复本信度或稳定与等值系数。

三、内部一致信度

内部一致信度系数主要反映的是题目之间的关系，表示测验能够测量相同内容或物质的程度。

包括：

分半信度、同质信度。

1、分半信度

分半信度指采用分半法估计所得的信度系数。

在进行奇、偶分半时，常见的是将测题按其序号的奇偶分半，这种分法的前提是：

（1）测题并非随机排列，而是按某种顺序（如难度）排列

（2）如果是随机排列的题目，则必须是所有的题目平等的（要么难度相等，要么性质一样）

（3）如果测题有多个分量表，应该在分量表内部排好顺序，再把各分量表分两半组合起来求相关。

斯皮尔曼-布郎公式为经验公式，它的假设条件是两半测验分数的变异数相等，但实际资料有时未必符合这一条件。

2、同质性信度

同质性信度指测验内部所有题目间的一致性。

当各个测题的得分有较高的正相关时，不论题目的内容和形式如何，测验即为同质的；若所有题目看起来好象测量的是同一特质，但相关很低或为负相关时，测验即为异质的。

四、评分者信度，是用来测量不同评分者之间所产生的误差。

一般要求在成对的受过训练的评分者之间平均一致性达到0.90以上，才认为评分是客观的。

当多个评分者评定多个对象，并以等级法记分时，可采用肯德尔和谐系数作为评分者信度的估计。

第三节影响信度的因素

一、样本的特征对信度的影响；

1、样本团体分数分布的影响

任何相关关系都要受到团体中分数分布的影响，当分布范围增大时，其信度估计就较高；当分布范围减小时，相关系数随之下降，信度则较低。

2、样本团体异质性的影响

一般而言，若想获得信度的取样团体较为异质的话，往往会高估测验的信度，相反则会低估测验的信度。

3、样本团体平均能力水平的影响

测验的信度不仅受取样团体中个别差异程度的影响，也会由于不同团体间平均能力水平的不同而不同。

一、测验的长度

测验长度，亦即测验的数量，也是影响信度系数的一个因素。

一般来说，在一个测验中增加同质的题目，可以使信度提高。

（1）测验越长，的测题取样或内容取样越有代表性。

（2）测验越长，被试的猜测因素影响越小。

二、测验的难度

如果一个测验对某团体而言太容易，会使所得分数都集中在高分端；当题目太困难时，得分会集中在低分端。

从理论上说，只有难度水平为50%时，才能使测验分数颁布范围最大，求得的信度也最高。

三、测验的时间间隔

以再测法或复本法求信度，两次测验相隔时间越短，其信度系数越大；间隔时间越久，其它变因介入的可能性越大，受外界的影响也越大，信度系数便越低。

第四章测验的效度

第一节效度的概念

一、什么是效度

效度是指所测量的与所要测量的心理特点之间的符合程度，是指一个心理测验的准确性。

效度被定义为在一组测量中，与测量目标有关的真实方差（或称有效方差）与总方差的比率：

效度的操作定义

二、信度与效度的关系

1、信度是效度的必要而非充分条件

效度高必然信度高，而信度高并不一定保证效度高，说明信度高只是效度高的必要条件，并不是效度高的充分条件。

2、效度是受信度制约的

信度系数的平方根是效度系数的最高限度。

可见，一个测验的效度总是受它的信度所制约。

三、效度的性质

1、效度具有相对性

我们不能笼统地说某测验有没有效，而应说它对测量什么有没有效。

也就是说，在评鉴测验的效度时，必须考虑其目的与功能。

只有所测的结果符合该测验的目的，才能认为它是个有效的测量工具。

2、效度具有连续性

测验效度通常用相关系数表示，它只有程度上的不同，而没有“全有”或“全无”的区别。

因此，我们评价一个测验时，不应该说“有效”或“无效”，而应该用效度较高或效度较低来评价。

第二节效度的类型与估计方法

一、美国心理学会1974年发行的《教育与心理测量之标准》一书将效度分为三大类：

即内容效度、构想效度和效标效度。

一、内容效度

1、内容效度指的是测验题目对有关内容或行为取样的适用性，从而确定测验是否是所欲测量的行为领域的代表性取样。

2、内容效度的评估方法：

（1）专家判断法；

为了确定一个测验是否有内容效度，最常用的方法是请有关专家对测验题目与原定内容的符合性作出判断，看测验的题目是否代表规定的内容。

（2）统计分析法；

内容效度可由一组被试在独立取自同样内容范围的两个测验复本上得分之相关来作数量的估计。

另外，再测法也可用于内容效度的评估。

（3）经验推测法。

这种效度是通过实践来检验效度，如儿童发展量表是否有效，如果通过率是随着年龄的增加而，就可以推测该测验有内容效度。

二、什么是构想效度

构想效度也翻译成构思效度，还有人叫结构效度。

是指测验能够测量到理论上的构想或特质的程度，即测验的结果是否能证实或解释某一理论的假设、术语或构想，解释的程度如何。

三、构想效度的估计方法：

1、对测验本身的分析。

（1）测验的内容效度可以作为构思效度的证据。

（2）测验的同质性指标可以推断测验是测量单一特质还是测量多种特质，从而为评估测验构思效度提供证据。

（3）有时分析被试对题目的反应特点也可以作为构思效度的证据。

2、测验间的相互比较

（1）相容效度是构思效度的一个证据。

（2）区分效度是构思效度的又一个证据。

（3）因素分析法也是建立构思效度的常用方法。

3、效标效度的研究证明

（1）一个测验若效标效度理想，那么该测验所预测的效标的性质和种类就可以作为分析测验构思效度的指标。

（2）另一个证实构思效度的方法是心理特质的发展变化。

4、实验法和观察法证实

观察实验前和实验后分数的差异也是验证构思效度的方法。

四、什么是效标效度

效标效度又称实证效度，反映的是测验预测个体在某种情境下行为表现的有效性程度。

同时效度即测验所得分数可与效标同时验证，通常与心理特征的评估及诊断有关。

五、效标和效标测量

所谓效标，即衡量测验有效性的参照标准，指的是可以直接而且独立测量的我们感兴趣的行为。

因此有必要把效标细分为两个层次，其一是理论水平的“观念效标”，其二是操作定义水平的“效标测量”

一个好的效标测量必须具备以下条件：

有效性、可靠性、客观性、实用性。

六、常用的效标有以下几种：

（1）学业成就；

（2）实际工作表现；（3）特殊训练成绩；（4）精神病诊断。

（5）等级评定；（6）效标团体的比较；（7）先前有效的测验。

第三节效度的表示方法及应用

一、效度的表示方法

1、相关法

效度系数是最常用的效度指标，尤其是效标效度。

2、区分法

算出t值后，便可知道分数的差异是否显著。

若差异显著，说明该测验能够有效的区分由效标定义的团体；否则，测验是无效的。

重叠百分比可通过计算每一组内得分超过（或低于）另一组平均数的人数百分比得出。

重叠量越大，说明两组分数差异越小，即测验的效度越差。

3、命中率法

命中率的计算有两种方法，一是计算命中率，另一种是计算正命中率。

4、预期表法。

预期表示一种双向表格，预测分数排在表的左边，效标排在表的顶端。

预期表举例

某测验分数

效标成绩

低

中下

中上

高

80-90

60-79

40-59

39以下

从左下至右上对角线上各百分数字越大，而其它的百分数字越小，表示测验的效标效度越高；反之，数字越分散，则效度越低。

二、效度的应用

1、预测误差

（1）一种表达式是

，即效度系数的平方，统计学上称这种指标为决定系数。

表示测验正确预测或解释的效标的方差占总方差的比例。

（2）另一种表达方法是估计的标准误。

它是指所有具有某一测验分数的被试其效标分数（Y）分布的标准差，也即预测误差大小的估计值，是对真正分数估计的误差大小。

2、预测的效标分数

在测验工作中，人们感兴趣的是从测验分数预测效标成绩，因此最常用的是Y对X的回归方程。

3、预测效率指数

E值大小表明使用测验比盲目猜测能减少多少误差。

第四节影响效度的因素

一、影响效度的因素

1、测验本身的因素

（1）测验题目的质量

（2）测验的长度，一般而言，增加测验的长度通常可以提高测验的信度，而信度又制约着效度，因此增加测验的长度也能提高测验的效度。

2、测验实施中的干扰因素

（1）主试的影响因素

展开阅读全文