心理测量学Word格式.docx
《心理测量学Word格式.docx》由会员分享,可在线阅读,更多相关《心理测量学Word格式.docx(27页珍藏版)》请在冰豆网上搜索。
法则。
1.“事物”,指的是我们要测量的对象,更准确地说,就是引起我们兴趣的事物的属性或特征。
在心理测量中,我们所感兴趣的、所欲测量的当然就是心理能力和人格特点等。
由于这些心理现象不能直接测量,因此我们测量的实际是心理现象的外显行为。
2.“数字”,是代表某一事物或事物某一属性的量。
(1)这些数值具有自然数的特点,如区分性,即1就是1,2就是2,没有任何数与1或2这个数相同,被1指派的事物在所测量的方面都是相同的;
(2)数也有序列性或等级性,如1<
2<
3;
(3)数也具有等距性,1和2,2和3之间的差的绝对值总是相等的;
(4)数还有可加性,某数与它数之和,必得另一个独特的数。
数的这种逻辑性,是我们进行运算的基础。
必须指出,在测量中,我们是根据事物的属性和属性的大小来分派数字的,数字是否具有如上自然数系统的功能,还必须考虑到事物的性质或指派数字的原则。
3.“法则”,代表的是测量所依据的规则和方法。
例如,用秤量物体的重量,依据的是杠杆的原理;
用温度计测物体的温度,依据的是热胀冷缩规律;
用尺子量物体的长度,是以相等的小单位构成刻度,把尺子的零点对准物体的一端,看物体的另一端所对着的刻度,即得出长度。
而人的心理特征的测量,如智力测验,就是根据智力理论编制,以得分多少衡量智力水平。
法则有好坏之分,使用较好的法则可以得到比较理想的结果,而较差的法则所获得的结果则不令人满意。
许多事物易于测量,因其使用的法则易于建立和遵守;
心理现象难以测量,是因为我们很难设计清晰而良好的法则。
随着人类认识的不断深入,测量法则不断完善,测量也就越来越精确。
二、测量要素
任何测量都应该具备这样两个要素:
即参照点和单位。
(一)参照点
1.含义:
要确定事物的量,必须有一个计算的起点,这个起点称做参照点。
参照点不同,测量的结果便无法相互比较。
2.参照点有两种
(1)绝对零点,例如测量轻重、长度等都以零点为参照点,这个零点的意义为“无”,表示什么都测不到。
(2)人定的参照点,即相对零点,例如海拔高度,就是以海平面作为测量陆地高度的起点。
温度既可以从绝对零度计量,也可以从摄氏零度计量,其中后者是以水的冰点为测量零点。
理想的参照点是绝对零点。
但在心理测量中很难找到绝对零点,多采用人为标定的绝对零点。
如智力年龄为0,实际上指的是零岁儿童的一般智力水平,而不能说没有智力。
(二)单位
单位是测量的基本要求,没有单位就无法进行测量。
1.单位的种类、名称繁多,即使是测量同一事物,也可以用许多单位。
如时间的单位有秒、分、时、日、月、年等。
2.好的单位必须具备两个条件:
(1)有确定的意义,即对同一单位,所有的人的理解意义要相同,不能出现不同的理解;
(2)有相同的价值,即相邻两个单位点之间的差别总是相等的。
一般来说,心理测量的单位不够完善,既无统一的单位,也不符合等距的要求。
如智龄是以年龄作为智力的单位,因为智力发展的速度先快后慢,4岁与5岁之间的差别,明显大于14岁与15岁之间的差别。
三、测量量表
测量的本质是根据某一法则将事物数量化,即在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。
如要测量某事物的属性,只要将欲测量的该事物的属性放在这个连续体的适当位置上,看它们距参照点的远近,便会得到一个测量值,这个测量值就是对这一属性的数量化的说明。
由于制定量表的单位和参照点不同,量表的种类也不同。
根据量表的精确程度,斯蒂文斯(S.S.Stevens)将测量从低级到高级分成四种水平,即命名量表、顺序量表、等距量表和等比量表。
(一)命名量表
这是测量水平最低的一种量表形式,只是用数字来代表事物或把事物归类。
这种量表又可分为两种:
1.代号——用数字来代表个别事物,如学生和运动员的编号等。
2.类别——用数字来代表某一具有某种属性的事物的全体,即把某种事物确定到不同性质的类别中,如用1代表男,用2代表女,或用不同数字代表不同职业等。
在命名量表中,数字只用来作标记和分类,而不能作数量化分析,既不能说A>
B>
C,也不能做加、减、乘、除的运算。
(二)顺序量表
它比命名量表水平高,其中的数字不仅指明类别,同时指明类别的大小或含有某种属性的程度,如学生的考试名次、工资级别、能力等级、对某事物的喜爱程度等。
这里的数字包含有数量关系,代表符号是“>
”或“<
”,如A>
C等,主要用于分等,或排出顺序。
在顺序量表中,既无相等单位,又无绝对零点,数字仅表示等级,并不表示某种属性的真正量或绝对值。
例如100米短跑比赛中李平得了第一名,王红得了第二名,这样我们可以知道李平排在王红的前面,但是我们不知道李平比王红快多少。
(三)等距量表
它比顺序量表又进一步,不但有大小关系,而且具有相等的单位,其数值可以相互做加、减运算,但没有绝对的零点,因此不能做乘、除运算。
典型的例子是摄氏温度10℃与15℃的差别,同15℃与20℃的差别是一样的,我们可以说某物温度比另一物高多少,但不能说某物温度是另一物的多少倍,因为它的零点是人定的0℃并不意味着没有温度。
等距量表的数值加或减一个常数或用一个常数乘或除,不会破坏原来数据之间的关系,因此一个量表上的数值可以转换为另一个具有不同单位的量表上的数值,而且几个不同单位的数值可以转换到一个量表上以便于比较。
(四)等比量表
是最高水平的量表,既有相等单位又有绝对零点。
此种量表在物理测量中容易见到,长度、重量、时间等都是等比量表。
所得的数值可以做加、减、乘、除运算。
如体重:
甲80公斤,乙40公斤,我们既可以说甲的体重比乙多40公斤,也可以说甲的体重是乙的2倍。
那么,心理测量中使用的量表一般是什么量表呢?
一般说来,心理测量是在顺序量表上进行的。
因为对于人的智力、性格、兴趣、态度等来说,绝对零点是难以确定的,而且,在心理测量中,相等单位也是很难获得的。
不过,利用某种统计方法,可以把这种顺序量表得到的数据换算为等距数据来进行统计。
量表
绝对零点
相等单位
加减运算
乘除运算
统计分析
命名量表
无
否
次数、众数、百分比、
顺序量表
中位数、百分位数、等级相关
等距量表
有
可以
平均数、标准差、积差相关、t检验、F检验
等比量表
几何平均数
高水平的量表可进行低水平量表所能进行的统计分析,但是会丢失一部分数据信息.
第二单元 心理测验的基本概念
一、心理测验的定义
心理测验,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。
1.心理测验测量的是人的行为,严格地说,只是测量了做测验的行为,也就是一个人对测验题目的反应。
2.心理测验在测量个别差异的时候,往往只是对少数经过慎重选择的行为样本进行观察,来间接推知被试者的心理特征。
3.为了使不同的被试者所获得的分数有比较的可能性,测验的条件对所有的被试者都必须是相同的。
4.个人在测验中所得到的原始分数并不具有什么意义,只有将它与其他人的分数或常模相比较才有意义。
二、心理测验的性质
(一)间接性
特质乃是个体特有的、稳定的、可辨别的特征。
但它又是一个抽象的产物,一个构思,而不是一个直接测量到的有实体的个人特点。
由于特质是从行为模式中推论出来,所以心理测量永远是间接的。
(二)相对性
在对人的行为做比较时,没有绝对的标准,我们有的只是一个连续的行为序列。
测验就是看每个人处在这个序列的什么位置上,由此测得一个人智力的高低、兴趣的大小或性格的特性等。
而这一连续序列是由某一团体或一群人的某类行为特点或心理特征构成的,所以每一个人被测得的结果都是与所在团体或人群的大多数人的行为或某种人为确定的标准相比较而言的。
(三)客观性
测验的客观性实际上就是测验的标准化问题。
量具必须标准化,这是对一切测量的共同要求。
心理测量的标准化包括以下内容:
1.测验用的项目或作业。
施测说明、施测者的言语态度及施测时的物理环境等,均经过标准化,测验的刺激是客观的。
特别是对测验题目的选择不是随意的,而是在预测基础上,通过实证分析确定的。
2.评分记分的原则和手续经过了标准化,对反应的量化是客观的。
评分方面的客观性随测验种类和项目类型而异。
一般来说,投射测验的客观性差些,而选择题的客观性较好。
3.分数转换和解释经过了标准化,对结果的推论是客观的。
测验常模是通过对总体的代表性样本的预测确定的,测验的有效性也是在一定程度上经过实践的检验,根据这些资料所做出的推论,自然较为可靠和客观。
第三单元 心理测验的分类
心理测验种类较多,据统计,仅以英语发表的测验就已达5000余种。
其中,有许多因过时而废弃不用;
有许多本来就流传不广,鲜为人知;
有一部分测验应用广泛,经过一再修订,并为许多国家译制使用。
1989年出版的《心理测验年鉴》第十版(MMY—10)收集了常用的各种心理测验有近1800种。
为了方便起见,可以从不同的角度将其归纳为不同的类型。
一、按测验的功能分类
(一)智力测验
这类测验的功能是测量人的一般智力水平。
如Binet-Simon智力测验、Stanford-Binet智力量表、Wechsler儿童和成人智力量表等,都是现代常用的著名智力测量工具,用于评估人的智力水平。
(二)特殊能力测验
这类测验偏重测量个人的特殊潜在能力,多为升学、职业指导以及一些特殊工种人员的筛选所用。
常用的如音乐、绘画、机械技巧、文书才能测验。
这类测验在临床上应用的较少。
(三)人格测验
这类测验主要用于测量性格、气质、兴趣、态度、品德、情绪、动机、信念等方面的个性心理特征,亦即个性中除能力以外的部分。
一般有两类,一类是问卷法、一类是投射法。
前者如MMPI、16PF、EPQ,后者如罗夏测验、主题统觉测验(TAT)。
二、按测验材料的性质分类
(一)文字测验
文字测验所用的是文字材料,它以言语来提出刺激,被试者用言语做出反应。
MMPI、EPQ、16PF及Wechsler儿童和成人智力量表中的言语量表部分均属于文字测验。
此类测验实施方便,团体测验多采用此种方式编制,还有一些有肢体残疾而无言语困难的病人只能进行文字测验。
其缺点是容易受被试者文化程度的影响,因而不同教育背景下的人使用时,其有效性将降低,甚至无法使用。
(二)操作测验
操作测验也称非文字测验。
测验题目多属于对图形、实物、工具、模型的辨认和操作,无须使用言语作答,所以不受文化因素的限制,可用于学前儿童和不识字的成人。
如罗夏测验、TAT、Raven测验及Wechsler儿童和成人智力量表中的操作量表部分均属于非文字测验。
此种测验的缺点是大多不宜团体实施,在时间上不经济。
有时两类测验常常结合使用。
例如Binet-Simon智力量表开始主要是文字测验,但以后修订的Binet-Simon智力量表,特别是最近的修订本则增加了操作测验成分。
Wechsler的三套智力量表(即幼儿、儿童和成人)每套均分成文字的和操作的两类测验。
三、按测验材料的严瑾程度分类
(一)客观测验
在此类测验中,所呈现的刺激词句、图形等意义明确,只需被试者直接理解,无须发挥想像力来猜测和遐想,故称客观测验,绝大多数心理测验都属这类测验。
(二)投射测验
在此类测验中,刺激没有明确意义,问题模糊,对被试的反应也没有明确规定。
被试者做出反应时,一定要凭自己的想像力加以填补,使之有意义。
在这过程中,恰好投射出被试者的思想、情感和经验,所以称投射测验。
投射测验种类较少,具有代表性的有罗夏测验、主题统觉测验、自由联想测验和句子完成测验。
四、按测验的方式分类
(一)个别测验
1.指每次测验过程中是以一对一形式来进行的,即一次一个被试。
这是临床上最常用的心理测验形式,如Binet-Simon智力量表、Wechsler智力量表。
2.其优点在于主试对被试的言语和情绪状态有仔细的观察,并且有充分的机会与被试合作,所以其结果可靠。
3.缺点是时间不经济,不能在短时间内收集到大量的资料,而且测验手续复杂,主试者需要较高的训练与素养,一般人不易掌握。
(二)团体测验
1.指每次测验过程中由一个或几个主试者对较多的被试者同时实施测验。
2.心理测验史上著名的陆军甲种和乙种测验,教育上的成就测验都是团体测验。
3.优点在于时间经济,主试者不必接受严格的专业训练即可担任。
4.其缺点为主试者对被试者的行为不能作切实的控制,所得结果不及个别测验可靠,故在临床上很少使用。
团体测验材料,也可以个别方式实施,如MMPI、EPQ、16PF等。
但个别测验材料不能以团体方式进行,除非将实施方法和材料加以改变,使之适合团体测验。
五、按测验的要求分类
(一)最高作为测验
此类测验要求被试者尽可能做出最好的回答,主要与认知过程有关,有正确答案。
智力测验、成就测验均属最高行为测验。
(二)典型行为测验
此类测验要求被试者按通常的习惯方式做出反应,没有正确答案。
一般来说,各种人格测验均属典型行为测验。
第四单元 纠正错误的测验观
一、错误的测验观
自测验问世以来,人们对其毁誉不一。
所以如此,其中主要原因是由于对它缺乏客观态度。
不客观态度大体分为两类:
一是测验完美无缺,另一是测验无用且有害。
(一)测验万能论
自测验问世以来,就有人认为心理测验可以解决一切问题,对测验甚至顶礼膜拜,奉若神明。
他们迷信测验,把测验分数绝对化,例如IQ的差别只有1分,也会认为这种差别很有意义。
在心理测验风靡西方世界,人们狂热地编制心理测验的20世纪20年代,测验泛滥成灾,忽略了心理测验还只是个粗糙的工具这一事实。
当测验结果与那些毫无根据的期望大相径庭的时候;
对测验的失望、怀疑,乃至敌视情绪便油然而生。
(二)测验无用论
随着心理测验的不断应用,人们逐渐认识到测验的局限性和不足,甚至反对使用心理测验。
其一,某些人格测验侵犯了个人隐私,违背民主原则。
他们认为人的个性和态度是自己的事,与学习或工作的成功无关,不应在作实际决定时加以考虑。
为此有些国家或地区的政府都出面干预。
其二,测验为宿命论和种族歧视提供了心理学依据。
如早期智力测验的结果表明,黑人的平均IQ低于白人的平均IQ,于是下结论说黑人确实比白人差。
但这种观点很快就受到正直的心理学家的批评,他们指出这是因为常模中黑人太少所致。
(三)心理测验即智力测验
过去,有些人脑子中有这样一个公式:
心理测验=智力测验=智商(IQ)=遗传决定论。
这也是一种误解,心理测验为此蒙受了不少不白之冤。
其实心理测验像其他科学工具一样,必须加以适当地运用才能发挥其功能。
如果滥用或由不够资格的人员实施、解释,则会引起不良后果。
二、正确的测验观
(一)心理测验是重要的心理学研究方法之一,是决策的辅助工具
除实验法以外,心理测验法的出现是心理科学发展史上的一大进步,是心理学研究中不可缺少的研究方法之一。
有许多高级心理过程目前尚无法在实验室进行研究,心理测验就是很好的办法,它可以弥补实验法的不足。
另外,我们在进行升学、就业、招聘、晋级等工作时,传统的方法往往是不准确,不可靠,科学性较差的,以一次考试定终身已被公认为不再适合了。
这时若有相应的心理测验,就可以帮助有关部门作出科学的决策。
(二)心理测验作为研究方法和测量工具尚不完善
尽管心理测验是心理学研究的必要手段,而且实际生活中也在广泛应用,但是心理测验从理论到方法都还存在许多问题,尤其过分夸大心理测验的科学性和准确性是不可取的。
因此,我们对心理测验的得分做出解释时要小心,尤其是拿测验预测个别人的行为或心理活动时更应慎之又慎。
心理测验的最大问题是理论基础不够坚实。
比如,关于智力和人格的定义尚未争论清楚,还没有得到一个统一公认的定义,但智力测验和人格测验已被广泛使用。
其实,任何一种工具开始时总是非常粗糙,即使被公认为最科学的物理学中也是这样,只有在使用中才能发现它的不足,从而不断改进和完善。
心理测验同样有待于在使用中发展,在使用中完善。
第五单元 心理测验在心理咨询中的应用
心理咨询和治疗的有效性,不仅取决于咨询人员对心理咨询的性质、过程的正确认识,熟练掌握心理咨询的原则、方法和技巧,同时还有赖于对求助者心理特性、行为问题性质的正确评估和诊断,以便于提供适当的指导、帮助和行为矫正训练。
因此,心理测验在心理咨询中有重要意义。
一、我国目前运用较多的3类心理测验
目前常用量表有:
吴天敏修订的中国比内量表,龚耀先等人修订的韦氏成人智力量表(WAIS-RC)、韦氏儿童智力量表(C-WISC)和韦氏幼儿智力量表(C-WYCSI),林传鼎等人修订的韦氏儿童智力量表(WISC-CR),以及张厚粲主持修订的瑞文标准型测验(SPM)和李丹等修订的联合型瑞文测验(CRT)等。
这类测验可在求助者有特殊要求时以及对方有可疑智力障碍的情况下应用。
(二)人格测验
目前应用较多的有:
艾森克人格问卷(EPQ),卡特尔16人格因素问卷(16PF);
以及明尼苏达多项人格调查表(MMPI)等。
人格测验有助于治疗者对求助者人格特征的了解,以便于对其问题有更深入的理解,并可针对性地开展咨询与心理治疗工作。
其中,MMPI还有助于治疗者了解对方是否属于精神异常范围。
(三)心理评定量表
心理评定量表主要包括有精神病评定量表、躁狂状态评定量表、抑郁量表、焦虑量表、恐怖量表等。
这类量表用法及评分简便,多用于检查对方某方面心理障碍的存在与否或其程度如何,并可反映病情的演变。
二、心理测验在心理咨询中的应用
1.心理测验是分析求助者心理问题的重要工具。
它不但可以检验咨询人员的判断是否正确,还能帮助其对求助者的问题进行深入的分析。
2.作为咨询者,有一点必须明确,那就是心理测验在咨询和心理治疗过程中并不是必不可少的一个环节,如果通过与咨询或治疗对象的交谈,对其问题已形成明确的看法,就可放弃不必要的心理测验。
有时过多的使用还会影响咨询、治疗的过程和效果。
3.一般来讲,心理测验应在咨询关系尚未建立之前实施,进入正式的心理咨询程序之后,要尽量避免心理测验。
当然也有例外,咨询过程无法进行下去,咨询者也不知如何进行下去的时候,由心理测验的结果可以再次确认与求助者的咨询关系,以更好地达到对求助者的理解。
这种情况下,如果可能的话,心理测验最好由其他心理学工作者、专家实施。
第六单元 心理测验的发展史
心理测验虽然是世界上最年轻的学科之一,也是心理学中较年轻的分支,但其思想和实践源远流长。
我国始于汉代、兴于隋唐的科举取士制度就被中外学者公认为世界上最早的心理测验的实践。
在古希腊,测验作为教育的附加物,既测智力技能又测运动才干。
在中世纪,欧洲的某些大学已开始使用考试方法。
但科学的心理测验则是工业革命成功后的19世纪的欧洲发展起来的。
一、中国古代的心理测验思想
1.早在2500多年前,我国古代教育家孔子就根据自己的观察评定学生的个别差异,把人分为中人、中人以上和中人以下三个类别,并说“中人以上,可以语上也;
中人以下,不可以语上也。
”这实际上相当于现代测量学中的命名量表和次序量袁。
比孔子稍晚的孟子也说过:
“权,然后知轻重;
度,然后知长短。
物皆然,心为甚。
”这明确指出了心理能力和心理特征与物理现象一样具有可测量的特性。
2.三国时期(公元前3世纪)刘劭著有《人物志》一书。
在该书中,刘劭将人分类为圣贤、豪杰、傲荡、拘憟,即如他说:
“心小志大者圣贤之伦也;
心大志大者豪杰之伦也;
心大志小者傲荡之伦也;
心小志小者拘愫之伦也。
”并提出了心理观察的一条基本原理,即“观其感变,以审常度。
”意思是根据一个人的行为变化便可推测他的一般心理特点。
由于该书对人物的研究颇有独到之处,美国的施罗克(J.K.Shryock)曾将它翻译成英文,于1937年以《人类能力研究》在美国出版,向西方介绍了刘劭的思想。
3.公元6世纪初叶,南朝人刘勰在《新论·
专学篇》中提到“使左手画方,右手画圆,无一时俱成”,其原因是“由心不两用,则手不并用也”。
他不仅观察到左手画方右手画圆不易实现这种现象,而且认为其原因是一心不能二用,这恐怕应算是世界上最早的“分心测验”了。
4.南北朝时代学问最通博、最有思想的学者颜之推十分关心儿童的心智发展并对民间有关周岁试儿的实践加以总结。
他在《颜氏家训·
风操篇》中对此做了详细记载:
“江南风俗,儿生一期(指一周岁),为制新衣,舆浴装饰。
男则用弓矢纸笔,女则刀尺针缕,并加饮食之物及珍宝服玩,置之儿前,观其发意所取以验贪靡智愚,名之为试儿。
”这种针对婴儿期感觉一运动发展的特点,以实物为材料的近似标准化的测试方法可以说是1925年格塞尔(AGesell)婴儿发展量表的前导。
5.中国民间广泛流行的“七巧板”在某些方面可作为创造力测验的一种方法。
七巧板又称益智图,它的操作属于典型的发散思维活动,操作的成果是形象转化,值得高度重视。
九连环是另一种中国民间的智力游戏,其设计之巧妙,也可以和现代的魔方、魔棍相媲美。
七巧板、九连环等后传入西方,受到推崇,如著名心理学家武德沃斯(R.S.Woodworth)就把九连环称作“中国式的迷津”,七巧板则被称为“唐图”(Tangram),即“中国的图板”之意。
七巧板类型的拼图任务现在几乎为当代多数智力测验和创造力测验所使用,并且已发展成为标准化的纸笔型测验。
6.隋炀帝大业二年(606年)始置进士科,是科举制度的开端。
经隋唐宋元明至清代,科举制度已相当成熟。
当时的考试方法主要有:
帖经(填补词句中的缺字)、口义(口试)、墨义(笔试)、策问(政事问答)和杂文(即诗赋)等。
其中科举考试中的帖经和对偶类似于现代西方言语测验中常见的填字和类