完整word版心理测量学重点.docx
《完整word版心理测量学重点.docx》由会员分享,可在线阅读,更多相关《完整word版心理测量学重点.docx(23页珍藏版)》请在冰豆网上搜索。
完整word版心理测量学重点
第一章心理测量概述
第一节心理测验的历史量的性质
2、测验标准化条件:
(1)测验内容的标准化
(2)施测条件的标准化
包括:
①相同的测验情境。
②相同的指导语。
③相同的测验时限。
(3)评分规则的标准化
(4)测验常模的标准化
二、心理测量
(一)心理测量的定义(一级定义)
所谓心理测量,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。
第三节心理测验的种类与功能及其正确使用
(五)按评价所参照的标准来分类
1、常模参照测验(一级定义)
是根据被试对量表中所规定的题目答对多少来评分的,被试成绩的优劣,是根据所得分数在常模中所处的地位来确定的,不是以是否达到某个标准来决定。
2、目标参照测验(一级定义)
是将被试水平与一绝对标准相比较,以便评价被试有无达到该标准为目的测验,也称标准参照测验。
3、潜力参照测验
是将被试水平与自身潜力相比较,以评价被试有无充分发挥自身潜力为目的的测验。
三、心理测验使用的注意事项
(1)慎重选择测验量表
(2)与被测验者建立协调关系(3)控制实施测验的误差
(4)正确解释测验结果(5)遵守测验的道德(6)注意测验的保密
第二章 心理测验的编制与应用
第一节心理测验的编制
①确定测验目的与对象②拟定编制计划③设计测试项目④项目的预测和分析
⑤合成测验⑥测验使用的标准化⑦搜集信度、效度资料⑧编写测验手册
一、确定测验目的与对象
(一)测量对象
测验编成后要用于何种团体。
如被试的年龄、智力水平、受教育程度、社会经济和文化背景以及阅读水平等。
(二)确定并分析测量的目标
一般可分三种情况:
一是编制带有预测功能的心理测验。
(工作分析)
二是编制针对某种心理特质的测验。
(下操作定义)
三是编制标准参照测验。
(双向细目表)
(三)测验用途(测量目的)
二、拟定编制计划
双向细目表
主要有两个方面:
一是全面而具代表性的测验内容。
二是对各个内容点的相对重视程度,通常用百分比来标明。
三、设计测试项目
(一)搜集有关资料
1、资料要丰富。
2、资料要有普通性。
3、资料要有趣味性。
题目的来源:
1、已出版的标准测验。
2、理论和专家的经验。
3、临床观察和记录。
(二)选择项目形式
考虑:
1、测验的目的和材料的性质。
2、接受测验的团体的特点。
3、各种实际因素。
(三)命题的一般原则
1、内容方面2、文字方面3、理解方面4、社会敏感性方面
(四)编写和修订项目
要注意:
1、项目的范围。
2、项目的数量。
3、测验项目的取样。
4、项目的难度。
5、项目的说明必须清楚,用语要力求精练简短、浅显明了。
四、项目的预测和分析
(一)预测
应注意:
1、预测对象。
2、预测的实施过程。
3、预测时限。
4、在预测过程中,应随时记录被试的反应情形。
(二)项目分析
质的分析;量的分析。
五、合成测验
(一)项目的选择
指标有三:
(1)测验的性质。
即要选择那些能够测量所要测量的东西的项目。
(2)项目的难度。
(3)项目的区分度。
(二)项目的编排
(1)并列直进式。
(2)混合螺旋式。
(三)编造复本
复本的关键是等值。
六、测验使用的标准化
(一)施测过程
1、指导语
包括对测验目的的说明和被试应该如何反应的指示(包括如何选择反应、记录反应以及时限等)。
指导语会直接影响被试的反应态度与方法。
2、时限
(二)评分、记分
要求:
1、及时而清楚地记录反应的情况。
2、要有一张标准答案或正确反应的表格,即记分键。
3、将被试的反应和记分键比较,对反应进行分类。
准确无误是对记分的基本要求。
(三)分数解释
1、常模团体
是由具有某种共同特征的人所组成的一个群体或是该群体的一个样本。
常模选择的一般步骤:
确定一般总体→确定目标总体→确定样本。
确定常模群体的注意事项:
(1)群体构成的界限必须明确。
(2)常模团体必须是所测群体的一个代表性样本。
(3)取样的过程必须明确且有详尽的描述。
几种抽样方法:
①简单随机抽样②系统抽样③分组抽样④分层抽样
分层比例抽样和分层非比例抽样。
(4)样本大小要适当。
应注意:
①总体的数目。
样本大小适当的关键是样本要有代表性。
②群体的性质。
③测量结果的精确度。
(5)常模团体必须是近时的。
(6)注意一般常模与特殊常模相结合。
2、几种主要的常模参照分数
(1)发展常模
①发展顺序量表:
格塞尔发展程序表、皮亚杰对守恒概念的研究
②智力年龄
③年级当量
(2)百分位常模
百分等级:
百分点,也称百分位数
四分位数、十分位数
(3)标准分常模
T分数:
平均数为50,标准差为10。
标准九分:
以5为平均数,以2为标准差。
标准十分:
平均数为5,标准差为1.5。
标准二十分:
平均数为10,标准差为3。
(4)智商
比率智商
离差智商
3、常模分数表示法
(1)转换表表示法
(2)剖面图表示法
七、搜集信度、效度资料
八、编写测验手册
内容有:
(1)测验的名称、作者、发行单位。
(2)测验的目的和功用。
(3)测验编制的理论背景和选择题目的依据。
(4)测验的实施方法、时限及注意事项。
(5)测验的标准答案和计分方法。
(6)常模资料。
(7)测验的信度资料和效度资料。
第三章测量误差及其来源
第一节测量误差的含义与种类
一、测量误差的含义
测量误差指的是在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。
二、测量误差的种类
(一)随机误差
又叫可变误差,是由那些与测量目的无关的、偶然因素引起的、而又不易控制的误差。
(二)系统误差
又叫常定误差,是那种由测量目的无关的变因引起的一种恒定而有规律的效应。
系统误差只影响测量的准确性,不影响稳定性,而随机误差既影响稳定性又影响准确性。
第二节测量误差的来源
一、测验本身引起的误差
心理测量量表是否稳定。
是否真正测到了我们所要测的东西。
二、施测过程引起的误差
①测试环境②测试时间③试因素④意外干扰⑤评分记分
三、被试引起的误差
①应试动机②测验焦虑③测验经验④练习效应
⑤反应倾向⑥生理变因⑦学习、发展与教育
第四章测量信度
第一节 信度的意义
(一)信度的含义(一级定义)
信度指可靠性或可靠的程度。
测验的信度则是指测验结果的可靠程度。
第二节 信度系数的计算
信度指标常用相关系数表示,也称信度系数,表示实得分数的变异数中有多少比例是由真分数的变异决定的。
一、稳定性系数(再测信度、重测信度)
跨时间的一致性
是用同一量表对相同被试者在不同时间测验两次的实得分数的相关系数。
(重测法)
二、等值性系数(复本信度)
跨形式的一致性
是以两个等值(题型、题数、难度、区分度相等),但具体内容不同的量表,在最短时距内,对相同的应试者先后施测两次测验所获得的两组对应分数的相关系数。
(复份法)
三、等值稳定性系数
跨时间跨形式的一致性
是合估等值性与稳定性而得到的信度系数。
既能反映由于试题变异(复份)引起的测验成绩变化的程度,又能反映由于应试者的变异(在两次测验的间隔中,由学习、练习、成熟等引起的应试者的变化)而产生的测验成绩的变化的程度。
(复份法)
四、内部一致性系数(同质性信度)
跨项目的一致性
主要反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。
方法有以下两种:
1、分半法:
代表了两半测验内容取样的一致程度。
2、基于项目协方差的方法:
代表测验内部所有题目间的一致性。
五、阅卷者评分的信度系数
跨评分者的一致性
各种信度系数相应误差变异的来源
第三节 信度与测验分数的解释及其信度提高方法
二、提高测验信度的方法
(二)影响测验信度的因素
1、系统误差:
不影响信度。
2、抽样误差:
是影响信度的一个因素。
3、随机误差:
是影响信度的最主要的一种误差。
(三)提高测验信度的方法
①延长测验的长度②测验的难度要适中③测验的内容应尽量同质
④测验的时间要充分⑤测验的程序应统一⑥评分要客观⑦加大应试者之间的差异
第五章测验的效度
第一节效度的意义
一、效度的含义(一级定义)
效度是量表能实际测量出其所要测量的特性或功能的程度。
理解:
(1)是对一定的测量的目的而言的。
(2)是对测量的结果而言的。
(3)一种测验结果的效度只是高或低的问题。
第二节效度的估计
逻辑效度:
如内容效度和结构效度;
统计效度:
如目标关联效度。
一、内容效度(ContentValidity)
基于所测内容的效度验证方法。
指测验项目在内容上的适合性,即是否是所欲测量的行为领域的代表性取样。
是指测验目的代表所要测量的内容和引起预期反应所达到的程度。
研究的目的是要评估测题是否充分代表了所要测量的内容范围,及测验题目对有关内容或行为范围取样的适当性,它所关注的是测验的内容方面。
主要应用:
学业成就测验、职业资格测验、人员选拔与安置中的工作样本测验。
一个测验要有内容效度必须具备两个条件:
1.要有定义得完好的内容范围。
2.测验项目应是已界定的内容范围的代表性样本。
(一)逻辑分析的方法
专家判断
它要求让一组独立的专家(他们不是测验的编制者,但是非常熟悉所测量的内容领域)判断测题对所研究的领域的取样是否有代表性,通过这些评定资料来确定一个测验的内容效度。
(二)克龙巴赫方法
从同一个教学内容总体中抽取两套独立的测验题目,用这两套试题分别对相同的一些应试者进行测验,两次测验得分的相关系数,可以用来估计内容效度。
若相关较高,可以认为内容效度亦高;若相关较低,则两次测验中至少有一次内容效度低。
(三)统计分析法
计算两个评分者之间评定的一致性(评分者信度)
两个测验复本上得分之相关(复本信度)
再测法(测验-学习-再测验)
(四)经验推测法
通过率
提高内容效度的方法之一:
编制命题的双向细目表
二、结构效度(构想效度、构念效度)(constructValidity)
基于所测心理结构的效度验证方法。
是指测验分数能够说明心理学理论的某种结构或特征的程度,或测验实际测量了所要测量的结构和特性所达到的程度。
建立构想效度的逻辑顺序:
基于相关专业知识和观测资料,提出某一心理特质假设或某一心理结构理论假设,然后根据理论或假设所可能对应的行为特点编制测验并进行施测,最后对测量结果进行相关或因素分析,验证其与理论假设的符合程度。
主要应用:
各种心理测验,如智力测验、人格测验、焦虑测验、成就动机测验等。
估计方法:
(1)对测验本身的分析
测验的内容效度:
测验的同质性;分析被试者对题目的反应特点。
(2)测验间的相互比较
相容效度;区分效度;因素分析法。
(3)效标关联法
(4)实验操作法
如,举行两场考试,使被试相信一场考试关系重大,另一场考试无关紧要,在考试前进行焦虑测验,看被试的焦虑测验分数是否存在显著的差异,分析原因。
构想:
考试焦虑是当考试结果对个人有重大意义时的一种害怕失败的紧张情绪”。
有一个焦虑测验,考察这测验是否有构想效度。
三、效标关联效度(准则关联效度)(一级定义)
基于效标关联性的效度验证方法。
又称实证效度,是指测量分数与作为效标的另一独立测验结果之间的一致程度。
(一)效标
是衡量测验有效性的参照标准,指的是可以直接而且独立测量的我们所感兴趣的行为。
常见的效标有:
(1)学业成就。
(2)等级评定。
(3)临床诊断。
(二)效标测量:
将观念上的效标用可操作的测量确定下来。
防止效标污染,即指个人的效标因评定者知道个体的测验分数(也叫预测源分数)而受到影响。
(三)效标关联效度的种类:
1、同时效度
2、预测效度
是指测验结果对未来的行为或测验成绩(效标)能够准确预测的程度。
(四)效标关联效度的估计方法:
1、相关法
①皮尔逊积差相关公式
在两组数据都是连续变量,且两者存在线性关系时使用。
②斯皮尔曼等级相关公式
在两组数据都是等级变量。
③点二列相关系数
适用于一列数据为等距正态变量,另一列为离散型二分变量。
④二列相关系数
在测验分数和效标这两个变量中一个是连续变量,另一个是二分变量(被人为地分成两类)时使用。
2、区分法
3、命中率
4、利用回归方程估计效标分数及计算其置信区间。
(X-1.96SE)≤T≤(X+1.96SE)
四、表面效度
是指从外表直观地看来这个量表可以测量所想测量的特性和功能的程度。
最高行为测验(如能力测验)要求有较高的表面效度。
典型行为测验(如人格测验)却要求较低的表面效度。
第三节提高测验效度的方法
二、影响效度的因素
(一)测验本身的因素
测验取材的代表性、长度、试题类型、难度、区分度以及编排方式等都会影响效度。
编制要注意:
(1)测验材料要有应测内容具有代表性;
(2)尽量避免误差较大的题型(如是非题);
(3)难度要适中,具有较大的区分度;
(4)测验长度要恰当,保证一定的题量;
(5)测题的排列应先易后难。
(二)测验实施中的干扰因素
1、主试的影响因素。
如是否按照标准化来实施、测验与效标测量的实施的时间间隔、测验环境的布置等;
2、被试的影响因素。
如被试测验时的动机、情绪、态度、身体状态、反应定势等。
(三)样本团体的性质
1、样本团体的异质性。
其他条件相同,样本团体同质性越高,分数范围越小,得到的效度系数就会越低,会低估测验效度;反之,得到的效度系数就越大,可能会高估效度。
比如,只使用经选拔后的被试组成样本团体,增加了被试同质性,测验得到的效度系数会较低;
2、干涉变量。
样本团体的有些变量会影响效度测验,比如被试的年龄、性别、受教育程度、智力、动机、兴趣、职业等特征。
对于同一个测验来说,使用的样本团体不同,得到的效度系数也会不同。
(四)所选效标的性质
三、提高效度的方法
①控制系统误差②精心编制量表③妥善组织测验④扩大样本的容量代表性
⑤合理处理效度与信度的关系⑥适当增加测验的长度
第六章测验的项目分析
(一)难度(一级定义)
指试题的难易程度。
P=R/N
P代表试题难度;R为答对该试题人数;N为参加测验总人数
(一)区分度(一级定义)
是指测验对考生实际水平的区分程度。
也叫鉴别力。
第七章试题类型及评分
(一)评分误差
评分可靠是指不同人评定同一份试卷或同一个人在不同时间评定同一份试卷所评定的分数都应是一致的。
这就叫评分信度。
评分者本人的某些特点也能影响评定分数的客观性。
1、评分者知识水平的影响。
2、评分者心理状况的影响。
3、评分者个性倾向的影响。
4、各种“效应”的影响:
①名片效应。
②光环效应。
③对比效应。
④先后效应。
5、评分者工作态度的影响。
第八章智力测量
第一节智力概述
三、智龄和智商
(二)智商
比率智商IQ=(智龄/实龄)×100
离差智商IQ=(测验分数/同龄人的平均数)×100
离差智商X=100+15Z
离差智商(一级定义)
是一种以年龄组为样本计算而得来的标准分数。
离差智商=100+15Z,其中Z=(X-M)/S,其中M代表团体平均分数,X代表个体测验的实得分数,S代表该团队分数的标准差,Z代表该人在团队中所处位置,即他的标准分数。
二、韦克斯勒智力量表(详见课本P223页)
包括言语量表和操作量表两部分
1.常识2.数字广度3.词汇4.算术5.理解
6.类同7.填图8.图片排列9.积木图案10.拼图
11.译码或数字符号12.迷津13.句子14.几何图形15.动物房
第九章人格测量
第二节自陈量表法
二、几种常用的人格自陈量表介绍
(一)明尼苏达多相人格测验(MMPI)
适用于16岁以上具有小学文化水平以上的群体。
该量表共有测题566道,其中有16道重复题。
内容包括健康状态、情绪反映、社会态度、心身性症状、家庭婚姻问题等26类题目,可鉴别强迫症、偏执狂、精神分裂症、抑郁性精神病等。
MMPI项目涉及内容及项目数
项目分类
项目数
项目分类
项目数
1.一般健康
9
14.有关性的态度
16
2.一般神经症状
19
15.关于宗教态度
19
3.脑神经
11
16.政治态度-法律和秩序
46
4.运动和协调动作
6
17.关于社会的态度
72
5.敏感性
5
18.抑郁情感
32
6.血管运动.营养言语.分泌腺
10
19.狂躁感情
24
7.呼吸循环系统
5
20.强迫状态
15
8.消化系统
11
21.妄想.幻想.错觉.关系疑虑
31
9.生殖泌尿系统
5
22.恐怖症
29
10.习惯
19
23.施虐狂.受虐狂
7
11.家庭婚姻
26
24.志气
33
12.职业关系
18
25.男女性度
55
13.教育关系
12
26.想把自己表现的好些的态度
15
MMPI临床量表
序号
名称
略号
项目数
加K数值
1
疑病症
Hs
33
0.5K
2
抑郁症
D
60
0
3
歇斯底里
Hy
60
0
4
精神病态偏倚
Pd
50
0.4K
5
性度
Mf
60
0
6
妄想狂
Pa
40
0
7
精神衰弱
Pt
48
1K
8
精神分裂
Sc
78
1K
9
轻躁狂
Ma
46
0.2K
10
社会内向性格
Si
70
0
4个效度量表
Q:
疑问量表(Question)
没有回答的题数和对“是”和“否”都做反应的题数。
566题版本超过30分,或399题版本超过22分,则答卷无效。
L:
说谎量表(Lie)
超过10分,结果不可信。
F:
诈病量表(Frequency)
说明伪装疾病或精神病程度重。
K:
校正量表(Correction)
根据被试对测验的态度对测验得分进行校正。
该测验有两种形式:
卡片式、问卷式。
测验没有时间限制,一般45分钟可以做完,最多也不超过90分钟。
施测的步骤与结果转换:
(1)施测前,主试要熟悉测验和测验的指示语、了解被试情况、确定安静整洁的测试环境。
然后选择合适的测试方式(卡片式、手册式或录音播放式);
(2)开始测验时把指示语读给被试听,说明测验约需1个半小时;
(3)测验开始后,主试要注意查看被试是否在答题纸上填写姓名、性别、地址等,所答题目序号是否与试卷上的序号符合等;
(4)答题结束后,用读卷机或套版记分。
套版记分方法是:
把答卷按性别分开、检查并划掉同时选“是”和“否”的答案、查看Q分并当其超过30或22分时确定答卷无效、换用不同套版得到不同分量表原始分;
(5)对5个临床量表进行校正:
Hs+0.5K、Pd+0.4K、Pt+1.0K、Sc+1.0K、Ma+0.2K;
(6)使用与被试年龄、性别等对应的换算表,得到各分量表T分。
施测中应注意的事项:
(1)测验前,要告知测验的意义,取得被试合作。
如被试仍轻率从事或不愿暴露自己,主试可凭经验尽可能弄清情况,做好工作,争取被试的合作,并详细记录被试的表现;
(2)向被试讲清楚,如遇不能回答的问题,可以空下来,但要尽可能回答,不要空的太多;每个问题的回答无所谓对错等;
(3)如果因测验时间长被试情绪焦躁、不耐烦,则可以将测验分成几段进行,也可以用放录音的方法进行测验;
(4)使用分量表时,尽量使用代码表示,而不要用中文全译名称,以免表达不准确或造成误解、误判、误读等。
计分方法:
原始分→T分数→剖面图
计算Q量表的原始分。
超过22分或30分无效。
分别计算各量表的原始分。
对5个量表加K分校正。
Hs、Pd、Pt、Sc、Ma5个量表要分别加上一定比例的K分。
查表把原始分转化为T分;或计算T分。
60以上为异常(中国标准):
70分以上为异常(美国常模)
T=50+10(X-X)/SD
画出剖析图。
临床量表及其诊断意义:
(1)疑病(Hs):
反映对身体功能的不正常关心,高分者往往有疑病症、神经衰弱、抑郁等倾向,身体无病,也总觉得身体欠佳;
(2)抑郁(D):
高分者常被诊断为抑郁症,表现忧郁、淡漠、悲观、思想与行动缓慢。
分太高有自杀倾向;
(3)癔症(Hy):
反映用转换反应对待压力或矛盾的倾向,高分者往往有癔症倾向,依赖、天真、外露、幼稚及自我陶醉等;
(4)精神病态(Pd):
反映性格畸变。
高分者蔑视社会习俗和规范,常有复仇攻击观念,多诊断为人格异常、反社会人格、被动攻击性人格;
(5)男子气-女子气(Mf):
高分者有异性化倾向,极端高分则暗示有性变态倾向或性变态行为。
(6)偏执(Pa):
高分者多疑、孤独、过分敏感等,T分超过70则可能存在偏执妄想。
尤其是F、Sc量表分数高,而Pa分又极端高,则常被诊断为精神分裂症偏执型和偏执性精神病;
(7)精神衰弱(Pt):
高分者紧张、焦虑、强迫思维、恐怖及内疚感,常自责自罪、自卑,Pt、D、Hs同时升高则多诊断为神经症;
(8)精神分裂症(Sc):
高分者表现非常的或分裂的生活方式及情感反应。
极高分数(T>80)者多有不恰当情感反应、怪异行为、妄想、幻觉、人格解体等精神症状及行为异常。
如只有Sc高分、无F量表分升高常提示类分裂性人格;
(9)轻躁狂(Ma):
高分者常为联想过多过快、活动过多、观念飘忽、夸大而情绪激昂、情感多变。
极高分数多有妄想,T>90者可能正处于躁郁症的躁狂相;
(10)社会内向(Si):
高分者内向、退缩、紧张、固执、自罪;低分者外向、爱交际、冲动、做作,在社会关系中不真诚。
(三)艾森克人格问卷(EPQ)
该量表是由内外向性(E量表)、情绪性或神经质(N量表)、精神质或倔强性(P量表)和效度量表(L量表)等四个分量表组成。
包括两式:
儿童(7~15岁),成人(16岁以上)。
艾森克的人格理论
E维度:
内—外向
高分表示人格外向,低分表示人格内向;
N维度:
情绪稳定性
低分表示情绪稳定,高分表示神经过敏;
P维度:
精神质
高分表示孤独,难以适应环境,感觉迟钝。
L:
说谎量表。
E、N维度与古希腊盖伦的气质学说相吻合
施测步骤和结果计算:
艾森克人格问卷的施测非常简单,即将答卷和答题纸发给被试,可以个别测验,也可以团体测验。
团体测验时要保证人手一套答卷和答题纸。
严格按照指示语向被试说明完成测验的做法,即可由被试自行完成。
施测中要求:
第一,在问卷上印有指示语,施测时要让被试读懂指示语;
第二,只需要就每一题回答“是”或“否”;
第三,不要遗漏任何一道题目。
评分界线:
中间型:
43.3~56.7(50±6.7)
倾向型:
38.5~43.3;56.7~61.5
典型型:
<38.5(50-11.5);
>61.5(50+11.5)
各维度的典型人格特征
(1)典型外向(E分特高)
表现为:
爱社交、朋友多、喜欢冒险、追求剌激、不甘寂寞、好谈笑、冲动行事不爱做研究工作,喜欢实际的工作,反应迅速,随和,但情绪容易失去控制,做事粗心,从外表看似乎是一个不太可靠的人。
审美:
喜欢深