《心理测量学》复习提纲.docx
《《心理测量学》复习提纲.docx》由会员分享,可在线阅读,更多相关《《心理测量学》复习提纲.docx(20页珍藏版)》请在冰豆网上搜索。
《心理测量学》复习提纲
一、测量与心理测量
⏹重要概念
1.测量:
测量是根据法则给予事物分派数字(StevensSS,实验心理学手册,1951)亦即依据一定的法则使用量对事物的特征进行定量描述的过程。
2.测量的三要素
事物的属性(测什么?
)、法则、规则(如何测?
即测量原理)、数字(测量结果)
3.心理测量
(1)一般的定义:
对心理特点(或心理学概念)的测量;(依据一定的心理学和教育学理论,使用测验对人的心理特质和教育成就进行定量描述的过程)
(2)课本:
根据一定的心理学理论,使用测验对人的心理特质进行定量描述的过程;
(3)心理测量学的定义:
布朗的定义:
是指对一个行为样本进行测量的系统程序;
安娜斯塔西的定义:
实质是对行为样本的客观可标准化的测量;
(4)一种动作、过程;或是实施一组项目。
心理测量就是根据一定的法则用数字对人的行为加以确定。
即根据一定的心理学理论,使用一定的操作程序,给人的行为确定出一种数量化的价值。
4.心理测验:
进行心理测量的工具,其形式一般为一组题目与相应的评分标准。
工具,包括问卷、测验、面试、评价中心等;或是一组项目
心理测验就是通过观察人的少数有代表性的行为,对贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段,是心理测量的一种工具和手段,是根据一定法则对人的行为用数字加以确定的方法。
5.心理评估:
更全面的测量,包括使用观察、访谈的方法获得有关信息。
6.行为样本:
心理测量的理论取向,即认为心理测量是对有代表性的部分行为进行测量。
课本定义:
从大量行为中抽取与欲测量的心理特质直接相关的一组行为进行测量,并依据对这一组行为的测量结果推断其心理特质。
这一组被抽取出来的、作为直接的测量对象的行为就是行为样本。
内在要求:
①在测量和界定特定属性的行为时,心理测验并非要测量所有可能出现的行为;②一个测验的质量主要是由样本的代表性所决定。
7.标准化,即统一化,统一规格,一般指产品设计的各个方面
测量标准化,主要指测验使用时的统一化,包括4个方面,可以考试为例;而测验(测量工具,主要是问卷)本身由于比较简单,因而无所谓标准化
8.个别测验:
同一主试在同一时间内只能测量一个被试的测验p14
9.团体测验:
同一被试在同一时间能够测量许多被试的测验p14
⏹思考题:
1.试述心理测量的特点?
P8
(1)首先,心理测量依据的法则在相当一定程度上是一种理论,很难达到如同物理测量依据的法则那样普遍被研究者共同接受的科学水平;
(2)其次,心理测量的对象是人的心理特质和教育成就;
(3)再次,心理测量的量尺是由有关领域的专家经过长期的编制、试用、修订、完善而逐渐形成的标准化测验,它的编制是一项高度专门化的系统工作,要达到科学所要求的水平绝非易事;
(4)最后,心理测量的目标虽然是人的心理特质和教育成就进行定量分析,但这种定量分析的精确度远不及物理测量的精确度。
2.试述心理测量的路线(取向)?
心理测量的路线(取向):
行为样本,即认为心理测量是对有代表性的部分行为进行测量
3.试述心理测量在科学研究中的重要性?
①实际生活中:
社会生活的各个方面需要测量,我们处于一个数字化的
②科学研究上:
一个概念若不能加以测量,就不是科学的概念;
测量用于研究:
一个概念:
现状研究;两个或两个以上概念:
相关研究与实验研究
4.试述心理测验的一些重要分类?
(1)按测验对象:
认知测验(智力、能力倾向、成就)与人格测验;
(2)按测验方式:
A:
个别测验与团体测验B:
纸笔(电脑)、操作、口头C:
自评,他评
(3)按测验内容形式分
A.文字与非文字B.难度测验与速度测验、态度测验
(4)按测验功能(目的)分
A.描述性测验(与现在状态相关联)B.诊断性测验C.预测性测验
(5)按参照体系分
A.标准参照测验(有个标准-可高可低)B.常模参照测验-(有个正常范围-平均水平)
二、心理测验编制——心理测验原理之一
⏹重要概念
1、概念界定:
对待测的心理特点(或概念)进行定义,或界定(确定内容范围)
清晰或科学地界定概念,防止伪概念;不同的概念界定就有不同的测量。
2、理论建构:
即明确待编制量表的内容结构;不同理论就有不同的测量;
3、理论:
理论有时也叫结构或模型。
人们关于事物知识的理解和论述(XX百科)
4、量尺:
测量学中把定有参照点和单位的数量连续体叫做量尺,一般叫量表,为避免混淆,我们这里叫量尺。
通俗题讲就是刻度。
5、特质论是心理测量的最基本理论,区别于认知心理学中的信息加工理论(过程论)
补充:
心理特质,表现在一个人身上所特有的稳定的行为方式
⏹思考题:
1、心理测验编制在制定编题计划(内容构思)上应该考虑哪些方面?
①界定概念:
清晰或科学地界定概念,防止伪概念。
注意:
不同的概念界定就有不同的测量
理论建构:
即明确待编制量表的内容结构。
注意:
不同理论就有不同的测量
A.几个方面就是几个维度;举例:
学生生活满意感量表、主观社会支持量表
B.内容建构也即是理论建构:
结构式理论
C.要编一个新的量表,需要内容创新或理论创新
做好总体构思:
A.做好理论研究工作;B.思考与见识;C.通过观察、访谈完善有关理论(自下而上)
2、心理测验编制在设计测试题目(题目编制)上应该考虑哪些方面?
(1)透彻理解相关的心理概念
(2)熟悉抽象概念的具体行为表现
A.通过观察或访谈获得素材B.阅读,多参考别人的量表获得素材
书本P134-135
(1)收集测验资料
资料要有普遍性。
一是当编写智力类测验时,所收集的数据对于不同文化背景、不同经济地位、不同地区的个人能够或者团体应当是公平的,尽可能避免特殊知识经验对测验结果的影响;而当编制人格测验时,资料应当能够全面反映某一文化背景中的团体的基本人格特征。
资料具有趣味性。
减少受试者由于缺乏足够动机而引起的测量误差。
资料全面。
无论是能力或是人格,都是复杂的复合性心理结构,必须包含许多不同类型的题目去测量。
(2)选择项目形式
选择项目形式时,要考虑受测者的年龄、测量的目的、题目的性质等因素。
原则:
受测者容易明白的测验方法
使受测者不会因为题目形式不当而做错
测验过程省时
计分省时
经济
(3)编写测验项目
题目的取样应当对想要测的心理品质具有代表性,即题目能够真正反映测量对象的特征
题目的取材范围要和编题计划所列项目的范围一致
题目的难度应有一定的分布范围
题目的用语要力求简练简短,浅显明了
初编题目的数量要多于最终所需要的数量,以便筛选或者编制副本
测验项目的说明必须简明
3、试述量尺的概念与组成要素?
(1)测量学中把定有参照点和单位的数量连续体叫做量尺。
与测量要素中的法则有关。
(2)量尺的要素:
参照点(零点)和单位
理想的量尺:
有绝对的零点和相等的单位
心理测验中量表没有绝对的零点,单位也可能不等
4、试述量尺的分类?
1)按以数据的测量水平分
A.类别量表:
仅区分类别
B.等级量表:
同时区分等级、位次
C.等距量表:
数量之间有相等的单位,但零点为相对零点,非绝对零点
D.等比量表:
数量之间具有比例关系
2)按连续体的形式分
A.迫选量表(Force-ChoiceScale):
如EPQ
B.Likert量表(总加量表):
一种单维量表,假定所有项目同样重要,最后得分相加。
C.Guttman(格特曼)量表(累加量表)
D.Thurstone量表(沙氏通量表:
最不赞同到最赞同方向分为若干类,譬如11类。
)
E.语义区分量表(semanticdifferentialscale):
一种多维度量表(自信1---5不自信)
F.程度量表(临床)
三、项目分析——心理测量原理之二
(1)
⏹重要概念
1、难度:
被试完成测验项目任务时所遇到的困难程度。
2、区分度:
测验对被试心理品质水平差异的区分能力
(好的题目应该有不同答案,即反映被试的个体差异性)
3、客观题:
让考生从事先拟定的答案中辨认出正确答案的题目。
(二分法,分类数据)P=R(答对项目的总人数)/N(全体被试数)
4、主观题:
是指那些能更好地考查学生具体情况或个性的试题。
(非二分法,连续数据)P=X(平均分)/Xmax(满分)
P值在0~1之间,靠近1越容易,靠近0越难;
仅限于认知测验(智力测验、考试等);
主观题的公式可以涵盖客观题。
5、27%:
极端组的划分方法-从样本中区分出高分组(top27%)与低分组(down27%)
6、相关法:
计算量表(或量表维度)的总分,然后计算每个题目与总分的相关系数;以项目分数与效标分数或测验总分的相关作为项目区分度分指标。
D:
当校标成绩是连续变量时,可以从分数分布的两端各选择27%的被试,分别计算出每道题目上各自的通过率,两者之差就是鉴别度指数(D),即D=PH-PL(高分组通过率-低分组通过率)
说明:
D值鉴别项目测量有效性的指标,D值越高,项目越有效。
D值大于0.19的题目保留
⏹思考题:
1、项目分析的目的是什么?
通过施测,在实际数据基础上对测验中每个项目(题目)进行分析,删去不好的项目,使余下来的项目组(合)成的测验具有较好的质量。
2、项目分析的步骤是什么?
1)选取样本,并施测,获得数据
样本的代表性、样本的容量?
P85
3)指标计算——项目分析
难度——仅用于认知测验(智力测验、考试等)、区分度
3)确定哪些项目被删除(保留)
4)如何根据难度分析确定哪些项目须删去?
单题:
太难或太容易的题目去掉
整卷:
[1]平均难度:
p=0.5
[2]正态分布(奥数等的竞赛题目不符合正态分布)
5)如何根据区分度分析确定哪些项目须删去?
1)相关法
A.计算量表(或量表维度)的总分
B.计算每个题目与总分的相关系数
C.确定是否删除题目:
相关系数较小者(一般是r小于0.3者)
2)高分组低分组比较法(鉴别指数法)
A.从样本中区分出高分组(top27%)与低分组(down27%)
B.每个题目做t检验,差异显着且高分组得分大于低分组的题目可保留
C.或计算鉴别指数法D(D=PH-PL),D值大于0.19的题目保留
3)因素分析法:
因素荷重(loading)小于0.3
四、CTT与信度——心理测量原理之二
(2)
重要概念
1、系统误差(大小、方向确定,可加以控制)
由与实验目的无关的变因而引起的一种恒定的而有规律的效应。
往往是由测量工具的问题、研究人员的问题等造成,永远往一个方向偏差,样本再大(甚至测总体)都无法解决。
2、随机误差(大小、方向不确定,难以控制控制,可想办法减少)
由与测量目的无关的、偶然因素引起的而又不容易控制的误差。
随机误差无规律,会影响测量的reliability(即不够精确),可以通过加大样本来减小随机误差,如样本大到与总体一样,randomerror=0,即所有随机误差互相抵消。
3、真分数理论
真分数(T):
反应被试某种心理特质真正水平的数值(包含系统误差)
观察分数:
实测的分数
由于测量误差的存在,实际测得的数值往往难以和该特质的真正水平值完全一致,它总会高于或略低于其真实水平值
4、信度:
测量(工具)的可靠性或稳定性程度,也是不受各种误差(随机误差)影响的程度
5、重测信度:
用同一个量表对同一组被试施测两次所得结果的一致程度(同一测验先后测试两次);其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数
6、内在一致性信度(同质性信度):
测验内部所有题目间的一致性程度(一个测验所测内容或者特质的相同程度)
两层含义:
A.所有题目测的是同一种心理特质
B.所有题目得分之间都具有较高的正相关
7、评分者信度:
多个评分者给同一批人的答卷进行评分的一致性程度
8、测量的标准误SE:
对一个团体(人数足够多)两次施测的结果以估计测量误差的变异数,每个人两次测量的分数之差可以构成一个新的分布,这个分布的标准差就是测量的标准误。
补充:
测量误差:
在测量过程中,由那些与测量目的无关的变化因素所产生的一种不准确或者不一致的测量效应(即测量过程中,由于种种原因,测量结果与真实值之间的不同)
思考题:
1、试述CTT理论的基本思想?
假设:
观察分数(X)和真分数(T)之间是一种线性关系,并只相差一个随机误差(E)
数学模型:
X=T+E
(X为观察值;T为真分数;E为随机误差)
认为E是个随机误差,没有包含系统误差,是个服从均值为零的正态分布的随机变量。
推论:
S2X=S2T+S2E
S2T=S2v+S2I(考虑到系统误差I)
S2X=S2v+S2I+S2E
相关联的假设公理:
(1)多次测量的误差平均数为零(若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值会接近于真分数)(为了说明E为是个服从均值为零的正太分布的随机变量。
)
(2)真分数与误差分数之间的相关为零(为了说明E为随机误差)
(3)各个平行测验上的误差分数之间的相关为零(为了说明E为随机误差)
补充:
平行测验:
如果两个题目不同的测验测的是同一特质,并且题目形式、数量、难度、区分度以及测查等值团体所得出的分布都是一致的,则这两个测验被称作彼此平行的测验。
而实际操作中,是用一个测验来测查许多被试,当被试团体足够大时,团体内部的各种随机误差会相互抵消,整个团体的观察分数的均值会趋近于该团体真分数的真是,那么多个被试接受同一个测验相当于多个平行测验反复测查一个具有团体真分数均值的一个个体。
2、试述两类测量误差的特点?
(1)随机误差的特点:
大小和方向都不固定,也无法测量或校正。
随机误差的性质是:
随着测定次数的增加,正负误差可以相互低偿,误差的平均值将逐渐趋向于零。
由与测量目的无关的,偶然因素引起的而又不易控制的误差。
(2)系统误差的特点是测量结果向一个方向偏离,其数值按一定规律变化,具有重复性、单向性。
我们应根据具体的实验条件,系统误差的特点,找出产生系统误差的主要原因,采取适当措施降低它的影响。
大小、方向固定,可加以控制。
系统误差只影响测量的准确性,不影响稳定性。
而随机误差既影响稳定性又影响准确性。
3、试述重测信度(或内在一致性信度)的含义、评估步骤?
重测信度
含义:
用同一个量表对同一组被试施测两次所得结果的一致程度(同一测验先后测试两次),其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。
(此信度的使用前提-所测的心理特质是稳定的。
)
评估步骤:
A.用同一测验对同一组被试先后测试两次(选取样本具有代表性,两次测量时间间隔最好相差至少7天)
B.得出同一组被试两次测验的分数
C.进行皮尔逊积差相关系数的分析,当相关系数较大时,说明前后两次测量的结果比较一致,测量工具比较稳定,被试的心理特质受被试状态和环境变化的影响较小。
量表测验被试——间隔一段时间——同一量表第二次测验相同被试——两次测验结果一致性比较
内在一致性信度(同质性信度)
含义:
测验内部所有题目间的一致性程度(一个测验所测内容或者特质的相同程度)
评估步骤:
A.同一个测验测一次
B.用α系数进行评估,系数越高,一致性越好
4、试述提高测量信度的方法?
减少误差角度(或误差的来源)来看
三个误差来源:
(1)测验本身:
可以增加项目(测验长度);项目难度接近正态;提高项目的区分度;取样:
根据测验目的选择被试
A.重测信度:
题目简单明了,有确定的含义(没有歧义)。
时间间隔不要太长
B.内在一致性信度:
注意项目在反映内在概念上的一致性
(2)测验情境、主试,过程是否规范
(3)被试状态
第四个因素:
样本(测量):
有代表性,即能反映总体;有足够的样本容量
五、效度——心理测量原理之二(3)
⏹重要概念
1.效度:
指测量工具的有效性、准确性,或反映真实值的程度
2.内容效度:
指一个测验内容是否合适,一般相对于教材或大纲,一般用来判断范围和题目是否恰当(仅限于成就测验,或知识与技能测验)
课本:
一个测验实际测到的内容与所要测量的内容之间的吻合程度
3.表面效度:
外行人从表面上看,认为某个测验测得某种心理特质的有效程度
4.效标关联效度(实证效度)
课本:
一个测验对于处于特定情境中的个体的行为进行估计的有效性。
(即用实践效果作为测验是否有效的检验标准)
老师:
asinstrumentalvalidity,isusedtodemonstratetheaccuracyofameasureorprocedurebycomparingitwithanothermeasureorprocedurewhichhasbeendemonstratedtobevalid.(自己翻译的:
与其他已经被证明有效的测量工具或者测量过程相比,测验的关联程度。
)
5.预测效度:
根据有关理论(或研究成果,或一般推理)所选效标与待研究的测验(特质)有联系,如IQ与学习成绩,个性与心理健康
6.同时效度:
所选效标与待研究的测验(特质)内涵相同或相似
7.结构效度:
指通过对实证数据分析(因素分析)得到的一个测验(或问卷)实际结构是否清晰。
或者说,一个测验的实证结构与理论预期的结构是否相符合的程度。
⏹思考题:
1.试述效度与测量误差的关系?
效度是测量的随机误差和系统误差的综合反映P60
(1)当一个实验随机误差较大时,实测结果当然会偏离真值,造成结果的不准确。
(2)如果测量中还存在系统误差,则系统误差也会加大测量误差。
(3)无论出现哪种情况,也无论是否两种误差都存在,只要出现测量误差,测量的效度必受影响。
相关计算公式:
❑S2X=S2v+S2I+S2E(S2I为系统误差,S2E为随机误差)
❑r2xy=S2v/S2X(r2xy为效度)
2.试述度效标关联效度(实证效度)的含义?
也被称为工具的有效性,是用来表现出比较另一项措施或程序,已被证明是有效的资讯科技的一项措施或程序的准确性。
3.试述效标关联效度(实证效度)的评估步骤?
三种研究设计:
都是相关法,本质上是一致的
其实是分类、连续的数据的相关(参考区分度)
(1)相关法
找一个效标(测验),对同一批被试,同时施测,得到两组数据;
求相关系数r,相关系数较大(>0.3)且显着为效度较好。
(2)比较法
其中一个变量为类型(0、1)变量;
找一个效标,根据经验进行分组,如高分组与低分组;
对新编制的测验进行测定,获得两组被试的平均数与标准差;
进行平均数差异比较(t检验或F检验),差异显着为效度较好;
也可直接求相关r。
(3)命中率
只是两个变量均为(0、1)类型变量,其中另一个变量是效标;
可用X2检验,也可用一般相关;还可用ROC曲线法。
4.结合测验编制,谈谈结构效度对于一个测验的意义?
1)结构效度的含义:
结构的两重含义:
a)结构:
即变量——结构效度1
b)结构:
即理论——结构效度2
2)结构效度的含义:
a)结构效度1:
新编制的测验能不能测某一结构(或特质)(实际上是效标关联效度,参前面的聚合效度与区分效度)---实质上是校标关联效度
b)结构效度2:
测验的结构与理论预期的结构是否符合
3)结构效度主要用于智力测验、人格测验等心理测验方面
4)心理测验编制在制定编题计划(内容构思)要进行理论建构:
即明确待编制量表的内容结构
六、测验研究中研究设计
⏹重要概念
1、正规化:
测验研究,即量表的正规化,是指在量表编制完成后,对量表进行结构、效度、信度检验,确保量表结构清晰、有效、且稳定(不受无关因素影响)。
2、标准化:
测验标准化特指测试实施过程中的标准化,包括测验指导语、实施环境与时限,评分标准的统一化。
3、随机分层抽样:
它是从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样品(个体)的方法。
。
4、随机整群抽样:
将总体按一定标准划分成群或集体,以群或集体为单位按随机的原则从总体中抽取若干群或集体,作为总体的样本,并对抽中的各群中每一个单位都进行实际调查。
⏹思考题:
1.试述测验标准化的内容
1) 内容标准化:
即对所有被试施测相同的题目。
测验的内容不同,所得的测验分数是无法相互比较的。
2) 2)施测过程标准化:
首先,无论在何时何地给何人施测,主考官宣读的测验指导语必须完全一致。
第二,测验的时间要统一、严格控制,这一点对能力测验尤为重要。
在本章稍后给出的案例中,对施测过程的标准化将有更加具体、详细的介绍。
3) 3)评分标准化:
即客观评分。
对于那些需要主观评分的测验,要求至少有两个以上受过专业训练的评分者同时评分,而且他们的分数必须具有一致性。
2.试述人格问卷正规化的研究设计
1)研究量表准备就绪:
明确测验编制目的、概念定义、理论构建、项目编制、量尺选择
2)探讨新编问卷的因子结构与项目分析
⏹方法
❑被试:
被试约300人左右
❑工具:
新编问卷测试版
❑程序:
抽样(随机分层、随机整群)、问卷实施、数据输入与分析
⏹结果与分析:
❑因素分析和各种项目分析方法结合。
主要是探索量表的因素结构(结构效度)。
❑理想的结果是当删除若干项目后,获得比较清晰的量表结构。
⏹这时量表可定稿为正式版(当然最好在验证性因素分析也通过的时候)
⏹可继续分析量表的信度即内在一致性系数。
⏹可继续分析量表维度之间的相关(结构效度)
❑若量表结构不清晰,这一次研究当作试测,须重新修改或编制问卷,重新收集数据,并进行分析,直到量表结构清晰为止
3)分析新编问卷的重测信度
⏹方法
❑被试:
约50~60人
❑工具:
新编问卷正式版
❑程序:
分两次测定,间隔7天~3月不等,须记名
⏹结果:
❑对同一组被试测试获得的两组数据,计算r。
⏹讨论:
若r>0.8以上表示重测信度较好,新编测验比较稳定,不受被试状态与环境变化影响。
4)分析新编问卷的效标关联效度
⏹方法
❑被试:
约50~60人。
(n越大越好)
❑工具:
新编问卷正式版与校标问卷
❑程序:
⏹结果:
❑计算新编问卷与校标之间的相关系数r。
⏹讨论:
若r>0.2以上表示测验的效度较好,新编测验能测想测的心理特质。
5)目的:
验证研究一发现的新编量表的因子结构
⏹方法
❑被试:
约300人(与研究一不同)
❑工具:
新编问卷正式版
❑程序:
⏹结果与分析:
❑模型建构;
❑验证性因素分析,可采用LISREL或AMOS等软件,进一步研究一确定量表的结构效度。
结果好坏看有关指标。
若结果不理想,尚须修订正式版
七、测验研究中的数据分析
⏹重要概念
1.因子荷重
以变量(题目)为因变量以各抽取因子为自变量进行回归分析,每个系数即为loading
2.公因子方差h2
hi2=ai12+ai22+…+aim2,为因子载荷矩阵中第i行元素的平方和,称为共同度。
公因子的方差的意义在于说明当由原始变量空间转化为因子空间后,保留原来各变量的信息有多少,当hi2越接近1时,说明空间转化性质越好。
⏹思考题:
因素分析的步骤
1.因素分析的一般哪些步骤?
第一步:
数据适合性检