心理测量学考点Word下载.docx
《心理测量学考点Word下载.docx》由会员分享,可在线阅读,更多相关《心理测量学考点Word下载.docx(29页珍藏版)》请在冰豆网上搜索。
(2)类别,即用数字指代事物的种类,如用1代表男生;
2代表女生。
数字只能标记和分类。
(二)顺序量表(ordinalscale)
按照事物的大小、等级、程度而排列数字的量表。
该量表不仅能够指代事物类别,而且能够表明不同类别的大小、等级或事物具有某种属性的程度。
在顺序量表中,数字没有相等的单位,也没有绝对的零点,因而不能进行代数运算。
(三)等距量表(equalintervalscale)
该量表不仅能够指代事物的类别、等级,而且具有相等的单位。
在这个量表中的数字可以进行加减运算;
由于只有相对的零点,等距量表不能进行乘除运算。
(四)比率量表(ratioscale)
该量表是最高级的量表,因为除了具有类别、等级、等距的特征外,还具有绝对的零点。
使用比率量表不仅可以知道测量对象之间的差异程度,而且可以知道它们之间的比率。
心理测量是在顺序量表上进行的。
因为绝对零点时难以确定的,相等的单位也难以获得。
只是将顺序量表上得到的数据转换为等距数据。
1.2心理测验的基本概念
1.2.1心理测验的定义
心理测验是依据心理学理论,使用一定的操作程序,通过观察人的少数代表性行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。
注意四个方面:
(1)心理测量的是人的行为。
(2)在测量个别差异的时候,只是从少数具有代表性的行为样本进行观察,间接推知被试者的心理特征。
(3)测验的条件对于所有的被试要相同。
(4)测验的原始分数不具有任何意义,只有与其他人的分数或常模比较才具有意义。
1.2.2心理测验的性质*
(1)间接性
心理测量是通过一个人对测验项目的反应来推论心理特质。
所谓特质是用来描述一组内部关系或有内在联系的行为时所使用的术语,是个人对刺激作反应的一种内部倾向。
它是个体特有的、稳定的、可辨别的特征,是从行为模式中推论出来的,使得心理测量具有间接性。
(2)相对性
测验就是看每个人处于这个序列的什么位置上,每个人被测得的结果都是与所在团体或人群的大多数人的行为或某种人为确定的标准相比较而言的。
(3)客观性
是指测验的标准化问题。
其中,标准化包括以下内容:
●测验使用的项目或作业;
●评分计分原则和手续经过标准化,对反应的量化是客观的;
●分数的转化和解释经过了标准化,对结果的推论是客观的。
1.3心理测验的分类
1.3.1按测验的功能分类*
智力测验
特殊能力测验
人格测验
1.3.2按测验的性质分类
文字测验
操作测验
1.3.3按测验材料的严谨程度分类
客观测验
投射测验
1.3.4按测验的方式分类*
个别测验
团体测验
1.3.5按测验的要求分类
最高作业测验
典型行为测验
1.4纠正错误的测验观
1.4.1错误的测验观*
(1)测验万能论
(2)测验无用论
a.某些人格测验侵犯个人隐私,违背民主原则;
b.测验为宿命论和种族歧视提供了心理学依据。
(3)心理测验即智力测验
1.4.2正确的测验观*
心理测验是重要的心理学研究方法之一,是决策的辅助工具。
心理测验作为研究方法和测量工具尚不完善。
1.5心理测验在心理咨询中的应用
1.5.1智力测验
常用的有中国比内量表、韦氏成人智力量表、韦氏儿童智力量表、韦氏幼儿智力量表、瑞文推理测验、联合型瑞文测验等。
这些量表可在求助者有特殊要求以及对方有可疑智力障碍的情况下适应。
1.5.2人格测验*
常用的有艾森克人格问卷、卡特尔16人格因素问卷、明尼苏达多项人格调查表等。
1.5.3心理评定量表
这一类包括精神病评定量表、躁狂状态评定量表、抑郁量表、焦虑量表等。
1.5心理测验在心理咨询中的应用*
心理测验是分析求助者的重要工具。
不仅可以检验咨询人员的判断是否明确,还能帮助对求助者的问题进行深入分析。
心理测验在咨询关系建立之前实施,而在进入正式的心理咨询程序后,尽量避免使用。
1.6心理测验的发展史
我国的科举制度被公认为世界上最早的心理测验的实践。
科学的心理测验则是在工业革命成功后的19世纪发展起来的。
1.6.1科学测验的产生与发展
高尔顿的遗传学研究被视为心理测验的开端。
由他提出的相关的概念,为判定心理测验的信度、效度和因素分析奠定了基础。
卡特尔写的《心理测验与测量》,是心理测验第一次出现在心理学文献中。
比内与西蒙合作完成了世界上第一个智力测验量表“比内-西蒙量表”。
在经过高尔顿(19世纪80年代)、卡特尔(90年年代)、比内(20世纪初)的十年后,心理测验呈现出一下发展趋势:
a.操作测验的发展
b.团体测验的发展
c.能力倾向测验的发展
d.人格测验的发展
1.6.2现代心理测验在我国的发展
我国的测验大约源于1914年前后。
1979年以后进行大规模的修订。
近些年,我国的学者开始致力于本土化,编制适合我国文化背景的智力测验、适应行为量表等。
2测验的常模
2.1常模团体
2.1.1常模团体的性质*
常模团体是由某种共同特征的人所组成的一个群体,或者是该群体的一个样本,它用一个标准的、规范的分数表示出来,以提供比较的基础。
在制定常模之前,首先就是要确定常模团体。
对于编制者而言,常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能够代表该总体。
包括确定一般总体、目标总体以及样本。
对于使用者而言,现有的常模团体哪个适用?
2.1.2常模团体的条件
(1)群体的构成必须明确界定
(2)常模团体必须是所测群体的代表性样本
(3)样本大小要适当
(4)标准化样组是一定时空的产物
2.1.3取样的方法*
取样就是从目标人群中选取具有代表性的样本。
取样方法可以分为随机抽取和非随机抽取两种。
(1)简单随机抽样
(2)系统抽样
(3)分组抽样
(4)分层抽样
2.1.4常模分数与常模
(1)常模分数*
常模分数是施测常模团体样本被试后,将被试的原始分数按一定的规则转换出来的导出分数。
原始分数是将被试者的反应与标准答案相比较而获得的测验分数。
从测验中直接获得的。
导出分数是指由原始分数转换而来的分数。
导出分数具有一定的参照点和单位,是一个有意义的测验量表,与原始分数等值,可以进行比较。
导出分数具有意义、等单位和参照点。
(2)常模*
常模是指常模分数构成的分布,是解释测验分数的基础。
常模分为一般常模和特殊常模。
特殊常模是为非典型团体建立的,可使被试的结果与最接近的人进行比较。
2.2常模的类型
2.2.1发展常模
将各种发展水平的人的平均表现制成的量表就是发展常模,也称为年龄量表。
在这种量表中,个人的分数指出他的行为在按正常途径发展方面处于什么样的发展水平。
(1)发展顺序量表*
最直观的发展常模就是发展顺序常模。
最早常模是葛赛尔发展程序表。
按月份显示儿童在运动水平、适应性、语言、社会性方面的大致发展水平。
(2)智力年龄
比内-西蒙量表中最先使用智力年龄的概念。
儿童在年龄量表上所得的分数就是代表其智力水平,叫做智力年龄,简称智龄。
智龄是年龄量表上度量智力的单位。
(3)年龄当量
(3)年级当量
年级当量实际上就是年级量表,测验的结果说明哪一年级的水平,在教育成就测验中最常用。
2.2.2百分位常模
(1)百分等级*
百分等级是应用最广的表示测验分数的方法。
百分等级是指在常模样本中低于这个分数的人数比例。
其计算方法可以分为分组的和未分组的,两者只是计算方法不一样,百分等级的意义相同。
(2)百分点
也被称为百分位数,表示处于某一百分比例的人对应的测验分数是多少。
通过双向方式将原始分数与百分等级对照表一起编制,这就是百分位常模。
(3)四分位数和十分位数
两者只是百分位数的变式。
四分位数相当于百分等级的25%、50%、75%、100%。
十分位数相当于0-10%、10%-20%等。
2.2.3标准分常模*
标准分常模是将原始分数与平均分数的距离以标准差为单位表示出来的量表。
常见的标准分数有:
z分数、Z分数、T分数、离差智商(IQ)等。
(1)线性转换的标准分数
z分数为最典型的线性转换的标准分数。
(2)非线性转换的标准分数
当原始分数不是常态分布的,就需要通过非线性的转换。
一般将原始分数转换成百分等级,在转化为常态分布上相应的
均值,并可以表示为任何平均数和标准差。
重要的几个导出分数:
T分数:
平均值为50,标准差为10;
标准九分:
平均分为5,标准差差为2;
标准十分:
平均分为5,标准差为1.5;
标准二十分:
平均分为10,标准差为3.
(3)智商及其意义*
一般用比率智商和离差智商表示智力的高低。
a.比率智商
即心理年龄与实足年龄之比,在乘以100。
b.离差智商
是以年龄组为样本计算而得到的标准分数,平均数为100,标准差为15。
WAIS-RC的智商采用此智商。
2.3常模分数的表示方法*
2.3.1转换表法
转换表包含了一个特定的标准化样组的原始分数与其相对应的等值分数,如百分位、标准分数、T分数等。
2.3.2剖面图法
剖面图是将测验分数的转换关系用图形表示出来。
3测验的信度
3.1信度的概念
3.1.1信度的定义*
信度是指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。
信度只受随机误差的影响。
信度可以看作在总的方差中非测量误差的方差所占的比例。
在测量理论中,信度被定义为:
一组测量分数的真分数方差与总方差(实得分数的方差)的比率。
rXX=S²
T/S²
x
3.1.2信度的指标*
(1)信度系数与信度指数
信度是以信度系数为指标,它是一种相关系数。
理论上是真分数方差与实得分数的方差的比值。
信度指数的平方就是信度系数。
(2)测量标准误
理论上,常常用一个团体两次施测的结果,以估计测量误差的变异数。
两次测量的分数之差构成一个分布,这个分布的标准差便是标准误,它是测量中误差大小的客观指标。
3.2信度评估的方法*(概念)
3.2.1重测信度
重测信度,又称为稳定性系数,是指用同一个测验,在相同条件下对同一组被试施测两次所得到结果的相关系数。
两次测验时间间隔2-4周,不超过6个月。
3.2.2复本信度
复本信度,又称为等值性系数,是以两个等值但题目不同的测验(复本)来测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。
如果两个复本间隔一段时间施测,被称为重测复本信度或稳定与等值系数。
3.2信度评估的方法
3.2.3内部一致性信度
内部一致性信度反映了题目之间的关系,表示测验能够测量相同内容或特质的程度。
(1)分半信度
采用分半法估计所得的信度系数。
通常将一个测验分成对等的两半后,所有被试在这两半上所得分数的相关系数。
(2)同质性信度
它是指测验内部所有题目间的一致性。
相关高,测验是同质的,相关低,测验为异质的。
3.2.4评分者信度*
评分者信度是指多个评分者给同一批人的答卷进行评分的一致性。
这种评分方法主要用于主观题的测试。
当多个评分者评定多个对象时,并以等级法计分时,可采用肯德尔和谐系数(W)。
一般相关系数达到0.90以上,才认为评分者的结果可信。
3.3信度与测验分数的解释
3.3.1解释真分数与实得分数的相关
信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,即测验的总变异中真分数造成的变异占百分之几。
信度系数告诉了测量误差所占的比例。
3.3.2确定信度可以接受的水平
原则一:
当rxx<
0.7时,测验不能用于对个人做出评价;
当0.7≤rxx<
0.85时,测验可用于团体比较;
当rxx≥0.85时,才能用于鉴别或预测个人的成绩。
原则二:
新编测验的信度应高于原有的同类测验或相似测验。
3.3.3解释个人分数的意义
从信度的角度解释个人分数的意义,这就是测量标准误的应用。
它可以:
a.估计真分数的范围;
b.了解实得分数再测时可能的变化情形。
3.3.4比较不同测验分数的差异
测量的标准误和测验信度在评价两个不同测验的分数是否具有明显的差异,非常重要。
这种比较包含了两个人在不同分数的差别和同一被试在两个测验上的差别。
这就是差异分数的标准误问题。
3.4影响信度的因素*
3.4.1样本特征
(1)样本团体异质性的影响
(2)样本团体平均能力的影响
3.4.2测验的长度*
一般来说,增加同质的题目,可以使信度提高。
这是因为a.测验越长,测验的测题取样或内容取样就越具有代表性;
b.测验越长,被试猜测的因素就越小。
3.4影响信度的因素
3.4.3测验难度
一般来说,难度越大,信度就越低。
3.4.4时间间隔*
一般来说,间隔越短,信度越高,间隔越长,信度越低。
总之,信度受到随机误差的影响。
4测验的效度
4.1效度的概念
4.1.1效度的定义*
效度(validity)是指测量与所要测量的心理特点之间的符合程度,或者说一个测验的准确性。
在一系列的测量中,与测量目的有关的真实变异数(由所要测量的变因引起的有效变异)与总变异数(实得的变异数)的比率,即
r²
XY=S²
V/S²
X
XY=表示效度,S²
V表示有效方差,S²
X表示总方差
*信度与效度的关系
信度是效度的必要而非充分条件;
效度受信度的制约。
4.1.2效度的性质
(1)相对性
效度是相对于一定的测量目的而言的。
心理特质具有隐蔽性的特性,只能通过行为进行推测,因而测量只能达到某种程度的准确。
评鉴效度一定要考虑测验的目的和功能。
(2)连续性
效度通常用相关系数表示,只是符合程度的差异,而非“全有”或“全无”的关系。
此外,效度是针对测验结果而言的。
4.2效度评估的方法*(概念)
4.2.1内容效度
内容效度(contentvalidity)是指测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量行为领域的代表性取样。
内容效度的评估方法*
(1)专家判断法
(2)统计分析法
a.评分者评定结果的相关系数;
b.一组被试在独立取自同样内容范围的两个测验复本的相关系数;
c.学习前、后进行测量比较。
4.2效度评估的方法
(3)经验推测法通过实践来检验
内容效度的特性
a.相对性(内容和时间方面的相对性)
b.内容效度与表面效度的差异(表面效度是指外行对测验作表面上的确定的,它不反映测验实际测量的东西,而是表面上测验要测量的东西)
c.在编制测验时,表面效度是必须考虑的一个特性(最高行为测验要求表面效度高,典型行为测验却要求表面效度低)
4.2.2构想效度(结构效度)
构想效度是指测验实际测到所要测量的理论结构和特质的程度,即测验结果是否能够证实或解释某一理论的假设、术语或构想,解释的程度如何。
构想效度解决三个问题:
测验测量的心理构想(提出假设)、对构想测得有多好(编制测验)、测验分数有多少来自构想(检验假设)。
构想效度的评估方法*
(1)对测验本身的分析
a.测验的内容效度;
b.测验的内部一致性程度;
c.被试对题目的反应特点
(2)测验间的相互比较
a.新测验与已有测验之间的相关系数;
b.区分效度,与无关测验的相关系数较低;
c.因素分析法,提取影响测验分数的共同因素
(3)效标效度的研究证明
a.采用效标将被试进行分组,若两组测验分数差异显著,则构想效度好;
b.根据心理特质的发展变化而定,这只有涉及发展变化特点的理论构想才能去检验
(4)实验法和观察法
学习前、后分别进行测量
4.2.3效标效度(实证效度)
效标效度反映的是测验预测个体在某种情境下行为表现的有效性程度。
其中,被预测的行为是检验效度的标准,简称效标。
根据效标资料是否与测验分数同时获得,分为同时效度和预测效度。
前者通常与心理特征的评估及诊断有关,后者常用于选拔、分组。
效标效度的评估方法*
(1)相关法
a.积差相关法;
b.测验成绩是连续变量,效标资料是二分变量,使用点二列相关或二列相关;
c.当测验分数为连续变量,效标资料是等级评定,贾思朋多系列相关公式
(2)区分法
检验测验分数能否有效地区分由效标所定义的团体的一种方法。
检验两组之间分数差异的显著性(平均数或者百分比的重叠程度)。
4.3效度的功能
4.3.1预测误差
a.效度系数常以决定性系数来表示,表示测验正确预测或解释的效标的方差占总方差的比例。
b.估计的标准误,是指所有具有某一测验分数的被试其效度分数(Y)分布的标准差,是对真实分数估计的误差大小。
4.3.2预测效标分数
以测验分数(X)预测效标成绩(Y)。
4.3.3预测效率指数
将(1-r²
xy)½
作为无关系数,以K表示,K值的大小表明预测源分数与效标分数无关的程度。
4.4影响效度的因素
4.4.1测验本身的因素
主要是指取材的代表性、测验长度、试题类型、难度、区分度以及编排方式。
4.4.2测验施测中的干扰因素
a.主试的影响因素;
b.被试的影响因素
4.4.3样本团体的性质
a.样本团体的异质性;
b.干涉变量
4.4.4效标的性质
a.效标与测验分数的关系是否是线性关系;
b.效标本身的可靠性
5项目分析
5.1项目的难度
5.1.1定义*
难度是指项目的难易程度。
通常以通过率表示,即答对或通过该题的人数百分比来表示。
P=R/N(R答对通过该项目的人数;
N全体被试的人数)
5.1.2计算方法
(1)二分法计分的项目
将被试的总分按照从高到低或从低到高的顺序排列,将27%的高分段作为高分组,将后面的27%作为低分组。
计算方法为:
P=(PH+PL)/2
(2)非二分计分的项目
主要用于主观题的计算上。
计算公式是P=
5.2项目的区分度
5.1.3难度的水平确定
(1)项目的难度分析
难度分析的主要目的是为了能准确测量个体的差异。
难度取决于测验的目的、性质及项目的形式。
应注意几下几点:
a.能测到个体差异,难度最好在0.5左右;
b.测验用于选拔或诊断时,难度应接近录取率;
c.对选择题,P值应大于概率水平
(2)测验的难度
测验的难度取决于项目的难度,分数呈正态分布,则项目难度在0.5左右。
5.2.1区分度的定义*
项目的区分度(鉴别力)是指测验项目对被试的心理特性区分能力。
它是评价项目质量和筛选项目的主要指标,也是影响效度的重要因素。
5.2.2计算方法
理论上,项目区分度是以项目的得分高低与实际能力水平高低之间的相关来表示。
(1)鉴别指数
当效标的成绩是连续变量时,可以从分数分布的两端各选择27%的被试,分别计算出每道题目各自的通过率,两者之差便是鉴别度指数(D)。
D越大,区分的能力越好。
D=PH-PL
(2)相关法
以测验分数与效标成绩或测验总分相关作为区分度的指标。
相关越高,项目的区分能力越强。
a.点二列相关;
b.二列相关;
c.Ф相关法
5.2.3区分度与难度的关系*
区分度与难度有密切的相关。
当难度在0.5左右,区分度最好。
6测验编制的一般程序
6.1测验的项目分析
6.1.1测验的对象
要考虑被试的年龄、受教育程度和社会经济及阅读水平。
6.1.2测验的用途
所编制的测验是用于诊断,还是选拔与预测。
这需要事先注意。
一般来说,测验的用途分为显示和预测。
(1)显示性测验
显示性测验是指测验题目和所要测量的心理特征相似的测验。
古德纳夫将显示性测验分为样本测验和标记测验。
样本测验是指题目来自一个明确的总体的测验;
标记测验是指题目取自一个全开放的总体的测验。
(2)预测性测验
预测性测验是指预测一些没被测量的行为的测验。
6.2测验的编写
6.2.1搜集资料
题目的来源有以下几个方面:
已出版的标准测验;
理论和专家的经验;
临床的观察和记录。
6.2.2命题的一般原则
要注意测验的内容、文字、理解和社会敏感性。
6.2.3测题的编制要领
测题常分为提供型和选择型题目。
提供型题目要求被试提供正确的答案,选择型题目则要求被试在有效的几个答案中选择正确的答案。
(1)选择题
a.题干