北大自考心理测验学串讲笔记.docx
《北大自考心理测验学串讲笔记.docx》由会员分享,可在线阅读,更多相关《北大自考心理测验学串讲笔记.docx(22页珍藏版)》请在冰豆网上搜索。
北大自考心理测验学串讲笔记
北大自考心理测验学串讲笔记
第一章总论
第一节心理测验的历史回顾
古代教育学家孔子
孟子明确指出了心理能力和心理特征与物理现象一样,具有可测量的特征。
南朝人刘勰在《新论•专学篇》,他不仅观察到左手画方右手画圆不易实现这种现象,而且认为其原因是一心不能二用,这恐怕应该算是世界上最早的“分心测验”了。
1925年格塞尔婴儿发展量表的前导。
中国民间广泛流行的“七巧板”,在某些方面可以作为创造力测验的一种方法。
科举考试中的帖经和对偶,类似于现代西方言语测验中常见的填字和类比。
中国古代心理测验的思想,东方文化特点:
首先,他们都是描述性的,没有定量的标准;其次,心理测验往往将心理特点(能力、人格、智力等)与道德观念联系起来。
7.科学心理测验产生的原因。
⑴对智力落后者分类和训练的早期关注。
心理测验产生的最初原因是对智力落后和精神病人治疗的需要。
1838年法国医生埃斯科罗出版了两卷本著作,第一次明确地对智力落后与精神病人作出了区分。
另一位法国医生塞国恩的贡献也特别重要,他是训练智力落后者的先驱。
⑵冯特的实验心理学。
实验心理学的诞生是心理测验产生的另一个重要原因。
1879年冯特在德国莱比锡大学建立了心理学史上第一个实验室,许多早期试验心理学家都在这里接受训练。
实验心理学的诞生和发展,还给心理测验带来了另一个副产品:
严格的标准化程序。
8.英国生物学家和心理学家高尔顿是倡导测验运动的主要人物。
这虽然不是正式的心理测验,但可视为心理测验的开端。
高尔顿也是评定量表和问卷法应用的先驱,另一个重要贡献是他还为心理测验奠定了统计学基础。
9.美国心理学家卡特尔1890年在《心理》杂志上发表了“心理测验与测量”一文,这是心理测验第一次出现于心理学文献中。
10.比内-西蒙量表在1905年发表,它是世界上第一个正式的心理测验。
比内于1857年出生于法国尼斯,起初学习法律,继而改学医学,以后致力于心理测验的研究。
1904年法国教育部委派许多教育家、医学家和其他科学家组成一个委员会,专门研究公立学校中智力落后儿童的教育方法。
文章中他中介绍了一个包括30个项目的量表。
这个量表很粗糙,尚不能准确地测量智商,但它在心理测验史上极其重要,是世界上第一个正式的心理测验。
比内-西蒙量表在1905年发表,比内和西蒙亲自主持过两次修订,一次在1908年,一次在1911年。
测验的结果用“智力水平”表示,但其通常翻译和提法为“智力年龄”。
比内在1911年去世。
11.心理测验的蓬勃发展
纵观心理测验的发展,人们常说19世纪80年代时高尔顿的10年,90年代是卡特尔的10年,20世纪头10年则是比内的智力测验的10年。
⑴操作测验的发展。
由于理论上的缺陷和实际上的需要,所以就有操作测验的问世和发展。
⑵团体智力测验的发展。
运用团体测验可以在同一时间内测量许多被试,这是心理测验方式的极大进步,扩大了测验的应用范围。
⑶能力倾向测验的发展。
这些测验为了分析个人心理品质的内部结构提供了适用的工具,逐渐受到人们的重视。
此外,普通能力倾向(智力)测验也向多元化发展。
⑷人格测验的发展。
心理测验的另一领域是涉及情感或行为等非智力方面的人格评估,通常包括对性格、气质、情绪状态、人际关系、动机、兴趣和态度的测量。
现代西方心理学的发展,受到计算机的发生和发展,以及统计方法的改进的极大影响。
而“因素分析”的理论从1904年斯皮尔曼提出智力二音素论开始,经心理学家近一个世纪的争论和研究,已日趋成熟和完善,给现代心理学测验奠定了坚实的基础。
12.中华人民共和国成立前心理测验的发展。
1916年樊炳清先生首先介绍了比内-西蒙智力量表。
1920年,北京高等师范学校和南京高等师范学校建立了我国最早的两所心理实验式。
1921年,他俩正式出版《心理测验法》一书,成为中国最早的心理测验专著。
1922年,中华教育改进社聘请美国教育心理测验专家麦考尔来华讲学,并主持编制心理测验事宜。
1924年,陆志韦发表了《订正比内西蒙智力测验说明书》,30年代又与吴天敏再次做了修订;1931年,由艾伟、陆志韦、陈鹤琴、萧孝嵘等倡议,组织并成立了中国测验学会;1932年,《测验》杂志创刊。
13.中华人民共和国成立后心理测验的发展
1979年,林传鼎、张厚粲等以国外资料为参考,编制了少年儿童学习能力测验;1989年,成立中国心理学会心理测验专业委员会,标志着中国心理测验已进入了一个新的高速发展时期。
第二节心理测验的性质、种类和功能
1.测量:
就是根据一定的法则,用数字对事物加以确定。
所谓“一定的法则”是指测量行为发生时采用的规则或方法。
所谓“事物”是指我们要测量的感兴趣的事物的属性或特征。
一般来说,用数字对事物加以确定,就是确定一个事物的属性的量的多少。
通常人们所说的测量,指的是给事物确定出一种数量化的价值。
2.测量有两个要素:
一是参照点,二是单位。
对任何事物确定出一个量都要有一个计算的起始点,这个点就是参照点。
参照点可以分为两种,一种是绝对的零点,另一种是相对参照点。
心理测验中所用的参照点都是相对的,因而测量的结果常常不能以“倍数”的方式解释。
理想的单位的条件:
有明确的意义和有相等的价值。
3.量表就是有参照点和单位的连续体。
命名量表:
是水平最低的一种测量量表,用数字来代替事物或对事物进行分类;不能进行加减乘除。
顺序量表:
不仅表明类别,还能表明不通类别的大小等级,或具有某种属性的程度;不能进行乘除运算。
等距量表:
不仅有大小关系,而且又有相等的单位,因此可以加减运算,但没有绝对零点,所以不能做乘除运算;
比例量表:
是最精确的测量,既有相等的单位,又有绝对零点。
4.心理量表的性质:
一般来说,心理测量是在顺序量表上进行的。
因为对于人的智力、性格、气质、兴趣、态度等来说,绝对零点时难以确定的。
虽然心理现象适合在顺序量表上进行测量,但大多数心理学家喜欢把测验成绩转换为等距量表,最常用的转换方法是转换为标准分数,即把顺序量表转变成以标准差为单位的等距量表。
5.什么是心理测验?
著名的心理测验专家阿娜斯塔西认为“心理试验实质上是行为样本的客观的和标准化的测量”。
行为样本:
心理测验在测量个别差异的时候,往往也只是对少数经过慎重选择的样本进行观察,来间接推知被试的心理特征。
标准化:
是指测验编制、实施、记分以及测验分数解释程序的一致性,标准化的量一个重要步骤是建立有代表性的常模。
客观性:
心理测验的客观性的某些方面,总是与标准化的讨论联系在一起的,即对心理测验的客观性要求牵涉到标准化的问题,因此,在不受被试主观判断支配的范围内,测验的实施、评分、解释应是客观的,要尽量减少主试和被试的随意程度。
客观性另一个主要方面是测题或整个测验的难度水平的确定必须客观。
6.心理测验的性质
(1)心理测验的间接性:
迄今为止,我们还无法直接测量人的心理,只能通过测量人的外显行为,即测量人们对测验题目的反应来推断出他的心理特质。
(2)心理测验的相对性:
我们在比较不同人之间的行为或心理特征时,没有绝对的标准,也没有绝对的标准,也没有绝对的零点,我们有的只是一个连续的行为序列。
所以每一个被测得的结果,都是与他所在团体或人群的大多数人的行为,或某种人为确定的标准相比较而言的。
(3)心理测验的客观性:
首先,测验用的项目或作业、施测说明、施测者的言语态度及施测时的物理环境等,均经过标准化,测验的刺激是客观的。
其次,评分计分原则和手续经过了标准化,对反应的量化是客观的。
再次,分数转换和解释经过了标准化,对结果的推论是客观的。
7.心理测验的种类:
(1)按测验的功能分类:
智力测验、特殊能力测验和人格测验。
人格测验:
明尼苏达多项人格调查表(MMPI)、16种人格因素问卷(16PF)、艾森克人格问卷(EPQ)、罗夏墨迹测验、主题统觉测验(TAT)。
(2)按测验材料的性质分类:
文字测验、操作测验。
⑶按测验材料的严谨程度分类:
客观测验、投射测验。
⑷按测验的方式分类:
个别测验、团体测验。
8.论述心理测验的功能:
⑴从实际应用角度看:
人才选拔、岗位安置、临床诊断、教育评价、心理咨询和治疗
⑵从理论研究角度看:
搜集资料、提出和验证假设、实验分组
第三节正确对待和使用测验
1.错误的测验观:
⑴测验万能论;⑵测验无用论①某些人格测验侵犯了个人隐私;②测验为宿命论和种族歧视提供了心理学依据。
⑶心理测验即智力测验。
2.正确的测验观:
(1)重要的心理学研究方法和决策的辅助工具:
除实验法以外,心理测验法的出现是心理科学发展史上的一大进步,是心理学研究中不可缺少的研究方法之一。
这是若有相应的心理测验,就可以帮助有关部门作出科学的决策。
(2)作为研究方法和测量工具尚不完善:
尽管心理测验是心理学研究的必要手段,而且实际生活中也在广泛应用,但是心理测验从理论到方法都还存在许多问题,尤其过分夸大心理测验的科学性和准确性是不对的。
(3)科学地看待心理测验,防止乱用测验:
①测验使用者必须具备一定的资格;②慎重选择测验量表;③与被试建立良好的协调关系;④正确解释测验结果;⑤注意测验的保密。
对测验的保密主要有两个方面:
一是对测验内容的保密;二是对测验结果几个人隐私保密。
第二章心理测验的编制
第一节心理测验的对象、目的及目标
1.在编制测验前首先要明确测量的对象:
也就是该测验编成后要用于哪些团体。
其包括三个重要的维度,即年龄、教育水平和文化背景。
2.测验的目的:
一般来说;显示和预测。
由此我们可以分为两类测验:
显示性测验和预测性测验。
(1)显示性测验:
是指测验题目和所要测量的心理特征相似的测验。
有些观察法、行为评估法也都是显示性测验,题目取自一个很明确的总体的测验即是样本测验,题目取自一个全开发的总体的测验即是标记测验。
(2)预测性测验:
指预测一些没被测量的行为的测验。
心理测验的目标是指编制的测验是测什么的,即用来测量什么样的心理变量或行为特征。
(1)工作分析:
对于选拔和预测功用的预测性测验,主要任务是对所预测的行为活动作具体分析,我们称之为任务分析或工作分析。
(2)对特定概念下定义:
如果测验是为了测量某种特殊的心理品质或特点,那么测验编制者就必须给所要测量的心理或行为特质下定义,然后必须发现该特质所包含的维量将通过什么行为表现出来或怎样进行测量。
(3)确定测验的具体内容:
如果测验是描述性的显示测验,它的目标分析的主要任务则是确定显示的内容和技能,从中取样。
第二节测题的编写技术
1.搜集有关资料:
题目的有关来源
(1)已出版的标准测验
(2)理论和专家的经验(3)临床观察和记录
2.命题的原则及编写要领:
1、命题的原则(理解):
⑴内容方面。
首先,要求题目的内容符合测验的目的;其次,内容取样要有代表性;第三,题目间内容相互独立,互不牵连。
⑵文字方面。
使用语言要准确,语句要简明扼要,最好一句话说明一个概念,尽量少使用双重否定句。
⑶理解方面。
题目应有确切的答案,题目的内容不要超出受测团体的知识水平和理解能力,题目格式要容易理解。
⑷社会敏感性方面。
应尽量避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用。
菲利普对于涉及社会敏感性问题,怎样鼓励被试作出真实回答的策略:
◇1命题时假定被试具有某种行为,、使他不得不在确实没有该行为时才否定,可避免否定过多的倾向。
◇2命题时假定规范不一致。
◇3指出该行为是常见的,虽然是违规的。
2、测题的编制要求:
对心理测验的题目进行分类的标准很多,常见的分类是根据对被试的要求不同来分,可以分为两大类:
提供型选择型题目。
提供型题目要求被试给出正确答案,如论文题、简答题、填充题等;选择型题目要求被试在有限的几个答案中选择正确的答案,如选择题、是否题、匹配题等。
选择题我们比较熟悉,它由两部分分构成:
提干和选择。
题干就是呈现一个问题的情景,一般由直接问句或不完全的陈述问或不完全的陈述句构成。
选项就是问题的多种可能答案,,常常是包括一个正确答案,若干(一般是1—5个)错误答案,其中错误的答案叫“诱答”。
第三节测验的编排和组织
一、测题的编排
1、测验编排的一般原则:
⑴测题的难度排列易逐步上升。
⑵尽可能将同类型的测题组合在一起。
⑶各种类型测题本身的特点。
2.两种常见的试题排列方式:
(1)并列直进式:
整个测验按试题材料的性质归为若干分测验,在同一分测验的试题依其难度由容易到难排列。
(2)混合螺旋式:
先将各类试题依难度分成若干不同层次,再将不同性质的试题加以组合,作交叉式排列,难度则渐次升进.
第三章 测验的信度
第一节 信度的概念
1.信度是指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。
信度只受随机误差的影响,随机误差越大,信度越低。
信度理论定义:
传统的信度理论认为,每一个测验的实得分数(X)总是由真实分数(T)和误差(E),两个部份构成的,公式为:
X=T+E
讨论一组测验分数的特性时,可用方差导标具体分数,公式:
(测验实得分数的方差)=(测验真分数的方差)+(测验误差的方差)
操作定义:
一组测量分数的真分数方差与总方差(实得分数的方差)的比率,或者是真实分数方差占总方差的的百分比。
计算公式:
由于真实分数的方差是无法统计的,因此公式3-3可转化为:
在(书上)图3-1下面的话看一看。
2、信度的指标
(1)信度系数:
大部分情况下,信度是信度系数为指标,它是一种相关系数。
理论上说就是真分数方差与实得分数的方差的比值,公式是:
(2)测量标准误:
信度系数表示一组测量的实得分数与真分数的符合程度,但并没有直接支出个人测量分数的变异量。
测量的标准误与信度之间呈反比关系:
标准误越小,信度越;标准误越大,信度越低。
3、信度与测验分数的解释:
(1)解释真实分数与实得分数的相关:
信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。
(2)比较信度可以接受的水平:
一个测验究竟信度多高才适合,才让人满意呢?
当然,最理想的情况是=1.00,但实际上办不到。
一般原则是:
当<0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当0.70≤<0.85时,可用于团体比较;当≥0.85时,才能用来鉴别或预测个人成绩或作为。
(3)解释个人分数的意义:
从信度可以解释个人分数的意义,这是测量标准误的应用。
它有两个作用:
一是估计真实分数的范围;二是了解实得分数再测时可能的变化情形。
看书公式3-8。
(4)比较不同测验分数的差异:
测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。
这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。
第二节信度的类型及估计方法
1、重测信度:
又称稳定性系数。
他的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系数。
最适宜的时距随测验的目的、性质和被试的特点而异,一般是两周到四周较宜,间隔时间最好不超过六个月。
重测信度的前提假设是:
⑴所测量的特性必须是稳定的;⑵每个人对前一次反应的遗忘程度相同;⑶在时间间隔中没有学习另外的与测验有关的东西。
2、复本信度:
又称等值性系数。
它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。
复本信度的高低关键取决于复本测验的选择,因而是题目取样问题。
同重测信度一样,复本信度也要考虑两个复本实施时间间隔。
如果两个复本几乎是在同一时间内施测的,相关系数反映的才是不同复本的关系,而不掺有时间的影响。
如果两个复本的施测相隔一段时间,则称稳定与等值系数。
稳定与等值系数既考虑了测验在时间上的稳定性,也考虑了不同题目样本反应的一致性,因而是更为严格的信度考察方法,也是应用较为广泛的方法。
内部一致性信度包括:
分半信度和同质性信度。
(1)分半信度:
指采用分办法估计所得的信度系数。
这种方法估计信度系数只需一种测验形式,实施一次测验。
通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。
○1常见的是将测题按其序列号的奇偶分半,这种分法的前提是:
测题并非随机排列,而是按某种顺序(如难度)排列;如果随机排列的题目,则必须是所有题目平等的(要么难度相等,要么性质一样);如果测验有多个分量表,应该在分量表内部排好顺序,再把各分量表分两半组合起来求相关。
○2常用的修正公式是:
斯皮尔曼-布朗公式:
3、斯皮尔曼-布朗公式为经验公式,他的假设条件是两半测验分数的变异数相等,但实际资料有时未必完全符合这一条件。
当假设不成立时,可采用:
弗朗那根公式或卢伦公式中的任一一个。
(公式见书3-12、3-13)
同质性信度:
指测验内部所有题目间的一致性。
当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,测验即为同质的;若所有题目看起来好像测量的是同一特质,但相关很低或为负相关时,测验即为异质的。
此外,对于一些复杂的、异质的心理学变量,采用单一的同质性测验是不行的,因而常常采用若干相对异质的分测验,并使每个分测验内容具有同质性,这样每个分测验就能用来预测异质效标的某一方面。
同质性信度的公式主要有:
库德-理查逊公式:
常用的是K-R20公式,在个各测题难度相同或近似的情况
下,还可采用计算更为简便的K-R21公式。
克伦巴赫α系数(这几个公式在书上好好看看)
4、评分者信度:
用于测量不同评分者之间所产生的误差。
为了衡量评分者之间的信度高低,可随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据美分测验卷的两个分数计算相关,即得评分者信度。
一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。
第三节影响信度的因素
1、样本的特征:
(1)样本团体分数分布的影响:
任何相关关系都是受到团体中分数分布的影响,当分布范围增大时,其信度估计就较高;当分布范围减小时,相关系数随之下降,信度值则较低。
(2)样本团体异质性的影响:
若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。
样本团体平均能力水平的影响:
对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。
2、测验的长度:
在一个测验中增加同质的题目,可以使信度提高。
①测验越长,测验的测题取样或内容取样越有代表性;②测验越长,被试的猜测因素影响越小。
3、测验的难度:
如果一个测验对某团体而言太容易,会使所得分数都集中在高分端;当题目太困难时,得分就会集中在低分端。
两种情况均会使信度样本的分数范围变窄,从而使测验变得不够可靠。
4、测验的时间间隔:
以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越久,其它变因介入的可能性越大,受外界的影响越大,信度系数便越低。
第四章测验的效度
第一节效度的概念
1、效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。
效度是科学测量工具最重要的必备条件。
(1)一组测验分数的总方差等于真实方差与误差方差之和,而真实方差又可分为两部分,即有关的方差和无关的但稳定的方差,后者也就是所谓系统误差带来的方差(公式4-2)。
2、信度和效度的关系
(1)信度是效度的必要而非充分条件:
从方差分配公式:
可以看出,增大,即效度高,信度的真方差()必然大,故信度必然高。
当信度高时,即降低时,是否增加还要看是否增减,因此效度不一定就高。
效度高必然信度高,而信度高并不一定保证效度高,说明信度高只是效度高的必然条件,并不是效度高的充分条件。
(2)效度是受信度制约的
3、效度的性质:
(1)a效度具有相对性:
在评鉴测验的效度时,必须考虑其目的与功能。
只有所测的结果符合该测验的目,才能认为它是个有效的测量工具。
(2)效度具有连续性。
测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。
因此,我们评价一个测验时,不应该说“有效”或“无效”,而应该用效度较高或效度较低来评价。
第二节效度的类型与估计方法
一、效度的类型及评估方法
1、内容效度:
指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。
(名词解释)
(1)想编制有较高内容效度的心理测验:
○1要对所测量的心理特性有个明确的概念,并划定出哪些行为与这心理特性有关,又比较密切。
○2测验题目应是所界定的内容范围的代表性取样。
(2)需要说明的是,要求内容效度的测验,并不一定要求测验为同质的。
2、内容效度的评估方法:
(1)专家判断法:
为了确定一个测验是否有内容效度,最常用的方法是请有关专家对测验题目与原定内容的符合性作出判断,看测验的题目是否代表规定的内容。
如果专家认为测验题目代表了所测内容,测验就是有内容效度。
由于这种估计效度的方法,是一个逻辑分析的过程,所以内容效度有时也可称为“逻辑效度”。
(2)统计分析法:
计算两个评分者之间评定的一致性,虽然考察的是评分者的判断信度,但由于来自两个独立的评判者,因此符合程度越高越能反映测验的内容效度。
克伦巴赫提出,内容效度可由一组被试在独立取得自同样内容范围的两个测验复本上得分之相关来作数量的估计。
再测法也可用于内容效度的评估。
(3)经验推测法:
通过实践来检验效度。
如果通过率是随着年龄的增加而增加,就可以推测该测验有内容效度。
3、内容效度与表面效度的关系:
经常混淆。
表面效度是由外行对测验作表面上的检查确定的,它不反映测验实际测量的东西,只是指测验表面上看来好像是所要测的东西;内容效度是由够资格的判断者(专家)详尽地、系统地对测验作评价建立的。
虽然二者都是根据测验内容作出的主观判断,但判断的标准不同。
前者只考虑题目与测量目的之间的明显的、直接的关系,后者则考虑到题目与测量目的和内容总体之间逻辑的微妙关系。
如果测验内容看起来与测量目标和要作的决定不相干,就会使被试产生不配合、马马马乎乎、应付了事等反应,而影响测验的效度。
相反,典型行为测验却要求较低的表面效度。
如果被试很容易从测验题目看出测验的目的,就可能产生反应偏差(如掩饰等)。
二、构想效度
1、构想效度:
1954年提出,有人翻译为构思效度,也有叫结构效度。
它是指测验能够测量到理论上的构想和特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。
2、构想效度的估计方法:
(1)对测验本身的分析:
对测验本身的分析:
测验的内容效度可以作为构思效度的证据;测验的同质性指标可以推断测验是测量单一特质还是测量多种特质,从而为评估测验构思效度提供证据;分析被试对题目的反应特点也可以作为构思效度的证据。
(2)测验间的相互比较:
相容效度是构思效度的一个证据。
区分效度是构思效度的又一个证据,一个有效的测验不仅应与其他测量同一构思的测验有关,而且还必须与测量不同构思的测验无相关;因素分析法也是建立构思效度的常用方法,通过对一组测验进行因素分析,可以找到影响测验分数的共同因素,这种因素可能就是我们要测量的心理特质(构思)。
(3)效标效度的研究证明:
一个测验若效标度理想,那么该测验所预测的效标的性质和种类就可以作为分析测验