自学考试《心理测验学》重难点汇总文档格式.docx
《自学考试《心理测验学》重难点汇总文档格式.docx》由会员分享,可在线阅读,更多相关《自学考试《心理测验学》重难点汇总文档格式.docx(12页珍藏版)》请在冰豆网上搜索。
由于理论上的缺陷和实际上的需要,所以就有操作测验的问世和发展。
⑵团体智力测验的发展。
运用团体测验可以在同一时间内测量许多被试,这是心理测验方式的极大进步,扩大了测验的应用范围。
⑶能力倾向测验的发展。
这些测验为了分析个人心理品质的内部结构提供了适用的工具,逐渐受到人们的重视。
此外,普通能力倾向(智力)测验也向多元化发展。
⑷人格测验的发展。
心理测验的另一领域是涉及情感或行为等非智力方面的人格评估,通常包括对性格、气质、情绪状态、人际关系、动机、兴趣和态度的测量。
现代西方心理学的发展,受到计算机的发生和发展,以及统计方法的改进的极大影响。
而“因素分析”的理论从1904年斯皮尔曼提出智力二音素论开始,经心理学家近一个世纪的争论和研究,已日趋成熟和完善,给现代心理学测验奠定了坚实的基础。
12.中华人民共和国成立前心理测验的发展。
1916年樊炳清先生首先介绍了比内-西蒙智力量表。
1920年,北京高等师范学校和南京高等师范学校建立了我国最早的两所心理实验式。
1921年,他俩正式出版《心理测验法》一书,成为中国最早的心理测验专著。
1922年,中华教育改进社聘请美国教育心理测验专家麦考尔来华讲学,并主持编制心理测验事宜。
1924年,陆志韦发表了《订正比内西蒙智力测验说明书》,30年代又与吴天敏再次做了修订;
1931年,由艾伟、陆志韦、陈鹤琴、萧孝嵘等倡议,组织并成立了中国测验学会;
1932年,《测验》杂志创刊。
2010年自学考试《心理测验学》重难点归纳
(2)
1.在编制测验前首先要明确测量的对象:
也就是该测验编成后要用于哪些团体。
其包括三个重要的维度,即年龄、教育水平和文化背景。
2.测验的目的:
一般来说;
显示和预测。
由此我们可以分为两类测验:
显示性测验和预测性测验。
(1)显示性测验:
是指测验题目和所要测量的心理特征相似的测验。
有些观察法、行为评估法也都是显示性测验,题目取自一个很明确的总体的测验即是样本测验,题目取自一个全开发的总体的测验即是标记测验。
(2)预测性测验:
指预测一些没被测量的行为的测验。
心理测验的目标是指编制的测验是测什么的,即用来测量什么样的心理变量或行为特征。
(1)工作分析:
对于选拔和预测功用的预测性测验,主要任务是对所预测的行为活动作具体分析,我们称之为任务分析或工作分析。
(2)对特定概念下定义:
如果测验是为了测量某种特殊的心理品质或特点,那么测验编制者就必须给所要测量的心理或行为特质下定义,然后必须发现该特质所包含的维量将通过什么行为表现出来或怎样进行测量。
(3)确定测验的具体内容:
如果测验是描述性的显示测验,它的目标分析的主要任务则是确定显示的内容和技能,从中取样。
1.搜集有关资料:
题目的有关来源
(1)已出版的标准测验
(2)理论和专家的经验(3)临床观察和记录
2.命题的原则及编写要领:
1、命题的原则(理解):
⑴内容方面。
首先,要求题目的内容符合测验的目的;
其次,内容取样要有代表性;
第三,题目间内容相互独立,互不牵连。
⑵文字方面。
使用语言要准确,语句要简明扼要,最好一句话说明一个概念,尽量少使用双重否定句。
⑶理解方面。
题目应有确切的答案,题目的内容不要超出受测团体的知识水平和理解能力,题目格式要容易理解。
⑷社会敏感性方面。
应尽量避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用。
菲利普对于涉及社会敏感性问题,怎样鼓励被试作出真实回答的策略:
◇1命题时假定被试具有某种行为,、使他不得不在确实没有该行为时才否定,可避免否定过多的倾向。
◇2命题时假定规范不一致。
◇3指出该行为是常见的,虽然是违规的。
2、测题的编制要求:
对心理测验的题目进行分类的标准很多,常见的分类是根据对被试的要求不同来分,可以分为两大类:
提供型选择型题目。
提供型题目要求被试给出正确答案,如论文题、简答题、填充题等;
选择型题目要求被试在有限的几个答案中选择正确的答案,如选择题、是否题、匹配题等。
选择题我们比较熟悉,它由两部分分构成:
提干和选择。
题干就是呈现一个问题的情景,一般由直接问句或不完全的陈述问或不完全的陈述句构成。
选项就是问题的多种可能答案,,常常是包括一个正确答案,若干(一般是1—5个)错误答案,其中错误的答案叫“诱答”。
一、测题的编排
1、测验编排的一般原则:
⑴测题的难度排列易逐步上升。
⑵尽可能将同类型的测题组合在一起。
⑶各种类型测题本身的特点。
2.两种常见的试题排列方式:
(1)并列直进式:
整个测验按试题材料的性质归为若干分测验,在同一分测验的试题依其难度由容易到难排列。
(2)混合螺旋式:
先将各类试题依难度分成若干不同层次,再将不同性质的试题加以组合,作交叉式排列,难度则渐次升进。
2010年自学考试《心理测验学》重难点归纳(3)
1.信度是指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。
信度只受随机误差的影响,随机误差越大,信度越低。
信度理论定义:
传统的信度理论认为,每一个测验的实得分数(X)总是由真实分数(T)和误差(E),两个部份构成的,公式为:
X=T+E
讨论一组测验分数的特性时,可用方差导标具体分数,公式:
(测验实得分数的方差)=(测验真分数的方差)+(测验误差的方差)
操作定义:
一组测量分数的真分数方差与总方差(实得分数的方差)的比率,或者是真实分数方差占总方差的的百分比。
计算公式:
由于真实分数的方差是无法统计的,因此公式3-3可转化为:
在(书上)图3-1下面的话看一看。
2、信度的指标
(1)信度系数:
大部分情况下,信度是信度系数为指标,它是一种相关系数。
理论上说就是真分数方差与实得分数的方差的比值,公式是:
(2)测量标准误:
信度系数表示一组测量的实得分数与真分数的符合程度,但并没有直接支出个人测量分数的变异量。
测量的标准误与信度之间呈反比关系:
标准误越小,信度越;
标准误越大,信度越低。
3、信度与测验分数的解释:
(1)解释真实分数与实得分数的相关:
信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。
(2)比较信度可以接受的水平:
一个测验究竟信度多高才适合,才让人满意呢?
当然,最理想的情况是=1.00,但实际上办不到。
一般原则是:
当<
0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较;
当0.70≤<
0.85时,可用于团体比较;
当≥0.85时,才能用来鉴别或预测个人成绩或作为。
(3)解释个人分数的意义:
从信度可以解释个人分数的意义,这是测量标准误的应用。
它有两个作用:
一是估计真实分数的范围;
二是了解实得分数再测时可能的变化情形。
看书公式3-8.(4)比较不同测验分数的差异:
测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。
这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。
1、重测信度:
又称稳定性系数。
他的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系数。
最适宜的时距随测验的目的、性质和被试的特点而异,一般是两周到四周较宜,间隔时间最好不超过六个月。
重测信度的前提假设是:
⑴所测量的特性必须是稳定的;
⑵每个人对前一次反应的遗忘程度相同;
⑶在时间间隔中没有学习另外的与测验有关的东西。
2、复本信度:
又称等值性系数。
它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。
复本信度的高低关键取决于复本测验的选择,因而是题目取样问题。
同重测信度一样,复本信度也要考虑两个复本实施时间间隔。
如果两个复本几乎是在同一时间内施测的,相关系数反映的才是不同复本的关系,而不掺有时间的影响。
如果两个复本的施测相隔一段时间,则称稳定与等值系数。
稳定与等值系数既考虑了测验在时间上的稳定性,也考虑了不同题目样本反应的一致性,因而是更为严格的信度考察方法,也是应用较为广泛的方法。
2010年自学考试《心理测验学》重难点归纳(4)
1、效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。
效度是科学测量工具最重要的必备条件。
(1)一组测验分数的总方差等于真实方差与误差方差之和,而真实方差又可分为两部分,即有关的方差和无关的但稳定的方差,后者也就是所谓系统误差带来的方差(公式4-2)。
2、信度和效度的关系
(1)信度是效度的必要而非充分条件:
从方差分配公式:
可以看出,增大,即效度高,信度的真方差()必然大,故信度必然高。
当信度高时,即降低时,是否增加还要看是否增减,因此效度不一定就高。
效度高必然信度高,而信度高并不一定保证效度高,说明信度高只是效度高的必然条件,并不是效度高的充分条件。
(2)效度是受信度制约的
3、效度的性质:
(1)a效度具有相对性:
在评鉴测验的效度时,必须考虑其目的与功能。
只有所测的结果符合该测验的目,才能认为它是个有效的测量工具。
(2)效度具有连续性。
测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。
因此,我们评价一个测验时,不应该说“有效”或“无效”,而应该用效度较高或效度较低来评价。
效度的类型及评估方法
1、内容效度:
指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。
(名词解释)
(1)想编制有较高内容效度的心理测验:
○1要对所测量的心理特性有个明确的概念,并划定出哪些行为与这心理特性有关,又比较密切。
○2测验题目应是所界定的内容范围的代表性取样。
(2)需要说明的是,要求内容效度的测验,并不一定要求测验为同质的。
2、内容效度的评估方法:
(1)专家判断法:
为了确定一个测验是否有内容效度,最常用的方法是请有关专家对测验题目与原定内容的符合性作出判断,看测验的题目是否代表规定的内容。
如果专家认为测验题目代表了所测内容,测验就是有内容效度。
由于这种估计效度的方法,是一个逻辑分析的过程,所以内容效度有时也可称为“逻辑效度”。
(2)统计分析法:
计算两个评分者之间评定的一致性,虽然考察的是评分者的判断信度,但由于来自两个独立的评判者,因此符合程度越高越能反映测验的内容效度。
克伦巴赫提出,内容效度可由一组被试在独立取得自同样内容范围的两个测验复本上得分之相关来作数量的估计。
再测法也可用于内容效度的评估。
(3)经验推测法:
通过实践来检验效度。
如果通过率是随着年龄的增加而增加,就可以推测该测验有内容效度。
3、内容效度与表面效度的关系:
经常混淆。
表面效度是由外行对测验作表面上的检查确定的,它不反映测验实际测量的东西,只是指测验表面上看来好像是所要测的东西;
内容效度是由够资格的判断者(专家)详尽地、系统地对测验作评价建立的。
虽然二者都是根据测验内容作出的主观判断,但判断的标准不同。
前者只考虑题目与测量目的之间的明显的、直接的关系,后者则考虑到题目与测量目的和内容总体之间逻辑的微妙关系。
如果测验内容看起来与测量目标和要作的决定不相干,就会使被试产生不配合、马马马乎乎、应付了事等反应,而影响测验的效度。
相反,典型行为测验却要求较低的表面效度。
如果被试很容易从测验题目看出测验的目的,就可能产生反应偏差(如掩饰等)。
构想效度
1、构想效度:
1954年提出,有人翻译为构思效度,也有叫结构效度。
它是指测验能够测量到理论上的构想和特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。
2、构想效度的估计方法:
(1)对测验本身的分析:
对测验本身的分析:
测验的内容效度可以作为构思效度的证据;
测验的同质性指标可以推断测验是测量单一特质还是测量多种特质,从而为评估测验构思效度提供证据;
分析被试对题目的反应特点也可以作为构思效度的证据。
(2)测验间的相互比较:
相容效度是构思效度的一个证据。
区分效度是构思效度的又一个证据,一个有效的测验不仅应与其他测量同一构思的测验有关,而且还必须与测量不同构思的测验无相关;
因素分析法也是建立构思效度的常用方法,通过对一组测验进行因素分析,可以找到影响测验分数的共同因素,这种因素可能就是我们要测量的心理特质(构思)。
(3)效标效度的研究证明:
一个测验若效标度理想,那么该测验所预测的效标的性质和种类就可以作为分析测验构思效度的指标,另一种证实构思效度的方法是心理特质的发展变化。
实验法和观察法证实:
观察实验前和实验后分数的差异是验证构思效度的方法。
效标效度
1、效标效度:
又称实证效度,反映的是测验预测个体在某种情境下行为表现的有效性程度。
被预测的行为是检验效度的标准,简称效标。
由于这种效度是看测验对效标预测如何,所以叫效标效度。
这种效度需在实践中检验,所以又称为实证效标。
分类:
根据效标资料是否与测验分数同时获得,又可分为同时效度和预测效度两类。
同时效度即测验所得分数可与效标同时验证,通常与心理特征的评估及诊断有关。
预测效度的效标资料需要一段时间才可搜集到,通常用于选拔、分组。
因为效标资料在考试以后相隔一段时间才能获得,所以高考的效标是一种预测效标。
同时效标和预测效标意义上的差异,不是来源于时间,而是来自测验的目的。
前者与用来诊断现状的测验有关,后者与预测将来结果的测验有关。
一个好的效标必须具备以下条件:
1必须能最有效地反映测验的目标,即效标测量本身必须有效;
2效标必须具有较高的信度,稳定可靠,不随时间等因素变化;
3效标可以客观地加以测量,可用数据或等级来表示;
4效标的测量的方法很简单,省时省力,经济实用。
2、效标和效标测量:
效标,即衡量测验有效性的参照标准,指的是可以直接而且独立测量的我们感兴趣的行为。
我们感兴趣的行为,就是要预测的行为,这是一个总的观念,故必须以可操作的测量来确定才有实际意义。
因此有必要把效标细分为两个层次,其一是理论水平的“观念效标”,其二是操作定义水平的“效标测量”。
3、常用的效标包括:
1学业成就:
如在校成绩、学历、有关的奖励和荣誉、教师对学生智力的评定等,常作为智力测验的效标,也可作为某些多重能力倾向测验和人格测验的效标。
2实际工作表现:
是最满意的效标测量,为一般智力测验、人格测验和一些能力倾向测验的效标;
3特殊训练成绩
4精神病诊断;
5等级评定:
是观察者根据测验欲测量的心理特质在被试身上的表现而作出的一种个人判断;
6效标团体的比较:
即找出两个在效标表现上有差别的团体,比较他们在测验分数上的差别;
7先前有效的测验:
一个新测验与先前有效的测验的相关也经常作为效度检验的证据。
(简答)
2010年自学考试《心理测验学》重难点归纳(5)
难度是指项目的难易程度。
在能力测验中通常需要一个反映难度水平的指标,在非能力测验(人格测验)中,类似的指标是“通俗性”,即取自相同总体的样本中,能在答案方向上回答该题的人数。
难度的指标:
难度的指标通常以通过率表示,即以答对或通过该题的人数百分比来表示。
(公式5-1)
难度的计算
二分法记分的项目:
心理测验的项目大多为选择题,通过记1分,不通过记0分。
当被试人数较多时,可根据测验总成绩将被试分为三组:
分数最高的27%被试为高分组(),分数最低的27%被试为低分组()中间46%的被试为中间组。
分别计算高分组和低分组的通过率,以两组通过率的平均值作为每一题的难度。
由于选择题允许猜测,所以通过率可能因机遇作用而变大。
备选答案的数目越少,机遇的作用越大,越不能真正反映测验的难度。
为此,吉尔福特提出了一个P值校正公式。
例题:
假定某题有75%的被试通过,若该题有5个备选答案,则校正后的通过率为:
(当有4个备选答案时,CP=0.67;
有3个,CP=0.63;
有2个,CP=0.54)
非二分记分的项目:
如果人为地明确通过每一题的分数线,也可以用公式5-2计算难度。
但此种方法的缺点在于,采用不同的分数线会得到不同的难度值,因此不常用。
难度水平的确定
项目难度的确定:
进行难度分析的主要目的是为了筛选项目,项目的难度多高合适,取决于测验的目的、性质以及项目的形式。
为了使测验具有更大的区别力,应选择难度在0.50左右的试题比较合适。
但是在实际各种中并得非如此简单。
在选择题目时,最好使试题的平均难度接近0.50,而各题难度在0.500.20之间。
当测验用于选拔或诊断时,应该比较多地选择难度值接近录取率的项目。
对于选择题来说,P值一般应大于概率水平。
测验难度的确定:
测验的难度直接依赖于组成测验的项目的难度。
通过考察测验分数的分布,可以对测验的难度做出直观检验。
项目区分度的概念:
也叫鉴别力,是指测验项目对被试的心理特性的区分能力。
项目区分度的估计方法
2010年自学考试《心理测验学》重难点归纳(6)
测验的实施及其误差的控制的程序及其要素(简答)
1、标准化指导语:
测验标准化的第一步是指导语标准化,即在测验实施过程中应使用统一的指导语。
指导语通常包括两部分:
一部分对被试的指导语,另一部分对主试的指导语。
2、标准时限:
时限也是测验标准化的一项内容。
大多数典型行为测验是不受时间限制的,例如人格测验中被试的反应速度就不很重要。
但在最高作为测验中,速度是需要考虑的重要因素之一。
在速度测验中,尤其要注意时间限制,不得随意延长或缩短。
测验的时间安排,也是影响测验结果的一个重要因素。
3、测验的环境条件:
有许多研究表明,测验环境会对测验的结果造成影响。
尤其需要强调的是,心理测验进行之时,务必不能有外界干扰。
为此,测验室的房门上应挂一个牌子,示意测验正在进行,旁人不许进入。
因此,对于测验的环境条件:
(1)遵从测验手册的要求;
(2)下任何以外的测验环境因素;
(3)测验结果时也必须考虑这一因素。
主试误差及控制方法
1、测验前的准备工作
(1)预告测验:
应当事先通知被试
(2)准备测验材料(3)熟悉测验指导语(4)熟悉测验的具体程序:
于个别测验来说,测验的实施必须由受过专业训练的人来完成。
2、测验中主试的职责
(1)应按照指导语的要求实施测验,不带任何暗示,当被试询问指导语意义时,尽量按照中性方式作进一步的澄清。
(2)测验前不讲太多无关的话(3)对于被试的反应,主试不应作出点头、皱眉、摇头等暗示性反应;
(4)对特殊问题要有心理准备
3、建立协调关系:
在心理测验实施中,协调关系是指主试和被试之间一种友好的、合作的、能促使被试最大限度地做好测验的一种关系。
例如再智力测验中,这种关系会促使被试尽最大努力发挥自己的能力;
在人格测验中,它会促使被试真实坦白地回答有关个人一般行为特点的问题。
被试误差及控制方法(大答题)
即使一个测验经过精心编制,题目取样具有代表性,又有标准化的实施和积分程序,这种误差是最难控制的。
1、被试技巧与练习效应:
被试对测验的经验或应试技巧会影响测验成绩,对测验的程序和技能熟悉程度不同,所得分数便不能直接比较。
任何一个涉及认知功能的成绩,在第二次应用或重复测量时,都会有练习效应而使测验成绩提高。
要控制应试技巧和练习效应的影响,可尽量设法使每个被试对测验材料的步骤和所需技巧有相同的熟悉程度。
2、被试的动机与焦虑因素
(1)被试参加测验的动机不同,会影响其回答问题的态度、注意力、持久性以及反应速度等,从而影响测验的成绩;
在成就、智力和能力倾向等变量时,只有被试动机强力才可能尽力回答,取得好成绩。
动机效应在测量态度、兴趣及人格等典型行为表现时也有影响。
某些被试若欲给人以好印象,就会考虑主试的期望或社会赞许行为,而不按自己的真实情况回答,从而使测验分数降低。
相反,为了某重动机若欲给人以坏影响,则会使测验分数升高。
(2)b测验焦虑是指被试在应试前和测试中出现的一种不愉快的、表现为焦虑、担心、恐惧和紧张的情绪体验。
适度的焦虑会使人兴奋型提高,注意力增强,提高反应速度,提高智力测验、成就测验和能力倾向测验的成绩。
测验焦虑会受到下列因素影响:
1能力高的人,测验焦虑一般较低,而对自己能力没有把握的人,测验焦虑较高;
2抱负水平过高,求胜心切,测验焦虑较高;
3具有某种人格特点,如缺乏自信、患得患失、情绪不稳定的人易产生测验焦虑;
4测验成绩与被试的关系重大,或被试受到的压力过大,容易使其产生测验焦虑;
5经常接受测验的人焦虑较低,而对测验程序不熟悉,尤其是测验中采取了新的题目形式或实施程式会增加测验焦虑。
2010年自学考试《心理测验学》重难点归纳(7)
常模的团体和常模样本
1、常模团体的性质
由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。
对编制者而言:
常模的选择主要是基于对测验将要施测的总体的认识,常