关于安娜斯塔西心理测验的读书笔记.docx

资源描述

关于安娜斯塔西心理测验的读书笔记.docx

《关于安娜斯塔西心理测验的读书笔记.docx》由会员分享，可在线阅读，更多相关《关于安娜斯塔西心理测验的读书笔记.docx（15页珍藏版）》请在冰豆网上搜索。

关于安娜斯塔西心理测验的读书笔记.docx

关于安娜斯塔西心理测验的读书笔记

心理测验读书笔记

第一部分心理测验的功用和起源

第一章心理测验的性质和用途

1心理测验应该包括教育测验在内，心理测验主要可以分为三类：

能力测验（包括智力测验、创造力测验等），人格测验（包括兴趣测验、态度测验、价值观测验等）以及教育测验。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.1—2.

2心理测验实质上是对行为样本的客观的和标准化的测量。

。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.5.

3只有当特定训练成绩提高测验分数但没有明显影响测验所要测量的行为领域时，测验分数才没有效度可言。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.7.

4常模可分为发展常模和团体常模，发展常模包括智力年龄、年级当量和顺序量表；团体常模包括百分位数、标准分数和离差智商。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.9—10.

5标准化指的是测验的实施和评分程序中的一致性。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.7.

6项目测验不必与测验所预测的行为非常相似，而只需要证实二者之间的经验性对应。

一个心理测验要有价值，就必须在经验上证实，被试在该测验上的表现与在其他情境中的行为相对应。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.3.

7“和睦关系”指的是主试努力激起测验参加者对测验的兴趣、得到他们的合作、鼓励他们以适合测验目的的方式作答。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.20—21.

8每个测验都隐含着对被试自尊心的威胁。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.22—23.

第二部分技术方法和方法原理

第三章常模和测验分数的意义

9任何常模都限于导出常模的特定常模总体，且心理测验常模决不是绝对的、普遍的和永久的。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.89.

10本质上，IRT模型用于建立一种统一的“与样本无关”（sample-free）的测量量表，它适用于能力水平大不相同的个体和团体，也适用于难度水平大不相同的测验内容。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.96.

11采用计算机方式和传统的方式实施同一测验时，需要研究分数的可比性。

除非能够表明两种方式产生完全等同的测验型式，否则，同一组常模不能同时适用于两种方式；测验的信度和效度也会有所变化。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.99.

12领域参照测验的主要特征是，依据内容意义来解释测验成绩，它强调测验参加者能够做什么，知道什么，而不是他们与别人相比较情况如何。

编制这一类测验的一项基本要求是，确定测验要评定的知识或技能的领域。

例如在编制个别化教学的程序中，对于一门学校学科，这些目标可以多达几百个。

教学目标确定以后，就编制项目，要在每个目标中取样。

一种实际的折中办法是，通过专家评判来界定关键的概念、原理、方法或教学目标，然后，使用合适的测验项目，对所界定的每个重要领域进行全面取样。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.101.

13在严格的意义上，领域参照测验最适合于测验初级水平的基本技能（例如阅读和算术）。

另一方面，领域参照测验在解释测验分数中强调内容意义，一般来说这对测验产生有益的影响，同时，这类解释在某些时候也可与常模参照分数相结合。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.102.

14一些教育家认为，在个别化教学中，如果提供适当的时间和教学方法，几乎每一个人都能完全掌握所制定的教学目标。

因此个体差异表现在学习时间上，而不是像传统的教育测验那样，表现在最后成绩上，由此推断，在掌握测验中，成绩的个体差异并不重要。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.102—103.

15在编制掌握测验时，我们要注意两个重要问题：

（1）为了可靠地评定测验所包括的每个具体的教学目标，必须使用多少项目？

（2）可靠地确定达到掌握水平，必须答对多少比例的项目。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.103.

16坚决赞成使用临界分数的理由是，某些机能的作业要求一些关键性变量。

这些变量的能力不足，不能由其他变量的优秀能力来补偿。

在这种情况下，综合选拔成套测验上的高分，会掩盖关键性技能上的不足。

在关键性技能上处于所要求的最低资格以下的个体将被淘汰，而不管他们的其他能力如何。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.106.

第四章信度

17信度指在不同时间，使用同一测验，或者使用两个不同的等值测验，抑或在其他不同的测试条件下，对同一组被试实施两次测验所得分数的一致性。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.111.

18在最广泛的意义上，测验信度表示测验分数中个体差异可归因于所考虑的属性中“真实”差异的程度，以及可归因于偶然误差的程度。

用专门的术语来说，测验信度的度量，使得估计测验分数的总方差中误差方差（errorvariance）的比例成为可能。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.111.

19能力测量之间的相关几乎总是正的，虽然常常较低。

当两个能力变量之间得出负相关时，通常是表示分数的方式造成的。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.115.

20在测验手册中报告再测信度时,总是应该说明再测间隔的时间,因为再测相关随着时间间隔的的增长而逐渐减小,任何一个测验的再测信度系数都不是一个而是无限个，但是，当间隔时间长达10-15年时,测验分数就几乎完全失去一致性。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.120.

21在追踪研究或研究某种实验干预因素对测验成绩的影响方面,复本是十分有用的，可以减少辅导或欺骗的可能性。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.123.

22信度类型分为再测信度、复本信度、分半信度、库德-理查逊信度（Kuder-Richardson）信度和α系数和评分者信度。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.120—129.

23再测信度指同一组被试在两次测验上所得分数之间的相关，误差方差相当于两次测验成绩的随机波动，可能由于部分未加控制的测验条件而产生，对于任何个体，再测的时间一般不应该超过6个月，而且只有不大受重复影响的测验才适合用再测方法，对于大多数心理测验来说使用完全相同的测验来再测并不是最适当的方法。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.120—122.

24复本信度既测量时间的稳定性，又测量对不同的项目样本（即测验型式）的回答的一致性，因而把两种类型的信度结合起来，当然必须保证复本之间是确实的平行测验，但如果所考虑的行为机能受到练习的影响很大，则使用复本只能减少但不能消除这种影响，另一方面要注意的是测验的性质可能会由于重复而有所改变。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.122—124.

25在采用奇偶分半模式时，应该注意到，一组项目是涉及同一个问题的，应该把整组项目原封不动地分到这一半或另一半。

假如把这组项目分到两个不同的半测验，两个半测验分数的相似性就会假性提高，因为对这个问题理解上的任何一个错误都会影响对两个半测验中项目的回答。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.125.

26单一的同质性测验显然不能恰当预测一个高度异质的效标，得出项目间一致性的最为通常的方法由库德和理查逊所提出。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.127.

27事实上，库德-理查逊系数和分半信度之间的差异，可以作为测验异制质性的一项初步指标。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.128.

28当研究中使用主观性评分测验时，通常计算评分者信度。

在适当的情况下，测验手册也应该报告评分者信度。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.130.

29信度系数与误差方差来源的关系

信度系数类型

误差方差

再测信度

时间取样

复本信度（即时）

内容取样

复本信度（延时）

时间取样和内容取样

分半信度

内容取样

库德-理查逊信度和α系数

内容取样和内容异质性

评分者信度

评分者之间差异

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.130.

30设计速度测验或难度测验，都要防止被试获得满分，其理由是，满分的意义不明确，因为不可能知道，如果测验包括更多的项目或更难的项目，个体的分数还会高出多少。

为了使每一个体充分表现他能够完成什么，测验必须在项目的数目上或在难度水平上提供合适的上限。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版,1997.133.

31在速度测验中，信度的确定可以用再测方法，复本的方法和分半的方法，但是要注意的是，在用分半的方法时要按照时间而不是按照项目来分半。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版,1997.134.

32测量的标准误差和信度系数是表示测验信度的两种不同方法。

与信度系数不同，测量的标准误差不受所测团体的变异性的影响。

测量的标准误差以个体分数来表示，无论是同质团体还是异质团体，所得标准误差保持不变。

比较不同测验的信度，信度系数比测量标准误差好。

而解释个体分数，测量标准误差则比较合适。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版,1997.141.

第五章效度：

基本概念

33内容描述的效度分析程序实质上是要系统检查测验内容，从而确定测验是不是包括了所要测量的行为领域的代表性样本。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版,1997.149.

34内容效度分析尤其适合于领域参照测验，当然，全面的评价领域参照测验的有效性，还需要其他类型的效度证据。

内容效度分析也适用于某些对员工进行选拔和分类的职业测验，但是对于能力测验和人格测验，内容效度分析通常是不合适的，事实上甚至可能误解。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版,1997.151—152.

35在技术意义上，表面效度不能算是一种效度；它并不是指测验实际上所测量的东西，而只是指测验表面上看起来所要测量的东西。

表面效度的问题主要涉及友好关系和公众关系。

虽然在这点上，“效度”一词的通常用法可能引起混乱，但是表面效度本身也是一种合乎需要的测验特征。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版,1997.153.

36效标预测效度表明测验预测个体在指定活动中行为表现的有效性。

用于得出测验分数效度的效标度量，可以在同测验分数大致相同的时间获得，也可以在相隔一定的时间之后获得。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版,1997.154.

37测验的结构效度是指测验能够测量到理论上的结构或特质的程度。

这类结构有学业能力倾向、机械问题理解、言语流畅、步行速度、神经过敏症、焦虑等等。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版,1997.165.

38一个新测验与类似的旧测验之间的相关应该适度，而不是太高。

如果新测验与已有测验的相关太高，而又没有另外的优点如简单或易于实施，那么就没有必要编制这个新测验。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版,1997.166.

39决定测验的主要因素，加上每个因素的权重及负荷以及测验和每个因素的相关，来表示每个测验的特性。

这种相关有时也被称为测验的因素效度。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.167—168.

40在认真分析结构效度时，坎贝尔指出，为了证实结构效度，我们必须表明，一个测验不仅与理论上应该相关的那些变量具有高相关，而且与理论上应该区别的那些变量具有低相关。

坎贝尔和菲斯克把前者称为幅合效度（convergentvalidation），把后者称为区别效度（discriminantvalidation）。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.169.

41恩布里森认为传统的结构效度分析方法过于局限，他提出测验效度分析的两个主要方面：

（1）结构表征；

（2）一般规律研究的范围。

传统的结构效度分析正是着重于第二方面即一般规律研究的范围。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.175.

42效度的分析方法的选择取决于测验分数的用途，同一个测验，适用于不同的目的时，就应该使用不同的效度分析方法。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.177.

43内容关联效度、效标关联效度和结构关联效度并不是性质不同的或逻辑上并列的类型。

相反，结构关联效度是一个综合的概念，它包括其它两类效度。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.178.

第六章效度：

测量和解释

44效度系数根据样本团体得出，因而必须说明样本团体的性质。

同一个测验实施于性质不同的被试时，可以测量不同的机能。

同样，样本异质性的问题也与效度测量有关，因为信度和效度通常都以相关系数来报告。

由于选拔标准的变化，效度系数也会随时间而变化。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.184-185.

45在解释效度系数时，一方面应根据样本团体，同时还应注意测验和效标之间的关系型式。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.184—187.

46如果测验与效标有任何显著的相关，不管如何低，也可以明显提高预测效率。

在某种情况下，甚至低到0.2—0.3的效度，也可以证明在选拔计划中使用测验是正确的。

——　缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.187—188.

47一个相对一致的研究结果是预测学业成绩时的性别差异。

对于多种资料的数百个相关系数的研究都报告，能力倾向测验分数和学业成绩之间的相关，女性高于男性。

在中学和大学都出现这种倾向，但是在大学水平这种倾向更为明显。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.202—203.

48预测实际效度，往往需要几个而不是一个测验。

大多数效标都是比较复杂的，效标度量取决于若干不同的特质。

用来测量这类效标的测验因此必须是高度异质性的。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.204.

49在任何情况下，修改测验从而消除无关方差的直接方法，都要优于通过抑制变量而消除无关变量的间接统计方法。

在修改测验行不痛的情况下，才应该考虑去研究抑制变量。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.206.

50在评价用于分类的成套测验时，主要考虑其对各个效标的区分效度。

这种成套测验的目的是预测每一个被试在两种或多种职业、训练计划或其他效标上表现的差异。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.209.

51比起使用单一的一般测验或从单一的回归方程所得出的合成分数能够作出的预测来，使用成套测验对多个效标作出不同的预测则更能充分利用现有人才资源。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.211.

52即使一个测验在两个团体中得出相同的效度系数，它还是有可能存在截距偏向。

回归线的截距指回归线与纵轴的交点。

如果一个测验过低预测或过高预测某特定团体的效标成绩，那么它就存在截距偏向。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.219.

第七章项目分析

53如果标准化样本在一个测验上产生明显的非正态分布，通常要对测验的难度水平进行修正，直到近似于正态曲线。

根据所呈现的偏态类型，增加较易或较难的项目、删除或修改其他项目、改变项目在量表中的位置，或者修改某些反应的得分权重。

这类调整一直继续到分布至少大体呈正态为止。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.233.

54项目鉴别度是指一个项目在测验所要测量的行为上，正确区分各个测验参加者的程度。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.234.

55淘汰与总分低相关的项目，是使测验趋于同质的一种方法。

使用这种方法，将保留彼此相关平均数最高的项目。

只有当最初的项目库测量单一特质，并且在要评定的效标或结构中出现该特质时，这种选取项目的方法才会增加测验效度。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.236.

56外部效度和内部一致性是编制测验的两个希望达到的目标。

两者的相对重要性随测验的性质和目的而变化。

对于大多数测验目的来说，一个令人满意的折中方法是，把相对同质性的项目分到独立的分测验中，每个分测验覆盖外部效标的一个不同方面。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.237.

57项目反应理论，也可称之为潜在特质理论和项目特征曲线理论。

这种方法的基本特征是，项目成绩和被试的“潜在特质”的估计量有关，在这种情况下，“潜在特质”表示一种统计构想，而并不表示一种独立存在的心理学或生理学实体。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.247.

58计算测验效度所依据的被试样本，必须不同于选择项目所依据的被试样本。

这种独立确定整个测验的效度称之为交叉效度分析。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.253.

59交叉效度中效度系数的减小量，部分取决于最初项目库的大小和所保留的项目的比率。

当最初的项目数量很大而所保留的比率又很小时，利用随机差异的机会就多了，因此得出假性高效度系数。

影响交叉效度分析中效度系数的减小量的另一个因素是样本的大小。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.256.

60“项目偏向”的分析日益受到关注，这是研究少数民族团体的测验偏向的一个方面。

这类分析基本上关注各个测验项目对于不同的文化或经验背景的团体的相对难度。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.256—257.

第三部分能力测验

第八章个别测验

61第四版斯坦福—比纳量表内在一致性，在整个成套测验上的综合分数在所有年龄段信度范围从0.95至0.99,认知领域的信度为0.80—0.97，各个测验大多数信度处于0.80—0.90，仅物体记忆测验信度范围为0.66—0.78，一般来说，在较大年龄水平的所有效度往往稍高于较小年龄水平。

而间隔2—8个月后的重测信度，综合分数的稳定性是好的，两个样组的信度系数分别为0.91和0.90。

言语推理领域分数的信度为0.80，而其他领域分数和各个测验的波动则相当大。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.276.

62在非特殊样本中，早期斯坦福—比纳量表（L—M型）上的离差智商与第四版上综合分数的相关为0.81；与言语推理领域的相关为次高（0.76），与抽象/视觉推理领域的相关为最低（0.56）。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.279.

63使用特殊样本的第三组专门研究表明，第4版斯坦福-比纳量表能够合适地鉴定天才的、学习障碍的、智力落后的等测验参加者的成绩水平。

天才者样本的综合分数和4个领域分数中每个领域分数上获得的平均数显著高于标准化样本。

学习障碍学生和智力落后学生的综合分数和领域分数的平均分数都显著低于标准化样本，智力落后被试的平均分显著低于学习障碍被试。

该量表至少和当前可得到的其他量表一样可以准确地测量一般智能。

该量表与成就度量高相关，该量表能够区别智力落后个体、天才个体和神经损伤的个体。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.280.

64对于所有的韦克斯勒量表，全量表的分半信度范围从0.90至0.98，言语智商的分半信度系数范围从0.86至0.97，操作智商的分半信度系数范围从0.85至0.94。

WISC—III基于因素的指标分数的分半信度系数范围从0.80至0.94。

3个韦克斯勒量表的分测验信度系数范围从0.52至0.95，其中绝大多数在0.70以上。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.287—288.

65最新的韦克斯勒量表的标准化样本是精心选取的，以保证他们的代表性。

每个量表的常模样本为2000名，男女人数相等，分布在各个合适的年龄组中。

被试的选择尽可能符合进行标准化时美国人口调查得出的最新报告，考虑变量为地理区域、种族、职业水平和教育水平。

至于儿童被试，则使用父母的职业水平。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.290.

66所有韦克斯勒量表的最大缺点在于缺乏理论基础，这使得它难以找到一致的解释基础。

另外，量表的组成似乎假设，各个年龄水平的

分测验所要求的能力领域是相同的，因为测验材料和测验任务都具有表面上的相似性。

鉴于我们现在所知道的关于一生中智力性质的发展变化的知识，这种假设可能是不正确的。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.291.

67在技术质量方面，KAIT看来符合心理测量标准及当代任何一个主要智力量表。

常模取样是合适的，手册中所报告的信度和效度系数看来也是有前途。

这套测验相对容易施测。

此外，手册中包括的资料在测验的施测和评分时十分有用。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.295.

68DAS主要以可靠的信度测量各种具体的能力，以便有助于实现个体评定的较复杂的目标，即作出区别诊断和处理计划。

在理论和经验原则的指导下，选择各种作业组成成套测验。

其理论基础是折中主义。

——缪小春，竺培粱.心理测验[M].杭州：

浙江教育出版社,1997.298.

69同其他智力量表相比，区别能力测验（DAS）的信度指标较好。

两次间隔2-7周，GCA和合成分数的再测信度为0.79-0.94。

分测验的可资比较的再测信度估计值为0.38-0.94，其中绝大多数在0.60-0.90之间。

评分中需要大量判断的开放式应答测验的评分者信度，多为0.95左右。

内部一致性系数通过应用项目反映理论来评定，在所有适当年龄水平上的内在一致性信度估计值，

展开阅读全文