《心理档案》第一章心理测验总论Word文档下载推荐.docx

资源描述

《心理档案》第一章心理测验总论Word文档下载推荐.docx

《《心理档案》第一章心理测验总论Word文档下载推荐.docx》由会员分享，可在线阅读，更多相关《《心理档案》第一章心理测验总论Word文档下载推荐.docx（8页珍藏版）》请在冰豆网上搜索。

《心理档案》第一章心理测验总论Word文档下载推荐.docx

那个城市最繁荣？

那个学校（大学）办学水平最高？

三、数字——描述事物属性的符号

当数字被合理地用来描述事物的属性时，它就被赋予了量的意义，数字变成了数。

数或数字的系统（指自然数）有以下几个特性：

a）统一性和区分性

b）等级性（位次性）

c）等距性

d）等比性

但数（测量的结果）的并不完全具有上述几个特性，可能是只是b,也可能是C。

常用心理测量大多是等距性的。

四、规则——给事物属性分派数字的依据

所谓规测是指导我们测量的一种准则（标准）或方法。

规则其实也就是操作定义（参实验心理学）。

度量衡

考试与考卷的评分

心理测验中的Scale

1．同一测量的不同的规则

举例：

？

（考博风博）

启发：

对于我们来说，最重要的要选择合适的规则（测量工具）

2．好的规则与不好的规则

GDP与综合指标

要选择好的规则，要设法改进不好的规则

第二节　心理测量原理

　　　一、心理测验定义

　　有关心理测验定义的说法很多，这里提出一个简短的定义：

心理测验是在标准的情境下，取出个人行为样本来进行分析和描述的一种方法。

现解释如下：

（一）行为样本

　　所谓行为，系指个人的认识过程（包括感知、智力和记忆等）和个性等。

测验研究不同于系统观察，只能做取样研究。

行为样意义，正同对水文、空气和人体血液等进行物理化学分析时的取样研究一样，取部分代表全体。

取样研究的有效与否，关键在于样本的代表性。

不是任何部分都可代表全体。

所谓行为样本，是指有代表性的样本，即根据某些条件所取得的标准样本。

由于所取到的标准样本只是代表某些心理功能，并不能反映这种功能的全部，所以总不免有某种程度的偏差。

因此要通盘考虑样本的有效性、有限性和偏离度。

只有在全部了解行为样本意义以后，才能正确使用心理测验。

（二）标准情境

　　从测验方法所引起的情景来看，要求对所有受试者均用同样的刺激方法来引起他们的反应；

从受试者的心理状态来看，要求处于最能表现所要观察分析上的心理现象的最佳时期。

　　（三）结果描述

　　心理测验的结果，一定需要加以描述，才能使人们理解，才有意义。

描述方法很多，大体可分为两类：

数量化和划分范畴。

例如，智力商数（intelligencequotientIQ）为单位，对智力行为进行数量化，用记忆商数、损伤指数分别对记忆能力和神经心理行为损伤的程度进行数量化描述。

有的心理品质不便数量化，就划分范畴。

当然，可数量化的也可以划分范畴。

例如，个性测验结果以内向或外向表示。

智力划分为正常、超常和低下。

这些均属划分范畴。

　　各种数量化的特殊量数或范畴名称均有一定的涵义，成为测验学的专门术语，并表示测验结果的意义。

　　二、心理测验的类别

　　　心理测验数目多，为了叙述方便起见，按如下一些标准来分类：

（一）以沟通方式来分

　　可分为言语测验和非言语（或称操作）测验两大类。

　　1．言语测验它以言语来提出刺激，受试者用言语作出反应。

主要用言语进行主试和被试者之间的沟通。

大部分心理测验都属于这一类。

但有时同一测验（或量表）中可能包括言语和非言语两部分。

言语分口头的和书面的。

用口头报告或书写方式来进行沟通，均属于这一类。

有一类“纸笔测验”，如果是采用书写的方式，也可以归为此类。

在临床上使用言语测验，可以了解受试者以言语为中介的智力、记忆等。

人们在正常状况下，智力和记忆有言语或操作方面的优势，在不同的病理情况下，可发生选择性损害。

还有一些有肢体残废而言语无困难的病人只能进行言语测验。

　　2．操作测验操作是以身体行为来进行沟通，如用动作、表情来进行反应。

在这一类测验中，主试者呈现刺激不全是操作的，也可以用言语。

但受试者的反应必定是操作性的。

因为有些情况不能用言语测验，有时又需要了解操作能力，所以设计这一类测验。

　　但有时两类测验常常结合使用。

例如比奈量表（Binetscale）开始主要是言语测验。

但以后修订的期坦福－比奈量表（Stanford-Binetscale），特别是最近的修订本则增加了操作测验成份。

古典的甲种陆军测验全属言语测验，而乙种陆军测验则全是操作的。

Wechsler的三套智力量表（即成人、儿童和幼儿）每套均分成言语的和操作的两类测验。

（二）以测验材料的严谨程度来分，可分为有结构的和无结构的两类

　　1．有结构的测验这一类测验占绝大多数。

凡是测验中提出的刺激词句、图形等意义明确，只需受试者直接理解，无需发挥想象力来猜测、遐想的，都是有结构的测验，否则，便是无结构的。

几乎所有的能力测验（如智力、记忆、特殊才能以及成就测验等）都为有结构测验。

　　例如：

“词汇测验”，提出一些词汇，要求受试者下定义。

这些词汇都是常见的，受试者听得懂，只在理解意义的广度和深度上不同人有区别。

“图－词测验”：

在提呈一种状态（如器泣）后，要求受试者在几张不同表情的人物画面中选择一个与这种状态相符合的画面（如一张有器泣表情有的脸）。

这里提呈的刺激语义明确，提呈的人物画面表情清楚，所以都属于有结构的。

　　2．无结构的测验又称投身测验。

提呈的刺激无严谨结构。

例如：

一句未完成的句子，一幅模糊的墨迹图，或主题不清楚的图画。

这些均称无结构，或者说，结构不严谨。

受试者作出反应时，一定要凭自己的想象来加以填补，使之有结构，使之成为有意义。

在这过程中，恰好投射出受试者的思想、感情和经验。

所以又称投射测验。

历代许多临床家都曾用这类测验去发现病人的内心矛盾和个人的特殊经验。

近来，有些普通心理学家利用其中的某些测验（如洛夏测验）来研究个性，发现在研究人格类型时，它比有结构的问卷方法更有其独特用处。

无结构测验种类较少，具代表性的有如下几种：

墨迹测验（如洛夏测验）、主题统觉测验（TAT）、自由联想测验和填句测验等。

　　（三）按一次测验的人数来分，有个别测验和团体测验两类

　　1．个别测验　一次一个被试。

临床上主要采用这种测验。

如比奈量表，韦克期勒量表，H.R.成套神经心理测验（H.R.B）等。

　　2．团体测验一次多个被试，可以多到几十人。

可以一个主试，也可以多个主试。

其优点在于，可以在较短时间内完成许多人的测验。

缺点是不宜个别观察，所以临床上很少应用，而多用于教育、社会学、军事心理等方面。

心理测验史上有名的陆军甲种和乙种测验、教育上的成就测验都是团体测验。

团体测验可以个别进行。

如艾森克个性问卷（EPQ），16项人格因素（16PF），明尼苏达多项人格调查表（MMPI）等。

除非将某些方法作出改变，否则个别测验不能采用团体方法进行。

　　（四）按测验目的性质来分，可分出多类测验

　　在医学上常用的有能力测验、人格测验、神经心理测验以及行为和症状评定量表。

　　1．能力测验包括智力测验、发展量表和特殊才能测验等，成为心理测验的一个重要门类。

　　智力测验在临床上用途很广，不仅在研究智力水平，而且在研究其同理情况（如神经心理）时都是不可缺少的工具。

　　儿童发展量表也与智力有关。

但因婴儿、幼儿智力正在发育期，可以观察到的主要还是一些本能以及一些初级的智力活动。

不到一定的年龄（如5～6岁以后）时所观察到的心理发展指标，与以后的智力水平相关度不会太高。

但有许多影响智力发展的疾病，又必须早期进行治疗，才能减少或消除对智力发展的危害，所以要对智力发展水平尽早作出诊断。

因此，研究者们不断改进，试图做出智力诊断发展量表。

如Bayley婴儿发展量表，Cattell婴儿智力量表和Gesell的发展量表行等都有一定的应用价值。

　　特殊才能测验：

这类测验多为升学、职业指导以及一些特殊工种人员的筛选所用。

常用的如音乐、美术、机械技巧，以及文书才能测验。

这些测验在临床上应用的较少。

　　2．人格测验这是心理测验中的另一个大门类。

但以成就（指种类和解决实际问题的能力）而言，不及能力测验。

属这类测验的多属自陈量表，即由受试者自己报告的一种客观调查表。

几个广泛使用的自陈问卷（或调查目录），如16PF，EPQ，加州心理调查表（CPI）、爱德华个人偏好调查（EPPS）等。

在解决实际问题的效用方面都不能与现代的一些智力测验相比。

通常将MMPI归为人格测验。

因为它测查的是病理人格，所以在临床上得到广泛应用，而普通心理学家用的较少。

洛夏测验则首先用于临床，近来多为普通心理学家用于人格研究。

　　3．神经心理测验为近30年成长起来的心理测验中的一个分支。

它的任务是研究脑与行为的关系。

测量不同部位和性质的脑损害时，所损害的特征性心理功能，为临床家的诊断、治疗及预后果提供依据。

有名的成套神经心理测验如H.R.B.，L－N成套测验（L.N.B.）等。

　　4．适应行为评定量表评定量表是从心理计量学（psychometric）中衍生出来的，具有心理测验的基本特征。

其内容以智力为主，并联系到社会性方面。

从适应的意义来看，一是指个体有效地应对（copewith）；

另一是顺应（adjustto）自然和社会环境。

在自然和社会环境中，一是需要自己独立生活和维持自己的生命；

二是能满足个人和社会所提出的文化要求。

所以适应行为包括多方面的因素，如；

智慧、情感、动机、社会、运动等以及其他一些尚未知名的因素。

适应行为往往不是智力测验所能检查清楚的，因此应设立独立成类的专门量表。

例如，知力低下的定义是IQ低下和适应行为受损。

所以在诊断智力低下和确定低下等级时，除了依靠智力测验外，另一同等重要的工具便是适应行为量表。

现在已有一些用途很广的量表，如Vineland，社会成就量表（VSMS）,AAMD（美国智力低下协会）适应行为量表，我国所编制的“成人智残残评定量表”等。

5．精神病学评定量表为另一大门类的评定量表。

其目的是评定精神病症状。

为精神病临床家、临床心理学家以及精神科其他专业人员所使用。

这类量表数量很多，用途很广，发展之快超过了前面所述各种心理测验。

精神病学的研究几乎是量表化了。

由于采用微型电子计算机，在使用上更加简便，分析上迅速且准确。

有一些量表国际通用。

我国目前常用的有如下一些：

90项症状量表（SCL-90），Hamiltom的焦虑量表，Hamiltom忧郁量表，Beck的忧郁量表等。

第三节　标准化测验的基本特征

　　一个测验是否标准化了，须在下面几个方面受到考验：

　　1．取样（sampling）心理测验是衡量某一心理品质的标尺，这个标尺产生于样本。

人们的心理活动千差万别，所以取样时，必须照顾取样的代表性。

根据样本结果来使测验标准化，这个样本便是测验的标准化样本。

在选择测验时除了了解所取样本的代表性外，还要注意这一样本与受试的情况是否相应。

一般来说，要考虑样本的年龄范围、性别、地区、民族、教育程度、职业等基本特征。

如果是临床量表，还应有疾病诊断、病程及治疗等背景。

受试者的情况在这些方面与样本相应，所测结果与样本才有可比性。

在实际工作中，不是所有时候都有一个很适合的工具供使用，不得已也会使用不很相应的量表。

这时，在解释中须加以说明，并持谨慎态度，否则很易造成错误。

　　2．常模（norm）常模是一种可供比较的普通形式。

通常有如下几种：

（1）均数：

是常模的一种普通形式。

某一受试所测成绩（粗分，或称原始分）与标准化样本的平均数相比较时，才能确定其成绩的高低。

（2）标准分：

均数所说明的问题还是有限的。

只看均数，不注意分散情况，所得受试者的信息非常有限。

如用标准分作常模，便可提供更多的信息。

标准分能说明受试者的测验成绩在标准化样本的成绩分布图上居何位置。

标准分（Z）＝受试者成绩（X）与样本均数（x）之差（即X－x）除以样本成绩标准差（SD）。

简化成Z＝（X－x）／SD。

这样一来，不仅说明受试者的成绩与样本比较在其上或其下，而且还说明相差几个标准差。

　　许多量表采用这种常模或由此衍化出来的常模。

在Wechsler氏量表中，离差智高＝100+15（X-x）/SD便是这一种。

离差智商与标准分常模的不同之处在于：

一是标准分均数为0。

而离差智商均数为100。

即Z=X在标准分时为0，在离差智商时为100；

二是标准分的SD值随样本而定，而离差智商中是令标准差为15（StanfordBinet为16）。

　　（3）T分：

T分常模是标准分衍化出来的另一种常用常模。

例如MMPI便采用此种常模。

它与离差智商的不同之处，是所设的均数值及标准差不同。

T分计算的公式：

T=50+10（X-x）/SD

　　（4）由标准分衍化而来的其他形式的常模；

标准20和标准10即是属于这一类，都是改变均数及标准差值而得。

其计算公式如下；

标准20=10+3（X-x）/SD

标准10=5+1.5（X-x）/SD

　　在韦氏量表中，有粗分、量表分以及离差智商诸量数。

其中量表分的计算方法即属此处的标准20计算法。

　　（5）百分位（percentilerank,PR）：

这是另一类常用常模，比标准分应用得早，且更通用。

它的优点是不需要统计学的要领便可理解。

习惯上将成绩差的排列在下，好的在上，计算出样本分数的各百分位范围。

将受试者的成绩与常模相比较。

如相当百分位50（P50），说明此受试者的成绩相当标准化样本的第50位。

也即是说，样本中有50％的人数，其成绩在他之下（其中最好的至多和他一样），另外50％人数的成绩比他的好。

如在P25，说明样本中25％的成绩在他之下（或至多和他一样），另有75％人数的成绩比他的好。

以此类推。

　　（6）划界分（cutoffscore）：

在筛选测验中常用此常模。

如教育上用100分制时，以60分为及格分，此即划界分。

而入学考试时的划界分因考生成绩和录取人数而异。

在临床神经心理测验中，将正常人与脑病患者的测验成绩比较，设立划界分，用这个分数划分有无脑损害。

如果某测验对检查某种脑损害很敏感，就说明设立的划界分很有效。

病人被划入假阴性的人数就很少甚至没有，正常人被划为假阳性的也很少或没有。

如果不敏感，则假阳性或假阴性的机会均会增加。

　　（7）比率（或商数）：

这一类常模也较常用。

在离差智商计算方法之前，便使用比率智商。

其计算方法：

IQ＝MA／CA×

100，是将MA（心理年龄）与CA（实际年龄）相等的设作100，以使IQ成整数。

H.R.B.中的损伤指数也是比率常模。

损伤指数＝划入有损的测验数／受测的测验数（图12－1）。

图12－1不同测验分与Z分和正态分布的关系

　　以上是通用常模形式，此外还有各种性质的常模。

如年龄常模（按年龄分组建立的）、性别、区域和各种疾病诊断的常模。

从可比性看，常模越特异越有效。

从适应性讲，则以通常模使用方便。

以智力测验为例，全国常模运用的范围广，而区域常模应用的地区则有限。

但后者比前者更精确。

有的常模虽系区域性，但因该区域有代表性，也可用于相似地区。

　　3．信度（reliability）心理测验的信度是指同一受试者在不同时间用同一测验（或用另一套相等的测验）重复测验，所得结果的一致性程度。

信度用系数（coefficient）来表示。

一般说，系数越大，说明一致性高，测得的分数可靠；

反之则相反。

信度的高低与测验性质有关。

通常，能力测验的信度（要求0.80以上）高，人格测验的信度（要求0.70以上）低。

凡标准化的测验手册，都需要说明本测验用各种方法所测得的信度。

考验信度通常有如下方法：

（1）重测信度：

同一组受试在两次不同时间作同一套测验所得结果的相关性检验。

（2）正副本相关：

有的测验同时编制了平行的正副本，将同一组受试的两套测验结果进行相关性检验。

　　（3）分半相关：

将一套测验的各项目（要求按难度为序）按奇、偶数号分成两半，对所测结果进行相关性检验。

　　其它尚有因素信度、测量标准误等，此处从略。

　　4．效度（Validity）所谓效度即有效性，指此测验测查到所要测查的没有？

测查到何种程度？

如一个智力测验，若测验结果所表明的确实是受试的智力，而且量准了智力水平，那么这一智力测验的效度好；

反之则不好。

效度检查，也同信度检查一样,有多种方法，并有各种名称，如内容效度、预测效度、因素效度、内部效度等。

美国心理协会在《心理测验和诊断技术介绍》，简称《APA》（1954）及《教育和心理测验的标准与手册》（1966）中将它们分为三类。

即校标（criterion）效度、内容（content）效度和结构（construct）效度三类，以后广泛沿用。

（1）校标效度：

即将测验结果与某一标准行为进行相关检查。

如智力测验与学习成绩，诊断测验与临床诊断进行相关检查等均属之。

（2）内容效度：

指测验映所测量内容的程度。

如算术成就测验应反映受试者运算能力的程度。

测验与之相关的标准，是老师的评定，日常生活或工作中所表现的能力等。

　　（3）结构效度：

反映编制此测验所依据理论的程度。

如编制一个智力测验，必定依据有关智力的理论。

该测验所反映此智力的程度，可用结构效度来检验。

　　5.方法的标准化　施测方法、记分方法、标准结果的换算法等都要按一定的规定进行，方符合标准测验的条件。

展开阅读全文