第五章测量效度讲课讲稿Word文档下载推荐.docx

上传人:b****3 文档编号:13752523 上传时间:2022-10-13 格式:DOCX 页数:12 大小:39.22KB
下载 相关 举报
第五章测量效度讲课讲稿Word文档下载推荐.docx_第1页
第1页 / 共12页
第五章测量效度讲课讲稿Word文档下载推荐.docx_第2页
第2页 / 共12页
第五章测量效度讲课讲稿Word文档下载推荐.docx_第3页
第3页 / 共12页
第五章测量效度讲课讲稿Word文档下载推荐.docx_第4页
第4页 / 共12页
第五章测量效度讲课讲稿Word文档下载推荐.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

第五章测量效度讲课讲稿Word文档下载推荐.docx

《第五章测量效度讲课讲稿Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《第五章测量效度讲课讲稿Word文档下载推荐.docx(12页珍藏版)》请在冰豆网上搜索。

第五章测量效度讲课讲稿Word文档下载推荐.docx

不过,由于任何一个量表的编制都有其目的,所以在正常情况下,一个量表的效度也不会为零。

例如,一个数学测验,无论其文字表达如何艰深,它总能测到一定的数学能力,即总会有一定的效度,而不会效度为零。

(3)判断一个测量是否有效要从多方面收集证据。

表面上看来,测量的效度就是实际测量的结果与我们所要测量的心理特性的吻合一致性程度,获取效度的办法也就是拿实测结果与心理特性来比较。

然而,心理特性是我们要测的东西,是未知的,通常也是比较抽象和隐蔽的。

因此,不能把它直接拿来与结果比较,而必须先从多种角度把这种特性描述清楚。

由于描述心理特性的角度可以是理论上的,也可以是实践上的,途径很多,因此,获取测量效度的途径也是多样的。

例如,智力测验是否测得了人的智力,我们就可以从理论上做逻辑分析,也可以从他在工作、学习中的实际表现等许多方面加以证实。

(4)效度和信度一样,也是指一列测量的特性,也是一个构想概念。

在测量理论中,效度被定义为:

在一列测量中,与测量目的的有关真实变异数(由所要测量的变因引起的有效变异)与总变异数(实得变异数)的比率,即:

效度==

这里,代表测量的效度系数,代表有效变异数,代表总变异数。

一个测验的效度表明,在一组测验分数中,有多大比例的变异是由测量的变因引起的。

 

根据公式=++,可以得到信度与效度的关系如下

(一)信度高是效度高的必要而非充分条件

当随机误差的变异()减小时,真实分数的变异数增加,测验信度()随之提高。

信度的提高只给有效变异数()的增加提供了可能,至于是否能提高效度,还要看系统误差变异数()的大小。

可见,信度高不一定效度就高。

但一个测验要想效度高,真分数的变异数必须占较大的比重,即测验的信度必须高。

(二)测验的效度受它的信度制约

根据效度和信度的定义(=,=)以及公式()可得到:

===-

∴<

第二节效度的估计方法

由于测量效度是就测量结果达到测量目的的程度而言的,所以测量效度的估计在很大程度上取决于人们对测量目的的解释。

目前比较常见的解释角度有3种:

一是用测量的内容来说明目的的;

二是用心理学上某种理论结构来说明目的;

三是用实际实效来说明目的。

于是有了内容效度、结构效度和实证效度之说。

当然,这种分类是相对的,一个测验也许需要同时考察它在这3个方面的效度。

有专家认为,效度估计就是多方寻找证据来证明一个测验的有效性程度的过程。

本章着重介绍内容效度、结构效度和实证效度的含义与估计方法。

(一)内容效度的含义及应用范围

1、内容效度的含义

内容效度是指一个测验实际测到的内容与所要测量的内容之间的吻合程度。

估计一个测验的内容效度就是去确定该测验在多大程度上代表了所要测量的行为领域。

而所要测量的内容或行为领域是依据测量目的而定的。

比如,在判断一个高中物理试卷是否有较高的内容效度时,我们必须首先分析考题是否有效地覆盖了中学物理所包括的力学、电学、光学、热学以及原子物理5个方面。

内容效度高的物理测验应当是由这5个方面最有代表性的试题样本组成的。

其次,我们还必须分析题目的难度等指标是否较好地反映了考试大纲中对这5个方面能力水平的要求,等等。

2、内容效度的应用范围

(1)内容效度主要应用于成就测验。

因为成就测验主要是测量被试掌握某种技能或学习某门课程所达到的程度的。

在这种测验中,题目取样的代表性问题是内容效度的主要考察方面。

内容效度高,则可以把被试在该测验上的分数推论到他在相应的知识总体上去,说他在某个方面水平处在一个什么样的位置。

反之,内容效度低,则这种推论将是无效的。

(2)内容效度也适合于某些用于选拔和分类的职业测验。

这种测验所要测的内容就是实际工作所需要的知识和技能,编制这种测验应首先对实际工作做较细的分析,否则,题目取样的代表性就难以令人满意。

3、应该注意的几点

(1)内容效度不适合用于能力倾向测验和人格测验。

(2)在使用内容效度时要避免与表面效度相混淆。

表面效度是外行人对某个测验从表面上看好像是测某种心理特质的一种现象。

当外行人认为某个测验能有效地测得某种心理特质时,该测验就被认为有较高的表面效度。

一般来说,最佳行为测验往往表面效度高,其他测验则希望表面效度低。

(二)内容效度的确定方法

1、逻辑分析法

内容效度的确定方法主要是逻辑分析法,其工作思路是请有关专家对测验题目与原定内容范围的吻合程度作出判断。

其具体步骤是:

(1)明确欲测内容的范围

明确欲测内容的范围包括知识范围和能力要求两个方面。

这种范围的确定必须具体、详细,并要根据一定目的规定好各纲目的比例。

(2)确定每个题目所测的内容

确定每个题目所测的内容,并与测验编制者所列的双向细目表(考试蓝图)对照,逐题比较自己的分类与制卷者的分类,并做记录。

(3)制订评定量表

 制订评定量表,考察题目对所定义的内容范围的覆盖率、判断题目难度与能力要求之间的差异,还要考察各种题目数量和分数的比例以及题目形式对内容的适当性等等,对整个测验的有效性作出总的评价。

2、克龙巴赫的统计分析方法

克龙巴赫还提出过内容效度的统计分析方法。

其具体方法是:

从同一个教学内容总体中抽取出两套独立的平行测验,用这两个测验来测同一批被试,求其相关。

若相关低,则两个测验中至少有一个缺乏内容效度;

若相关高,则测验可能有较高的内容效度(除非两个测验取样偏向同一个方面)。

3、再测法

再测法的操作过程是:

在被试学习某种知识之前作一次测验(如学习电学之前考电学知识),在学过该知识后再作同样的测验。

这时,若后测成绩显著优于前测成绩,则说明所测内容正是被试新近所学内容,进而证明该测验对这部分内容而言具有较高的内容效度。

二、结构效度

(一)结构效度的含义、特点与应用范围

1、结构效度的含义

结构效度是指一个测验实际测到所要测量的理论结构和特质的程度,或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度。

这里,构想或结构是指心理学理论所涉及到的抽象而属假设性的概念或特质,如智力、焦虑、外向、动机等等,它们通常用某种操作来定义,并用测验来测量。

2、结构效度的特点

(1)结构效度的大小首先取决于事先假定的心理特质理论。

一旦人们对同一种心理特质有着不同的定义和假设,则会使得关于该特质测验的结构效度的研究结果无法比较。

(2)当实际测量的资料无法证实我们的理论假设时,并不一定就表明该测验结果效度不高,因为还有可能出现理论假设不成立,或者该实验设计不能对该假设作适当的检验等情况。

这就使得结构效度的获取很难。

(3)结构效度是通过测量什么、不测量什么的证据累积起来给予确定的,因而不可能有单一的数量指标来描述结构效度。

3、结构效度的应用范围

与内容效度不同,结构效度主要用于智力测验、人格测验等一些心理测验方面。

(二)结构效度的确定方法

1、确立结构效度的步骤

(1)提出理论假设,并把这一假设分解成一些细小的纲目,以解释被试在测验上的表现。

(2)依据理论框架,推演出有关测验成绩的假设。

(3)用逻辑的和实证的方法来验证假设。

2、结构效度的估计方法

(1)测验内部寻找证据法。

首先,我们可以考察该测验的内容效度,因为有些测验对所测内容或行为范围的定义或解释类似于理论构想的解释,所以,内容效度高实质上也说明结构效度高。

其次,我们可以分析被试的答题过程。

若有证据表明某一题的作答除了反映着所要测的特质外,还反映着其他因素的影响,则说明该题没有较好地体现理论构想,该题的存在会降低结构效度。

再次,我们足可以通过计算测验的同质性信度的方法来检测结构效度。

若有证据表明该测验不同质,则可以断定该测验结构效度不高。

当然,测验同质只是结构效度高的必要条件。

(2)测验之间寻找证据法。

首先,我们可以去考察新编测验与已知的能有效测量相同特质的旧测验之间的相关。

若二者相关较高,则说明新测验有较高的效度。

这种方法叫相容效度法。

其次,我们也可以去考察新编测验与某个已知的能有效测量不同特质的旧测验间的相关。

若二者相关较高,则说明新测验效度不高,因为它也测到了其他心理特质。

需要注意的是,二测验间相关不高只是新测验效度较高的必要条件,并不是充分条件。

这种方法也叫区分效度法。

再次,我们还可以通过因素分析的方法来了解测验的结构效度。

其原理是:

通过对一组测验进行因素分析,找出影响测验的共同因素。

每个测验在共同因素上的负荷量(即测验与各因素的相关)就是测验的因素效度,测验分数总变异中来自有关因素的比例即是该测验结构效度的指标。

(3)考察测验的实证效度法。

如果一个测验有实证效度,则可以拿该测验所预测的效标的性质与种类作为该测验的结构效度指标,至少可以从效标的性质与种类作为该测验的结构效度指标。

其做法有两种:

一是根据效标把人分成两类,考察其得分的差异。

例如,一组被公认是性格外向的人在测验中得分较高,另一组被公认为是性格内向的人在测验中的得分较低,则什么说明该测验能区分人的内向与外向特征,进而说明该测验在测量的性格内外向方法有较高的结构效度。

二是根据测验得分把分成高分组和低分组,考察这两组人在所测特质方面是否确有差异。

若两组人在所测特质方面差异显著,则说明高测验有效,具有较高的结构效度。

此外,对于一些被认为是较稳定的特质,若在短期内两次施测的结果差异不大,则说明该测验符合理论构想。

(4)多种特质--多种方法矩阵法。

该方法实质是相容效度和区分效度的综合运用,其原理是若用多种极不相同的方法测量同一种特质相关很高(用极为相似的方法测量不同特质相关很低),则说明测量效度较高。

例如,若有多种特质(如A、B、C)都接受了多种方法(如1、2、3)的测查,就可以分别计算出任意两种方法测量同一特质的相关和测量不同特质的相关,以及任意两种特质接受同一方法和不同方法的相关,并以这些相关系数为元素构成一个矩阵,如表5.1所示:

表5.1多特质多方法矩阵

Method1

Teacherrating

Method2

Tests

Method3

Observers’rating

A1

B1

C1

A2

B2

C2

A3

B3

C3

M1

A1诚实

(.89)

B1攻击性

.43

C1智力

.36

.32

(.76)

M2

A2诚实

.62

.03

.20

(.93)

B2攻击性

.22

.70

.13

.40

(.94)

C2智力

.10

.64

.30

(.84)

M3

A3诚

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 表格模板 > 调查报告

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1