测验的项目分析.docx

资源描述

测验的项目分析.docx

《测验的项目分析.docx》由会员分享，可在线阅读，更多相关《测验的项目分析.docx（12页珍藏版）》请在冰豆网上搜索。

测验的项目分析.docx

测验的项目分析

第一节测验的难度

难度是指测验项目的难易程度。

一个测验项目，如果大部分被试都能答对，则该项目的难度就小；如果大部分被试都不能答对，则该项目的难度就大。

进行难度分析的主要目的是为了筛选项目，项目的难度水平多高合适，取决于测验的目的的项目形式以及测验的性质。

1、在教育工作或实际工作中，若测验的目的是为了了解被试在某方面知识技能的掌握情况，可以不必过多地考虑难度，只要教育者认为重要的内容就可以选用，甚至那些通过率为100％或为0的项目都可以采用。

2、如果测验的目的是用于选拔录用人员，就应该将项目的难度控制在接近录取率左右，即较多地采用那些难度值接近录取率的项目。

例如，要从高中生中选拔15％的人参加全市的数学竞赛，则就应提高项目难度，使P值接近0.15。

一、难度的计算

测验的记分方法不同，项目难度的计算方法也有所不同。

（一）二分法记分项目的难度

1、通过率

如果不考虑被试作答是猜测成功的机遇，二分法记分测验项目的难度通常以通过率来表示，即以答对或通过该项目的人数的百分比来表示：

P=R/N（6.1）

式中，P代表项目难度，N为全体被试数，R为答对通过该项目的人数。

以通过率表示项目的难度，通过人数越多，P值越大，其难度就越小；通过人数越少，P值越小，难度越大，题目越难。

所以有人也称P值为容易度。

事实上，这里的P值与我们通常所了解的难度意义正好相反。

2、极端分组法

当被试人数较多时，则可以先将被试依照测验总分从高到低排列，分成三组，总分最高的27％被试称为高分组（

），总分最低的27％被试为低分组（

），分别计算高分组和低分组的通过率，然后求项目的难度。

（6.2）或

式中

、

分别表示高分组和低分组的通过率；

、

表示高分组和低分组通过该项目的人数；

、

分别代表高分组和低分组的人数。

（二）非二分法记分项目的难度

对于论述题，每个项目不只有答对和答错两种可能结果，而是从满分至零分之间有多种可能结果。

对这类项目，常常用下面的公式来计算其难度。

（6.3）

式中

为被试在某一项目上的平均得分，

为该项目的满分。

二、难度的等距变换

1、难度存在的缺陷

以项目的通过率来表示项目的难度，虽然计算方便，易于理解，但这类难度指标属于顺序变量，不具有相等的单位，所指出的仅仅是项目的相对难度。

例如，3个测题的难度指数分别为0.60,0.70,0.80，我们只能说：

第一题最难，第二题次之，第三题最容易。

虽然三题难度分别相差10％，但我们不能说第一题与第二题的难度之差等于第二题与第三题之的难度之差。

通过率P无法指出难度之间差异大小，可见顺序性这一点，对我们作进一步的难度分析带来了困难，必须设法将它转换成等距量表。

2、难度转化为Z分数

当样本容量很大时，测验分数接近正态分布。

此时，我们可以根据正态分布曲线表，将试题的难度P作为正态曲线下的面积，转换成具有相等单位的等距量数，即Z分数。

我们知道，在正态分布中，平均数之上或之下一个标准差的距离约占全体人数的34％，因此，如果在一个测验中某项目A通过率为84％（P=0.84），那么从图（6.1）

可以看出，这项目的难度就在平均数以下一个标准差位置，即难度为-1σ；如果某项目B的通过人数只有16％，（=0.16）则这个项目的难度为+1σ；若某题C恰好有50％的人通过（P=0.50），则该题的难度为0，应用此方法，任何一个与通过率相当难度值都可以通过查正态分布表得到。

显然，较难的项目难度为正值，较难的项目难度为正值，较易的项目难度为负值。

由于标准分数具有相等单位，属于等距量表。

所以，用标准分数作为项目难度的指标，为进一步作难度分析带来了极大的方便。

3、难度转换为美国教育测量服务中心采用的难度指标

但是Z数有小数点和负值，所以表示难度也有不便之处，通常需要转换成另一种单位的等距量表。

其中较为常用的是美国教育测量服务中心采用的难度指标：

△=13+4×Z（6.4）

式中，△表示题目难度，Z表示由P值转换得来的标准分数。

△值越大，则难度愈大，△值愈小，难度越低。

对一般教师来说，只要计算出P值即可。

但如果要作更精确的统计分析，则就需要计算出具有等距量表性质的△值。

三、难度对测验分数的影响

（一）测验难度影响测验分数的分布形态

测验的难度直接依赖于组成测验的项目的难度。

通过考察测验分数的分布，可以对测验的难度作直观分析。

若测验项目的难度普遍较大，被试的得分普遍较低，使得测验分数集中在低分端，其分数分布呈正偏态；当测验题目的难度普遍较小，被试的得分普遍较高，测验分数集中在高分端，分数分布呈负偏态。

测验难度过大或过小，都会造成测验分数偏离正偏态分布。

但是，由于人的多数心理特质是正态分布。

而我们目前所采用的统计方法（例如前面介绍的难度的等距交换）又大都是以正态分布为前提，所以大多数测验在设计时希望分数呈现正态分布模式。

因此，当测验的分数分布为明显偏态时，可通过改变项目难度的比例来加以调整。

通常，若被试的取样具有代表性，对于中等难度的测验，其分数分布呈现正态分布。

（二）测验难度影响测验分数的离散程度

过难或过易的测验，会使测验分数相对地集中在低分端或高分端。

当难度集中在0.50附近时，分数的分布范围较广，方差较大，而当难度集中在两端，即不是太难，就是太易时，分数分布范围最小。

分数分布范围较广，使之具有较高的稳定性，从而信度高。

第二节测验的区分度

一、区分度的意义

（一）区分度的意义

区分度是指测验项目对被试心理品质水平差异的区分能力。

具有良好区分度的项目，能将不同水平的被试区分开来，也就是说，在该项目上水平高的被试得高分，水平低的被试得低分。

反之，区分度低的项目则对不同水平被试不能很好地鉴别，水平高与水平低的被试，所得分数差不多，甚至正好相反。

所以测量专家们把试题的区分度称为测验是否具有效度的“指示器”，并作为评价项目质量，筛选项目的主要指标与依据。

必须指出：

评价测验项目区分度高低倚赖于对被试水平的准确测量，通常称作为内部效标。

（二）区分度的取值

区分度（D）的取值范围介于-1.00至+1.00之间。

通常D为正值，称作积极区分；D为负值为消极区分；D为0称作无区分作用。

具有积极区分作用的项目，其D值越大，区分的效果越好。

（三）区分度的相对性

1、不同的计算方法，所得区分值不同

不同的计算方法，所得区分值是不同的。

因此在分析同一个测验时，各个项目的区分度要采用同一种指标，否则不便分析比较。

2、样本容量大小影响相关法区分度值的大小

一般说来，样本容量越小，其统计值越不可靠。

所以在计算出r值后，不能仅从数值大小判断试题的优劣。

而应运用统计显著性检验法，检验区分度值是否显著。

3、分组标准影响鉴别指数值（D）

极端组划分的标准不同，求得的区分度值也不同。

分组越极端，其D值越大。

通常取27％作为极端划分的标准。

4、被试样本的同质性程度影响区分度值的大小

被试团体越具有同质性，即个体之间水平越接近，其测题的区分度值就越小。

反之，若是施测于具有较大异质性的被试团体，即使是对另外一同质团体来说区分度很小的项目，也可能具有很高的区分度。

另一方面，区分度也是相对于不同水平的被试团体的。

所以，项目的区分度大小是针对特定团体而言的。

二、区分度的计算

（一）项目鉴别指数法

这种方法较适合于二分法记分的测验项目。

1、鉴别指数的计算

当效标成绩是连续变量时，可以从分数分布的两端各选择27％的被试，分别计算出每道题目上的各自的通过率，二者之差就是鉴别度指数（D），即：

（6.5）

式中

与

分别表示高分组和低分组在该项目上的通过率。

D值是鉴别项目测量有效性的指标，D值越高，项目越有效。

1965年，美国测验专家R.L.Ebel根据长期经验提出用鉴别指数评价题目性能的标准如表6.1所示。

表6.1　题目鉴别指数与评价价标

鉴别指数

题目评价

0.40以上

很好

0.30-0.39

良好，修改会更好

0.20-0.29

尚可，仍需修改

0.19以下

差，必须淘汰

2、极端组的划分

在项目难度和鉴别指数分析中多次提到划分高分组与低分组，一般情况下，是根据效标成绩或测验总分将被试排队，取27％的高分端被试组组成高分组，另外27％的低分端被试作为低分组，其余46％的被试可以不作分析。

有人曾证明当分数分布是正态分布时，这种分配方法很有效，它既可以使两个对比组间的差异尽可能大，又可以使两组人数尽可能多。

当效标分数较正态分布平坦时，高低分组各占的比率应略高于27％，约在33％左右。

一般情况下，其比率介于25％～33％即可。

但如果是标准化测验，习惯上仍采用27％。

如果比率太小，如10％，则所选出来的两组过于极端，二者之间的差异非常明显，人为夸大了题目的区分程度；当样本团体人数过少时（n＜100），则不宜用27％的规则，甚至可以用50％作为分界点，即把上、下两半被试作为高分组与低分组。

使用极端分组法主要是为了计算方便，但是这种方法只利用了一部分信息，浪费了很多信息，所以统计结果比用全部资料计算的准确性差些。

当项目与效标之间是直线关系时，这种分析法对结果的准确性来说影响不大。

但当项目与效标之间并非直线关系时，使用极端分组法会丧失许多有价值的信息，甚至可能得出错误结论。

（二）相关法

用鉴别指数分析项目区分度虽然易于理解，计算方便，但结果不精确。

在大规模的或标准化的测验中，多采用相关法，即以项目分数与效标分数或测验总分的相关作为项目区分度的指标。