教育统计和教育测量资料.docx

上传人:b****5 文档编号:8565935 上传时间:2023-01-31 格式:DOCX 页数:19 大小:63.76KB
下载 相关 举报
教育统计和教育测量资料.docx_第1页
第1页 / 共19页
教育统计和教育测量资料.docx_第2页
第2页 / 共19页
教育统计和教育测量资料.docx_第3页
第3页 / 共19页
教育统计和教育测量资料.docx_第4页
第4页 / 共19页
教育统计和教育测量资料.docx_第5页
第5页 / 共19页
点击查看更多>>
下载资源
资源描述

教育统计和教育测量资料.docx

《教育统计和教育测量资料.docx》由会员分享,可在线阅读,更多相关《教育统计和教育测量资料.docx(19页珍藏版)》请在冰豆网上搜索。

教育统计和教育测量资料.docx

教育统计和教育测量资料

教育统计和教育测量

镇江市教育局教研室周凯

在教育、教学研究中,我们常常要进行评价。

在评价过程中,定性是重要的,然而定量同样是必要的。

为了使教育、教学研究深化和精确化,需要在占有科学数据的基础上,运用科学的手段和方法对数据进行处理,从而得出科学的结论。

教育、教学研究中的数据是由测量法产生的,对数据的搜集、整理和分析,对研究结果的解释,则需要通过统计法来实现。

一、教育统计

1、教育统计的意义

教育统计是运用数理统计的原理和方法研究教育问题。

它的主要任务是研究如何整理和分析由教育调查、教育测量所获得的数字资料,并以此为依据,进行科学推断,揭示教育现象所蕴含的客观规律。

从应用角度来分,教育统计主要有三方面的内容:

描述统计、推断统计和实验统计。

下面简介描述和推断统计的一些内容。

2、描述统计的意义及内容

我们去看学生的成绩计分册,只看到一个个学生的分数(称原始数据),这些分数在未经整理之前是零乱的、不系统的,而且数据愈多,愈觉纷乱。

因此,需要对统计资料进行绘图、制表、计算等初步的整理工作,以描述研究对象的统计特性。

描述统计就是对已获得的数据进行整理、概括,显现其分布特征的统计方法。

它的主要内容有:

统计表和统计图、集中量、差异量、相关系数等。

2.1统计表和统计图

统计表是用来表达统计指标与被说明事物之间数量关系的表格。

举例如下:

表1:

某年级某学科某班学生考试成绩统计(本卷满分100分)

分数段

100~90

90~75

75~60

60~30

30以下

人数

9

16

14

8

4

百分率(%)

17.6

31.4

27.5

15.7

7.8

本表在统计学中称为频数分布表(落在各个小组内的数据的个数叫做频数,表中各分数段内的人数就是频数),每一分数段(即分数区间)都有上限和下限,比如区间90~75中,90称为上限,75称为下限,而75又是区间75~60的上限。

统计时一般包含下限,而不包含上限,但满分100分这个上限例外。

从表1中可以得到如下信息:

75~90这一分数段人数最多,有16人;60分(及格)以上有39人;60分以下有12人,其中30分以下4人,需要尽快补差等。

上表是将研究的对象按一个标志分类的,称为单向表。

将研究的对象按两个或两个以上标志分类的统计表,称为双向或多统计表。

如,下

表就是将学生成绩按等第、班级、性别三个标志分类的。

表2:

某年级学生操行评定表

等第

一班

二班

三班

合计

6

8

6

2

5

8

4

1

5

9

3

1

5

10

3

1

7

9

4

0

6

8

3

1

18

26

13

3

16

26

10

3

合计

22

18

18

19

20

18

60

55

编制统计表的要求是:

(1)表的结构要简单明了,层次清楚。

(2)表的标题要简明扼要地、确切地反映表的内容,写在表的上端的中央位置。

(3)表的标目有横、纵标目之分。

一般将统计表所要叙述的主要对象放在横标目上,而将用以叙述的统计指标在纵标目上。

(4)表内数据排列要整齐,小数点位置要对齐,缺数据格或无数据格要划斜线。

(5)表的标题、标目或数字有未尽之意的地方,应加脚注说明,表中资料的来源应在底线下加以注明。

统计图是以几何图形的形式表达统计资料数量关系的重要工具,它形象直观,使人看了一目了然,印象深刻,容易记忆。

频率分布表与频率分布直方图是统计表和统计图的一种,由于它在统计工作中的地位相对重要,故着重加以介绍。

将一群数据中的每一个数据(或每一组数据)所出现的频率分布情况列成统计表的形式,就是频率分布表;对其中的连续性数据还可以绘成统计图的形式,这就是频率分布直方图。

以下结合表3的数据来说明编制频率分布表和频率分布直方图的步骤。

表3:

某年级80名学生数学成绩

78736871636558535548

51545966637168737985

87797468746366715955

56606663726974806057

66646472696975758080

81757064666767606161

62676767656565707682

83909776777770707165

(1)求极差:

最大值-最小伙值=97-48=49

(2)决定组数与组距:

在决定组数时,必须考虑到数据整理的目的,一方面在于简化资料,以利于显示其规律性;另一方面又必须适当保持资料的细节,以免失之过粗。

若分组时组数过多,不仅计算麻烦,而且由于每组数据甚少,不易反映整个分布的规律;反之,组数过少,由于失之过粗,误差较大,也不能反映资料的特征。

一般分组的数目视数据的多少而定,大体上,50个左右的数据分5~8组,100个左右的数据分8~12组,100个以上的数据分12~16组。

本例有80个数据,分10组为宜。

组数确定之后,可由下列式子计算组距:

组距=极差/组数=49/10=4.9≈5

(3)决定分点:

将数据按照5分的距离分组,分成:

48~5353~5858~6363~6868~73

73~7878~8383~8888~9393~98

这时我们看到,有些数据(如48、53、58)本身就是分点,不好决定它们究竟应该属

于哪一组。

为了避免出现这种情况,可以使分点比数据多取一位小数,并且把第1小组

的起点稍微减小一点。

例如,可将第1小组的起点定为47.5,这样分成的10个小组是:

47.5~52.552.5~57.557.5~62.562.5~67.567.5~72.5

72.5~77.577.5~82.582.5~87.587.5~92.597.5~97.5

(4)列频率分布表:

分组

频数

频率

47.5~52.5

2

0.0250

52.5~57.5

6

0.0750

57.5~62.5

9

0.1125

62.5~67.5

22

0.2750

67.5~72.5

16

0.2000

72.5~77.5

12

0.1500

77.5~82.5

8

0.1000

82.5~87.5

3

0.0375

87.5~92.5

1

0.0125

92.5~97.5

1

0.0125

合计

80

1.0000

(5)画频率分布直方图:

为了将频率分布表中的结果直观形象地显示出来,需画出频率分面直方图:

频率│

组距│┌──┐

│││

│││

││├──┐

││││

│││├──┐

│││││

│┌──┤││├──┐

│││││││

│┌──┤│││││

│││││││├──┐

│┌──┤││││││├─┬─┐

└─┴──┴──┴──┴──┴──┴──┴──┴──┴─┴─┴──→

47.552.557.562.567.572.577.582.587.592.597.5成绩

80名学生数学成绩分布直方图

通过对一组数据的统计分析,绘制其频率分布直方图,就可以看出其是否遵循正态分布或偏正态分布。

2.2集中量

集中量是描述数据集中趋势的量,它主要有三种:

算术平均数,中位数,众数。

(1)算术平均数

学科考试后所计算的平均分,就属于算术平均数。

若频数较小,如计算班级平均分,则方法一般是:

所有被试分数的和除以被试人数。

=

由于大家都很熟悉,举例从略。

当观察数据中出现相同值的时候,比如,有f

个χi,i=1,2,……,k,则可用下列公式计算平均数:

=

f

,其中f

+f

+…+f

=n。

这个平均数称加权平均数,f

,f

,…,f

叫做权。

例1某校在教改实验中采用五级计分考核,实验班与对照班的数学成绩如下:

实验班:

等第

优秀

良好

中等

及格

不及格

人数

27

7

2

4

0

对照班:

等第

优秀

良好

中等

及格

不及格

人数

12

16

11

2

1

现规定优秀为90分,良好为80分,中等为70分,及格为60分,不及格为50分,问哪个班的成绩较好?

解:

实验班

(90×27+80×7+70×2+60×4)≈84(分)

对照班

(90×12+80×16+70×11+60×2+50×1)≈79(分)

经比较,实验班的成绩好。

=

f

=

+x

+…+x

设p

(i=1,2,…,k),则

=x

这是加权平均数计算公式的另一种形式,其中p

(i=1,2,…,k)叫做权重,p

p

+…+p

=1。

例2某校规定学生的体育学期成绩由三部分组成:

早锻炼及体育课外活动表现占

学期成绩的10%,体育理论测试占30%,体育技能测试占60%。

一学生上述三项成绩依

次为90分、85分、82分,求该生这学期的体育成绩。

解该生这学期体育成绩

=90×10%+85×30%+82×60%≈84(分)。

(2)中位数

在一次家庭年收入调查中,抽查了15个家庭的年收入(单位:

万元),将其从低到高排列,依次是:

0.91.01.01.11.11.21.21.31.41.41.51.51.61.718.1

上述数据的平均数为2.4(万元),比被抽查的前14个家庭的年收入高出许多,显然不能反映这组数据的集中趋势(前14个数据的大小比较接近,最后1个数据与它们的差异较大),这时,如果用最中间的数据1.3(万元)来描述这组数据,则可不受个别变动较大数据的影响。

将一组数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)

叫做这组数据的中位数,如,写出3,5,1,9,8的中位数:

这里共5个数,从大到小排列为9,8,5,3,1,排列后处在最中间的数是5,5就是这组数据的中位数;写出3,5,1,9,8,6的中位数:

这里共6个数,从大到小排列为9,8,6,5,3,1,排列后处在最中间的两个数的平均数为5.5,5.5就是这组数据的中位数。

中位数的性质是:

数组中大于中位数和小于中位数的数据的个数相等。

表4为某年级某学科某班学生考试成绩统计:

分数段

90~100

80~90

70~80

60~70

50~60

40~50

30~40

20~30

10~20

人数

5

17

12

8

4

2

2

1

1

累计数

5

22

34

42

46

48

52

53

54

组中值

95

85

75

65

55

45

35

25

15

求表4所示考试成绩的平均分和中位数。

说明:

区间上限和下限的平均数称为这个区间的组中值,它是这一区间所有分数的代表,即这个区间内的所有分数都用组中值代替。

用“加权法”求平均分:

先求出每一组的组中值与本组人数的积,再求这些积的和,最后用这个和除以各组人数的和,所得商就是平均分。

解所求平均分

=(95×5+85×17+75×12+…+15×1)÷54≈69.6(分)

用“插值法”求中位数:

由累计数知,按从高到低的顺序,数到80分有22人,与总人数之半差5人。

中位数在70─80之间,本区间有12人,假设等距排列,相邻两人分数差是10÷12=0.833分。

由此中位数=80-0.833×5=75.8。

列综合式:

中位数=80-

×(54÷2-22)=75.8(分)。

根据中位数和平均分的大小可以粗略估计分数的分布。

注意到只有一半学生的分数低于中位数,当平均分69.6低于中位数75.8时,说明低分很“低”。

(3)众数

一组数据中,出现次数最多的那个数值就是众数。

如:

数组3,4,5,3,6,5,4,5中,出现次数最多的数值是5,称这组数据的众数是5。

在象表4这样的频数分布表中,粗略估计众数的方法是:

频数(人数)最多一组的组中值。

表4中的众数是85。

众数也可以计算,但比较繁琐且用处不大(当数据接近正态分布时,常用皮尔逊的经验正式来估计众数),就不介绍了。

计算平均数时,所有的数据都参加运算,所以它能较为充分地利用数据所提供的信息,且有良好的统计性质,如,用样本平均数估计总体平均数,但它容易受异常值的影响。

中位数的优点是计算简单,受异常值影响较小,但它不能充分利用数据的信息。

当一组数据中,某些数据多次重复出现时,众数往往是我们尤为关心的一种统计量,但抽样方法不同对其影响较大。

2.3差异量

有两个搬运队,职工的年龄分别如下(单位:

岁):

甲队:

22,26,28,31,34,37,39

乙队:

15,18,27,29,37,43,48

两队人数相等,且平均年龄都是31岁,但显然乙队年龄差距大。

为了定量地描述这一特征,引入差异量。

表示一组数据离散程度的量称为差异量。

它是描述数据分布状况的另一重要特征量。

差异量越大,表示数据分布的范围越广,越不整齐。

介绍两种差异量:

标准差和差异系数。

(1)标准差

数据与平均数的差称为离差,离差平方的平均数称为方差,方差的算术平方根称为标准差,记着σ。

如,甲队职工年龄离差分别是-9,-5,-3,0,3,6,8,(依次将年龄减31),

则方差是[(-9)

+(-5)

+(-3)

+0

+3

+6

+8

]÷7=32,标准差σ=

=5.66(岁)。

标准差和平均数一样,都有单位。

根据标准差的定义,其计算公式是σ=

,其中

表示平均数。

根据标准差的计算公式,可求得乙队年龄的标准差是11.4岁。

由于σ甲

<σ乙,则乙队职工年龄的离散程度较大。

计算一组数据的平均数和标准差可以借助于科学计算器完成。

(2)差异系数

标准差可以用来比较两组数据之间离散程度的大小,但有两种情况这种比较毫无意义:

一是两组数据的测量单位不同;二是两组数据的测量单位虽然相同,但它们的平均数相差较大。

对于这两种情况可利用相对差异量(称为差异系数)进行比较。

差异系数是标准差与平均数的百分比,用符号CV表示。

差异系数的意义在于它是以平均数

为单位来衡量差异程度,差异系数大,表明离散程度大。

常用于:

①比较同一团体中不同单位资料的差异程度。

例4某班学生平均身高162.5cm,标准差为5.8cm;平均体重50.1kg,标准差为3.64kg。

试问身高与体重哪个离散程度大?

解由于单位不同,不可以直接比较两个标准差,现比较它们的差异系数:

CV高=

×100%≈3.57%,CV重=

×100%≈7.27%。

由此可知:

虽然体重的标准差小,但实际离散程度较大。

②比较单位相同而平均数相差较大的不同团体资料的差异程度。

例5某一测验,初三年级的平均分是50分,标准差是4.12;高一年级的平均分是80分,标准差是6.04。

问这两个年级的测验分数中哪一个离散程度大?

解:

由于平均数相差较大,不可以直接比较两个标准差,现比较它们的差异系数:

CV初三=

×100%≈8.24%,CV高一=

×100%≈7.55%。

显然初三年级的测验分数离散程度大。

2.4相关系数

数学成绩好的学生,物理成绩也好,但数学成绩好的学生,体育成绩不一定好,依据这种说法,我们就说数学成绩与物理成绩相关程度高,数学成绩与体育成绩相关程度低,甚至不相关。

用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数,一般用r表示。

积差相关系数一般用下面的公式进行计算:

r=

σ

表5:

10名学生数学与物理成绩如下表,计算数学与物理成绩的相关系数

序号

1

2

3

4

5

6

7

8

9

10

平均值

标准差

数学(X)

74

71

72

68

76

73

67

70

65

75

71.1

3.42

物理(Y)

76

75

71

70

73

79

65

71

62

76

71.8

4.96

乘积XY

5624

5325

5112

4760

5548

5767

4355

4970

4030

5700

5119.1

r=

=0.83,这说明数学成绩与物理成绩的相关程度高。

从理论上说,相关系数r的值在-1到+1之间,若r为正,则称这两个量成正相关;若r为负,则称这两个量成负相关;若r接近于零,则称这两个量成零相关或不相关。

二、教育测量

1、教育测量的意义

要理解教育测量的意义,首先要了解一般测量的意义。

测量的最基本特征是将事物

进行区分。

区分的过程要按照一定的法则进行,区分的结果要能用数学的方式进行描述。

因此,测量是按照一定的法则,用数学方法对事物的属性进行描述的过程。

按此定义,

教育测量是按照一定的法则,用数学方法对教育对象的若干属性进行描述、区分的过程。

根据测量的定义,可知测量(包括教育测量)应包含三个要素:

①测量的对象---事物的属性;

②测量的工具---某种法则;

③测量的结果---某种数学表达形式(很多情况下是用实数表示的)。

举例说明测量的三个要素:

测量学生的身高

①测量的对象(事物的属性):

学生的身高;

②测量的工具(某种法则):

赤足免冠、抬头挺胸等一系列的规定;

③测量的结果(数字):

××cm(公分)。

测量学生的英语听说水平

①测量的对象(事物的属性):

学生的英语听说水平;

②测量的工具(某种法则):

用预先编制好的试卷,限定时间准备,朗读一段文章并

回答老师提出的问题等测试规定;

③测量的结果(数字):

××分。

2、教育测量的特点

教育测量与一般测量相比,有如下的特点:

(1)教育测量一般是间接测量。

教育测量检测的是人的知识、技能、动机、态度、

品德等心理属性,这些都是人的大脑活动的反映,我们无法象测量身高、体重一样直接

测量,而只能根据人的外显行为间接测量人的心理活动的水平与特点。

与此同时,我们

只能由样本成绩推断总体水平,比如测量学生的英语听说水平,所用的测试试卷中所涉

及的词汇语言只是学生应该掌握的词汇语言的一部分,根据这一部分的得分去估计和推

测学生的总体水平。

因此间接测量是教育测量的特点之一。

(2)教育测量的度量单位是相对的。

教育测量没有统一的标准,若试卷容易,得分

就高,则一分的份量就轻;若试卷较难,得分就低,则一分的份量就重。

实际上,就在

同一次试验中,不同题目中的一分份量也不一定一样。

因此教育测量中的度量单位是相

对的。

(3)教育测量的相对准确性。

教育测量的内容往往涉及到人的心理,易受内外条件,

比如动机、态度、情绪、健康、睡眠、光线、气候等的影响,因而教育测量的正确性是

相对的。

3、教育测量的质量要求

教育测量的质量要求一般包括以下几个方面:

(1)效度,即有效程度。

可以用数学式子定义效度,但太抽象。

现将效度的意义描

述如下:

测量(包括测验)都是有一定的目标的,效度刻划了测量达标程度的高低,是反

映测量有效性与准确性的一项指标。

举一反例,用磅秤来测量学生的身高是无效的,这

样的测量效度为零。

再举一例,出这样一道数学题给小学生解答:

3童分9卵,童均几何?

如果要考查学生“等分除法”的掌握情况可能效度极低,因为学生不能正确解答,并不

是因为数量关系不清,而是读不懂题。

为了提高测量的效度,在确定测量的工具(如编制试卷)前,要认真拟定测量的目标。

关于效度,量化是比较困难的,但一般可以由专家作出定性的判断。

(2)信度,即可信性,指的是测量一致性的程度。

一个好的测量工具必须稳定可靠,

多次测量结果要保持一致,否则就不可信,比如说用橡皮筋制作的皮尺测量身高,测量

结果不可能一致,因而这样的测量就无信度。

理论上,信度可定义为:

由学生间确实存在的差异而造成的真实分数的方差σ

与实测分数方差σ

的比。

但实际上,学生的真实分数是不知道的,因此必须寻求估计考试信度的方法。

估计信度的主要方法有:

①再测法:

在条件完全相同的情况下,用同一份试卷对同一批学生考两次,计算这两次结果的相关系数,如果相关程度较高,则说明信度较高,反之则信度较低。

②等值法:

设计两份内容、题量、格式、难度、区分度、平均分、标准差都相同或相近的测试题,在短的时间内进行两次测试,计算这两次结果的相关系数。

如果相关程度较高则说明信度较高,反之则信度较低。

③折半法:

将同一份测试题按奇数题、偶数题分成两部分,分别计算奇数题、偶数题的总分,再计算它们的相关系数。

信度与效度的关系是:

无信度的测量一定是无效的测量,比如用橡皮筋制作的皮尺

来测量身高,肯定无效;有信度的测量不一定就是有效的测量,比如用磅秤来测量学生

的身高,无论测量多少次,结果都一样,从测量结果的“一致性”考虑,测量是可信的,然而无效。

因此,信度是效度的必要条件,而不是充分条件。

(3)难度。

难度是指测试试题的难易程度。

难度一般用大写字母P表示。

在学科测

验中,某题的难度一般用所有被试在该题的平均得分率来表示,即

所有被试在该题的平均得分

难度=─────────────

该题的满分数

表6:

计算某次考试试卷中各试题的难度

题号

1

2

3

4

本题满分值

20

10

20

15

本题平均值

19

7.2

7.2

3.6

本题难度P

0.95

0.72

0.36

0.24

注意:

难度(得分率)总在0到1之间,且数值越大试题越易。

(4)区分度。

区分度表示测试题目对学生学业水平鉴别的程度,用符号D表示。

这个量标志着该测试题鉴别能力的大小。

从理论上说,具有良好区分度的题,水平高的学生应得高分,水平低的学生应得低分;如果反过来了,则说明该题区分度低。

测试专家将试题的区分度称为测试是否有效的指示器,它是评价试题质量和筛选试题的主要指标和依据。

估计区分度的方法大致有两种:

分组法和相关法。

第一种方法:

分组法。

操作过程如下:

第一步,分组:

将所有被试按总分顺序排列(从高到低,从低到高都可以),然后将

这些被试分为三组:

①从最高分开始的总人数的27%分为一组,称为高分组;②从最低

分开始的总人数的27%分为一组,称为低分组;③余下的46%也算一组,不过在下面的

计算过程中就不用他们的数据了。

第二步,统计:

比如说要计算A题的区分度,①计算高分组中A题的得分率,用符

号PH表示;②计算低分组中A题的得分率,用符号PL表示。

第三步,计算:

A题的区分度D=PH-PL

有时也用PH和PL的值来估计试题的难度,公式是P=(PH+PL)/2。

表7:

计算某次考试试卷中各试题的区分度

题号

1

2

3

4

高分组Ph

0.85

0.15

0.85

0.45

低分组Pl

0.78

0.07

0.24

0.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 政史地

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1