如何用线性回归分析和水平测试成绩_精品文档.doc
《如何用线性回归分析和水平测试成绩_精品文档.doc》由会员分享,可在线阅读,更多相关《如何用线性回归分析和水平测试成绩_精品文档.doc(6页珍藏版)》请在冰豆网上搜索。
如何用线性回归分析和水平测试成绩
估计学生高考成绩
评价学生和学校的进步情况
“普通高中新课程学生学业成绩评价研究”项目组
从2005年开始,教育部“普通高中新课程学生学业成绩评价研究”项目组开始高中必修课学业水平测试的研究活动。
作为高中必修课的学业水平测试,具有三个方面的功能:
第一,检查学生经过必修课学习后达到的水平,帮助学生建构学科知识结构;第二,诊断教学中存在的问题,为教师搞好选修阶段的教学以及高考复习做准备;第三,预测学生在高考中可能达到的成绩水平。
前两方面的功能是显而易见的,我们通过每年测试后的信息反馈和分析报告,已经做了这项工作。
第三项工作是大家所关心的,然而要如何做才能达到呢?
通过回归分析,我们可以计算出每一位同学、每一间学校从必修课水平测试到高考这段时间内的进步情况,建立起高考与水平测试之间的关系模型,进而粗略地预计新参加水平测试的学生将来参加高考可能达到的成绩区间。
下面简单介绍线性回归分析的方法和如何解读数据的方法。
1、线性回归分析
线性回归是利用线性方程来模拟表示两组相关数据之间的关系的方法。
如果两组相关数据,比如说,必修课水平测试与高考成绩之间存在着相关关系,这种关系可以近似地用一个线性方程来表达,即高考的成绩与水平测试的成绩之间的关系可以表示为:
,其中a和b为两个常数,通过统计分析可以把这两个常数找出来。
这样对应于每一个的值,就可以找到相应的值,即可以用这一关系来预测高考的期望成绩。
由于新课程实施后的高考是以必修课的内容为主要的测试对象,学生经过必修课的学习基本上奠定了高考的知识基础,掌握了相关学科的基本能力,又因为我们的测试题目的目标要求与高考的目标要求在本质上是一致的,必修课水平测试的成绩与高考成绩应该存在着高度相关的关系。
我们的研究也证实了这种关系的存在。
在2005年,佛山市顺德区和禅城区的高二学生参与了我们的必修课水平测试,在2007年他们又参加了高考。
根据这些考生两次考试的成绩,我们计算得到两次测试的语文科相关系数为0.454,数学科(文)的相关系数为0.429,数学科(理)的相关系数为0.450,英语科的相关系数为0.608,语数英三科总分(文)的相关系数为0.680,语数英三科总分(理)的相关系数为0.693。
由于高考是在必修课水平测试施测一年后才进行的,因而上述相关系数都是比较可观的,尤其是语数英三科总分(理)的相关系数高达0.693。
因此,通过统计分析确定上述回归方程是可能的。
以下以英语学科为例来具体说明如何运用线性回归分析来估计学生高考可能达到的成绩。
2、利用回归直线与回归方程估计高考成绩
在研究05年必修课水平测试和07年英语高考成绩的关系时,以横坐标和纵坐标分别表示各考生必修课水平测试中英语成绩和高考英语成绩画点(见图1)。
我们发现,这些点均匀地分散在图中的红色线周围。
红色线基本展示了必修课水平测试中英语成绩和高考英语成绩的关系,我们称之为两者的回归直线。
回归直线对应的线性方程称为回归方程,下图红色线对应的回归方程为:
=37.887+0.790。
图1:
05年必修水平测试与07年高考英语科回归图线
我们可以利用回归方程来预测高考的期望成绩。
例如,在05年的必修课水平测试中,张恒源同学的英语成绩是25分。
由回归方程=37.89+0.79我们可以得到其英语高考成绩期望值为57.64分。
不过,由于在必修课水平测试与高考之间,学生还要经过一年多的选修课学习以及高考复习。
在这段时间内的许多因素,如:
学生本身的努力程度,学生的学习方式,教师的教学水平和教学方法等等,都会对学生的高考成绩产生影响,水平测试成绩与高考成绩之间的关系不可能是简单的线性关系,由线性方程计算得到的跟考生高考的实际成绩未必一致。
加上水平测试和高考本身都存在测量误差,因此需要在回归方程的基础上加一个反映估计误差的区间,以此来估计学生的高考可能达到的成绩。
在回归分析中,有一个概念“估计标准误”S,就是用来表示估计误差的。
当统计数据正态分布时,考生高考的实际成绩落在区间[-S,+S]的概率是68%,而落在区间[-1.9S,+1.9S]的概率是95%。
一般的,我们采取[-S,+S]作为高考成绩的期望区间。
当然,用这样的方式来估计学生的成绩不可能是非常精确的,但是也可以让学生和教师明确自己的努力方向,可以判断学生和学校的进步情况,从而为评价学校的教学和学生的学习提供依据。
在上例中,由SPSS计算可得估计标准误为17.21。
由于张恒源同学的英语高考成绩期望值为57.64分,所以他的英语高考成绩的期望区间为[-17.21+57.64,17.21+57.64],即[40.43,74.85]。
由于高考的延续性和考生总体水平的相对稳定性,我们可以利用05-07年的回归分析结果,预测06年参加水平测试的学生在08年参加高考时可能得到的成绩。
比如说,06年有一位考生的英语水平测试成绩和张恒源一样是25分,可以粗略地预测他08年参加高考的英语成绩可能在40-75分之间。
经过我们对05年参加必修课水平测试、07年参加高考的考生的数据进行回归分析,我们得到的回归方程如表1所示。
表1:
05年必修水平测试与07年高考回归分析数据表
科目
语文
数学(文)
数学(理)
英语
三科总分(文)
三科总分(理)
匹配的考生数
8927
4370
3821
8531
3589
3459
匹配的学校数
20
19
19
20
17
17
相关系数
0.454
0.429
0.450
0.608
0.680
0.693
回归方程
Y=63.03+0.43X
Y=60.62+0.59X
Y=55.58+0.52X
Y=37.89+0.79X
Y=100.92+0.90X
Y=94.35+0.88X
估计标准误
10.94
22.66
18.81
17.21
35.77
33.71
3、进步值
用回归分析来预测高考的期望成绩,得到的是一个以期望值为中值、标准误为幅度的区间。
如图1所示,两条蓝色线分别为方程y=+S和y=-S对应的直线。
这两条蓝色线分别表示期望区间的上下界。
当表示考生两次成绩的点落在两条蓝色线之间时,则认为他正常发挥,该考生的进步值为“0”;如果他的实际成绩超过区间上界,即在表示上限的蓝线的上方,则认为他进步了,进步值=高考实际成绩-区间上界;如果他的实际成绩比区间下界还少,即在表示下限的蓝线的下方,则认为他退步了,进步值=高考实际成绩-区间下界。
图2给出每位同学的水平测试成绩、高考成绩期望区间和进步值的情况。
从图2中可见,在07年的高考中,张恒源同学英语高考的实际成绩为32分,比区间下界还少,所以他的进步值=高考实际成绩-区间下界=32-40.43=-8.43。
又如,蔡淑意同学水平测试的成绩为27.50,高考英语成绩的期望区间为[42.41,76.83],她高考的实际成绩为44分,落在期望区间,她的进步值为0。
再如,黄冠鹏同学水平测试的成绩为37.00,高考英语成绩的期望区间为[49.92,84.34],他高考的实际成绩为101分,超出了期望区间的上界,因而他的进步值=高考实际成绩-区间上界=101-84.34=16.66.。
图2:
05年必修课水平测试与07年高考英语成绩期望区间与进步值
4、学校教学质量监控
按如上方法可以计算出各个考生的英语高考成绩期望值、期望区间以及进步值。
进而可以计算出各学校进步值的平均数和标准差,从而对各校的进步值进行排名(见表2),并以此为依据来分析各个学校的教学质量,实现对学校教学质量的监控等。
例如,由表2可见,学校F在05年的必修课水平测试中排名最后,可是在07年的高考中却提高了5名,名列15,其进步值的平均值为6.32,在所有学校中名列第一。
这在一定程度上表明,虽然在必修课水平测试时,该校考生水平较差。
然而在必修课水平测试到高考这一年多的教学中,该校的教学质量却很好,从总体上学生获得较大的提高。
学校G和学校H,在水平测试时的成绩分别排名第二和第一,但是其高考平均进步值的排名却倒过来为第九和第十,说明学校G的进步更大一些。
表2:
05年必修水平测试与07年高考回归分析英语学科数据表
学校名称
(共20校)
匹配的
考生数
2005年必修测试
2007年高考
进步值
平均分
排名
平均分
排名
平均数
标准差
排名
A
752
56.78
17
92.80
6
3.70
8.58
3
B
940
66.05
7
95.00
5
2.49
8.67
6
C
391
62.10
11
88.59
8
1.44
7.23
7
D
315
59.80
15
89.14
7
3.81
10.10
2
E
171
49.03
19
79.63
16
3.32
11.21
4
F
407
40.83
20
79.64
15
6.32
13.88
1
G
323
81.07
2
111.71
2
0.99
2.55
9
H
336
83.99
1
107.32
3
0.16
3.37
10
I
299
69.44
4
103.33
4
1.23
3.24
8
J
475
64.98
9
84.12
10
-1.10
4.05
14
K
292
55.20
18
73.72
20
-1.45
4.09
16
L
277
61.21
13
80.24
14
-1.01
3.57
13
……
5、小结
利用线性回归分析得出的回归方程和标准误,可以估计下一年度参加水平测试的学生可能达到的高考成绩区间;同时也可以回过头来确认已经参加高考的这一届学生和学校的进步情况,为监控学校教学质量作出依据。
附表:
一、06年参加水平测试的学生08年高考语数英总分期望表
二、06年参加水平测试的学生08年高考语文成绩期望表
三、06年参加水平测试的学生08年高考数学成绩期望表
四、06年参加水平测试的学生08年高考英语成绩期望表
五、05年必修水平测试与07年高考回归分析各校进步值
六、05年必修水平测试与07年高考回归分析语数英总分数据表
七、05年必修水平测试与07年高考回归分析语文科数据表
八、05年必修水平测试与07年高考回归分析数学科数据表
九、05年必修水平测试与07年高考回归分析英语科数据表