学生成绩综合评价模型docx.docx
《学生成绩综合评价模型docx.docx》由会员分享,可在线阅读,更多相关《学生成绩综合评价模型docx.docx(34页珍藏版)》请在冰豆网上搜索。
学生成绩综合评价模型docx
XX文库-让每个人平等地提升自我
学生学习状况评价与预测
摘要
随着社会办学规模的不断扩大,教学质量的保证和提高问题日益凸显,各种教学研究和教学实践层出不穷,但是学生学习状况的评价作为提高教学质量和激励学生努力学习的重要手段,却没有得到应有的重视,传统的评价方法忽略了学生基础条件的差异,并不能对学生的学习状况进行全面、客观、合理的评价,因
而,建立一种科学的评价方法势在必行。
本文首先通过分析附件中的612名学生四个学期综合成绩,发现成绩会根据试题的不同导致分布状态的变化,利用SK法,Q-Q图检验为负偏态分布。
所以首先利用转化函数将所给的成绩进行标准化使得标准化后的成绩能够满足统一的正态分布曲线,去除了试卷难度对于学生的影响。
然后在对学生学习状况的评估中,建立了模糊综合评价模型、基于层次化分析的模糊评价的改进模型、数据包络分析法(DEA),这三个评价模型进行评价。
基于层次化的模糊评价模型是模糊分类模型的改进,通过层次分析的方法能够得到可行科学的评估权值,利用标准化的成绩能够得到每个学生的评估总分,并不是模糊分类模型中量子化的得分。
而DEA法主要注重的是成绩的稳定上升,是对于前两种模型的补充。
在预测过程中我们运用了线性回归预测模型、模糊分析预测模型、GM(1,1)
成绩预测模型、ARIMA(0,1,1)成绩预测模型,通过预测结果我们发现,在假设学
生学习状况不变的情况下模糊分析预测模型的预测结果良好,可以很好的反映学
生的动态的进步情况,而GM(1,1)的预测结果很差,不推荐使用。
如果考虑实
际学生成绩波动和季节性变化的影响,则需要使用ARIMA(0,1,1),实际中这个
模型的预测结果最好。
预测成绩表
学生序号
1
2
3
4
5
6
7
8
9
10
第5学期
第6学期
最后,我们对我们所建立的模型进行了客观的比较,并对其应用前景进行了展望。
关键字:
标准化模糊综合评价模型层次分析DEA线性回归预测模型
模糊分析预测模型GM(1,1)ARIMA(0,1,1)
1
XX文库-让每个人平等地提升自我
2问题的重述
正确地、科学的评价学生的学习状况对于学校的教学工作至关重要,它是学
生认识自己的前提条件,是激励学生努力学习不断进步的动力,同时也是教师培
养学生的参照基础。
然而,现行的评价方式单纯的根据“绝对分数”评价学生的
学习状况,忽略了基础条件的差异;只对基础条件较好的学生起到促进作用,对
基础条件相对薄弱的学生很难起到鼓励作用。
在本题中,附件给出了612名学生连续四个学期的综合成绩。
要求我们做到
以下三点:
1.根据附件数据,对这些学生的整体情况进行分析说明;
2.根据附件数据,采用两种及以上方法,全面、客观、合理的评价这些学生的学习状况;
3.根据不同的评价方法,预测这些学生后两个学期的学习情况。
2问题的分析
1、首先我们通过原始数据可以做出其基本的统计量和直方图。
考虑到在学
生成绩评价中会收到试卷难度等因素的影响。
所以必须得构造转化函数将
所给的成绩进行标准化使得标准化后的成绩能够满足统一的正态分布曲
线,去除了试卷难度对于学生的影响。
2、在学生整体成绩评估中,我们可以分析学生成绩平均值和稳定度的关系、
分析学生成绩段人数、分析学生整体进步度、分析基础成绩对于总成绩的
影响。
3、对于构造模型对学生学习状况进行合理有效的评估,我们可以利用模糊综合评价模型、层次化分析法、数据包络分析法(DEA)这三个评价模型进行评价。
4、对于成绩的预测,我们可以想到基本的几个预测模型:
线性回归预测模型、模糊分析预测模型、GM(1,1)成绩预测模型、ARIMA(0,1,1)成绩预测模型,每个模型的着重点都不一样,这样对于从不同方面解决问题有着很
大的帮助。
2
XX文库-让每个人平等地提升自我
3模型的假设
1、假设每个学期的综合成绩的满分为100分
2、假设每个同学的学习能力基本不变
3、假设附件数据中的两个零是由特殊情况所致
4、假设每个学生处于相同的考试环境中
5、假设附件中所给数据为学生真实考试成绩,不存在作弊问题的影响
6、以后两个学期与前面四个学期采用同样的记分方式
7、在模糊预测模型中我们假设两个学期学生的学习状况是不变的
4符号的说明
j:
学期
i:
学生序号
D:
总评价得分
xij0:
第i个学生的第j学期的原始成绩。
DMUj:
第j个决策单元
U:
因素集
Vi:
评语集
其他主要符号将在模型建立的时候详细说明。
3
XX文库-让每个人平等地提升自我
5模型的建立
数据标准化
为了避免现行评价方式中仅根据“绝对分数”评价学生学习状况,设计出
一种新型的发展性目标分析法,必须考虑到户律基础条件的差异,学生原有的学习基础,也注意到学生学习的进步因素。
首先注意到题干中所给出的数据为学生四个学期的分数,由于在实际中,
如果单单注意绝对分数的话,由于试卷的难度的不同,会导致单纯通过题干给出
的数据信息进行分析肯定是不准确的。
根据教育学与统计学的理论,一次难度适中信度可靠的考试,学生的成绩
应接近正态分布。
也就是说,当学生的成绩接近于正态分布时,说明此次考试基本达到了教学要求。
判断成绩是否接近正态分布最直观,最有效的方法就是将成绩分布曲线与均值和方差相同的正态分布曲线加以比较。
如果是负偏态分布,则说明试题总体难度偏高。
如果是正偏态分布,则说明试题总体难度偏低。
如果是陡峭型分布,则说明试卷中难度中等的度量占比重太大。
这样首先做出所给数据中四个学期成绩的直方图和原始成绩的统计分析,
其中实线表示正态分布的曲线,直观的说明所给成绩为偏正态分布。
这样我们的
目标就变为构造一种变换使学生每个学期的成绩符合相同的正态分布曲线,这样也就能将试卷难度等影响消去,才能对所给的每个学期的成绩相互之间进行比
较。
4
XX文库-让每个人平等地提升自我
其次对原始数据进行SK检验得:
第一学期第二学期第三学期第四学期
Sk
Ku8,142
5
XX文库-让每个人平等地提升自我
通以上的分析,我可以,直方在准正分布曲的右,
且Sk<0,都属于偏分布,明的体度是偏低的。
而且根据Ku
大可以中中等度的目越来越多了。
根据其平均和方差可
知:
学生在第四学期的平均成最高,其次是第二学期,第一学期和第三学期的
平均成略低一些;但是从方差来看,第一、三学期低于第二、四学期,从上
中也可以明看出,第一、三学期学生的成分布要比第二四学期学生的成
分布要集中。
那么下面我构造一种方法使得每个学期学生化后的成符合相同的正
分布曲。
定:
xi0(i=1,2⋯n)n个学生的某一学期的原始成。
yiln(100xi0),就可以将一个偏正分布成了yi足的正分
布,由于函数减函数,原始成高的反而得成低了,和保
一致,行以下x1i2yyi。
就能得到一个足准正分布的数据了。
下面通坐的偏移拉伸使得其足相同分布的正分布。
n
1
1
xi1
的方差:
21
(xi1
x1)2,得到xi2xi
x
,均就偏移
n
1i1
到了x=0,且准差1。
作出X2
的直方如下:
6
XX文库-让每个人平等地提升自我
利用Q-Q图检验其正态性得:
说明其具有良好的正态性,那么数据的标准化和检验均告完成,这样就去除了试卷难度等客观因素导致成绩分布不合理产生的误差。
下面就可以根据已得到的标准化数据对于学生成绩进行评估。
7
XX文库-让每个人平等地提升自我
学生整体状况的分析
(1)分析学生成绩平均值和稳定度的关系
根据已经标准化的成立,利用平均成绩与方差所联合做成的散点图,我们可以看出,大体的情况是,多数同学的成绩还是比较稳定的,就是个别同学,成绩
起伏很大,并且大致趋势为,成绩越好的同学波动越小,相反,成绩不好的同学波动就很大。
(2)学生成绩段人数分析
由于这里要进行学生成绩段的分析,就不能使用已经标准化的成绩了,显然
如果使用标准化后的数据,则数据基本满足标准正态分布,这样进行成绩的分段
研究也就失去了意义。
对原始数据进行成绩的分段分析得:
成绩人数学期
1
2
3
4
90分以上
0
2
1
0
80~90分
138204129
194
70~80分
275246303
287
60~70分
140110144
105
60分以下
5950
35
26
8
XX文库-让每个人平等地提升自我
通过以上分析我们了解到:
第二学期和第四学期80以上的学生要明显高于第一学期和第三学期,而70分以下的学生数量要低于第一学期和第三学期,这就使得第二、四学期学生的平均成绩要高于第一、三学期。
而且不及格人数约来越少,成绩分布约来越集中,这正好和中SK分析得到的结果一致,也就是陡峭度越来越大。
从饼状图中还可以看出,成绩的分布渐渐朝着高分发展,这与SK分析中Sk值渐渐减小也是相一致的。
显然在这一步的分析中,造成这个结果的产生,可能因为试卷的原因,也可能是学生们通过学习进步的结果。
(3)学生整体进步度分析
首先对标准后数据进行差分处理,计算出差分后的平均值,即平均进步率。
作出其平均分数和平均进步率的散点图,如下:
由图可见,在平均值为0处,即成绩中等的同学中,会出现进步和退步较快的同学,而在成绩较好的同学部分,成绩进步不大,在成绩较差的部分,退步的同学相比进步的同学较多。
9
XX文库-让每个人平等地提升自我
(4)基础成绩对于总成绩的影响分析
将第一学期的成绩看作是学生的基础成绩,作出基础成绩和总成绩的散点
图:
我们可以看出数据点大致看来成线性,所以,入学基础对大学读书影响还是比较大的。
10
XX文库-让每个人平等地提升自我
评价学生的学习状况
(1)模糊分类综合评价模型
根据中我们发现评定学生学习状况的依据有,学生的平均分,学习波动度,
进步度。
下面从三个方面对学生进行综合评定。
设:
第i个同学的因素集Ui={平均分ui1,学习波动度(标准差)ui2,平均进步率ui3},评语集Vi={优vi1,良vi2,中vi3,差vi4}
对于每名学生基于其四个学期成绩及成绩变化做单因素评价:
首先我们确定优良中差的比例固定为1:
4:
4:
1,这样就能使学生评价处
于平均,增强学生的学习动力。
1、对于平均分ui1
因为不同基础的同学对某一得分同学的评价不同,所以当一名学生得60分时,得分大于80分的同学会认为其基础差。
所以对学生的分数进行优良中差的比例分类:
评者
~
0~
~0
~
被评者
~
良
优
优
优
0~
中
良
优
优
~0
差
中
良
优
~
差
差
中
良
得到ui1的单因素评价向量为:
ri1
(ri1y,ri1l,ri1z,ri1c),ri1y,ri1l,ri1z,ri1c
分别为优良中差的权重
11
XX文库-让每个人平等地提升自我
2、对于标准差ui2得:
评者0~~~~
被评者
0~
良
优
优
优
~
中
良
优
优
~
差
中
良
优
~
差
差
中
良
得到ui2的单因素评价向量为:
ri2(ri2y,ri2l,ri2z,ri2c),ri2y,ri2l,ri2z,ri2c分别为优良中差的权重
3、对于平均进步率ui3得:
评者~~~~
被评者
~
良
优
优
优
~
中
良
优
优
~
差
中
良
优
~
差
差
中
良
得到ui3的单因素评价向量为:
ri3(ri3y,ri3l,ri3z,ri3c),ri3y,ri3l,ri3z,ri3c分别为优良中差的权重
这样得到单因素评价矩阵:
ri1
ri1y,ri1l,ri1z,ri1c
Ri
ri2
ri2y,ri2l,ri2z,ri2c
ri3
ri3y,ri3l,ri3z,ri3c
考虑到对于差生的鼓励作用,我们认为平均进步率和平均成绩甚至比平均成绩更加重要,这样我们将三个因素分配权重为:
C=(,,)
12
XX文库-让每个人平等地提升自我
BiCRi
ri1y,ri1l,ri1z,ri1c
做模糊变换:
(0.4,0.1,0.5)ri2y,ri2l,ri2z,ri2c
ri3y,ri3l,ri3z,ri3c
(biy,bil,biz,bic)
这样就能得到特定同学的评价向量了。
在对其总分进行加权分析得:
学生总评价分Di3*biy2*bilbiz
由于总评价分是在区间[0,3]上的,所以可以划分为4类:
[9/4,3],[3/2,9/4],[3/4,3/2],[0,3/4]分别为优良中差。
下面计算前10名同学的评价向量和总评价分:
数据为:
0.5,0.4,0.1,0
可以得到第一名学生的R10.5,0.4,0.1,0
0.1,0.4,0.4,0.1
这样B1=(,,,)D1=所以第一名学生的评价应该为良
利用Matlab通过以上方法对所有数据进行求解得:
(仅列出前10名同学的数据)
13
XX文库-让每个人平等地提升自我
学号前十的学生的综合评价排名为:
D5D3,D9D1D2,D4D10D6D7D8
我们可以发现,由于构造加权系数的时候,我们在学生的优良中差的比例设置中将良和中的比例设置的比较高,这样导致了我们得出的分类评价中良和中比例比较高。
这样也符合教师评价学生的一般规律。
(2)基于层次化分析的模糊评价的改进模型
在5.3.1中我们发现上述的模型建立会出现如下问题:
1、在5.3.1中,对于数据的结果我们发现,虽然我们求出了学生总评价分Di,但是Di是一个类似量子化得值,这是由于我们在模型建立的第一
步就已经将各种成绩的数据进行了分类。
这样由于Di的值的影响,我们
会发现很多通过已给的成绩可以比较相互之间差异的同学,我们通过Di
的值发现两者的学习状况是一样的,这显然是有问题的。
那么我们可以很容易的想到直接利用所得到的标准化的成绩进行分析。
2、在5.3.1中我们了解到所给的权值都是我们自己预设的,这样的科学根
据显然是不精确的,这样我们想到了利用层次分析法对权值进行估计。
3、在5.3.1中,我们对于每个学期成绩的影响视为完全相同的,这显然是不精确的,在实际问题中,对于当前学生学习成绩的评估,最近一次的
成绩当然是更加重要的。
这样我们可以得到分析所用的层次图:
14
XX文库-让每个人平等地提升自我
首先对数据进行处理,由于评分的原因,不论是哪一学期的成绩还是进步度,抑
或标准差,他们的单位首先是要统一的,我们将每组数据都除以改组数据的最大
值,这样就能将他们的数据的满分设为1,这样总体评价分的满分也设置为1了。
得到处理后的数据为:
下面根据层次分析法进行权值分析:
设第i名学生的j个学期的成绩为mij,第k次成绩进步度为sik,标准差为ui
首先是第一层:
同样是为了鼓励学生,我们设学生进步情况比学生成绩情况稍强,设为2;学生
成绩情况比成绩波动性明强,设为5,学生进步情况比成绩波动性设为6;这样
15
XX文库-让每个人平等地提升自我
1,1/2,5
可得到比例矩阵为;R12,1,6
1/5,1/6,1
这样通过matlab可得最大特征根λmax=
得到第一层权值向量为W1=()
通过检验得:
CR=CI/RI=<检验正确可行
其次对第二层进行分析:
设每学期对于学生总体成绩评价的影响度逐步提升,得到:
1,1/2,1/3,1/4
R2
2,1,1/2,1/3
3,2,1,1/2
4,3,2,1
同样可得:
最大特征根λmax=
得到第二层成绩权值向量为W2=()
检验可行性成立
同样成绩进步度对于成绩进步情况的影响逐步提升,得到:
1,1/2,1/3
R32,1,1/2
3,2,1
同样可得:
最大特征根λmax=
得到第二层成绩权值向量为W3=()
检验可行性成立
综上所述:
准则层成绩进步程度基础
单排序
子准则层成绩1成绩2成绩3成绩4进步1进步2进步3
单排序
16
XX文库-让每个人平等地提升自我
设612位同学的成绩向量,进步向量,波动性向量分别为:
M(m1,m2,m3,m4),S(s1,s2,s3),U
总成绩评价为:
D(M*W2T,S*W3T,U)*W1T
得到评价如下表,通5.3.1
的流量中差比例为
1:
4:
4:
1进行分类得到:
学号
总体评
分类
学号
总体评
分类
学号
总体评
分类
价
价
价
1
良
11
中
21
中
2
中
12
中
22
良
3
中
13
良
23
中
4
良
14
中
24
中
5
良
15
中
25
中
6
中
16
良
26
差
7
中
17
中
27
中
8
差
18
中
28
差
9
中
19
中
29
中
10
中
20
中
30
中
得到学号前十的同学的排名为:
D5D4D1D6D2D9D10D3D7D8
并发现学号为539的学生学习情况最好,调出其原始数据:
学生序号学期1成绩学期2成绩学期3成绩学期4成绩
539
可以发现其平均成绩较好,而且在第四学期成绩有了很好的提升,这使得其
在综合评价的过程中,由于第四学期的成绩和进步的权重较高,这样该生的学习
状况非常好。
与5.3.1中的模型结果加以比较,可以发现:
两者的分类情况基本是一致的,对比前10名同学的情况,发现2,3,6,7,
9,10的同学,在评价时其分类由良变成了中,这是由于其第四学期的成绩不理
想造成的,而在这个动态评价模型中,第四学期的权重是相当高的,这样才导致
了这些同学的综合评价的下降。
17
XX文库-让每个人平等地提升自我
(3)DEA方法评价模型
DEA评价模型是数据包络分析方法,它的功能是“评价”,特别是进行多个
同类样本的“相对优劣性”的评价,它根据一组关于多输入多输出的观察值来评
估有效性。
DEA评价方法的原理:
设有n个同类决策单元,每个决策单元都有m种类型的输入(表示对资源的
耗费)以及s种类型的输出(表示消耗了“资源”之后表明成效的信息量)。
其中第j个决策单元DMUj的投入向量为Xj(x1j,x2j,,xmj)T,产出向量
Yj
(y1j,y2j,
ymj)T
(Xj,Yj)为DMUj的生产活动。
Xij为DMUj对第i种类型输
入的投入总量,xij
0;yrj为DMUj对第r种类型输出的产出总量,
y
rj
。
i
1,2,
mr
1,2,,
s。
0
;
本文采用DEA的线性规则形式、对决策单元的规模有效性和技术有效性同
时评价的DEA模型。
基于输入的
DEA方法C2R模型。
(
)
2
R模型可以表示为:
对
X0,Y0决策单元DMU0的C
min
[
(e1
Ts
e2
Ts)]
n
s.t
Xjj
s
X0
j
n
Yj
j
s
Y0
j1
j
0(j
1,2,
n),s0,s0
其中e1T、e2T分别为元素均为1的m维向量和s维向量,表示阿基米德无穷小量,s(s1,s2,,sm)T,s(s1,s2,,sm)T是松驰变量。
设以上线性规划的最优解为,s,s,,则有:
1)若1,s、s的分量存在非零值,则DMU0为DEA有效(C2R)。
表示
DMU0的生产活动同时为技术有效和规模有效,各种资源得到充分利用;如果某
个s的分量大于0,则表示某种输出指标还有增大的可能。
2)若1,ss0则DMU0为DEA有效(C2R)。
表示DMU0的生产活动
同时为技术有效和规模有效,各种资源得到充分利用,取得了最大的输出效果。
18
XX文库-让每个人平等地提升自我
3)1,则DMU