关于课程关系量化分析的数学模型.docx

资源描述

关于课程关系量化分析的数学模型.docx

《关于课程关系量化分析的数学模型.docx》由会员分享，可在线阅读，更多相关《关于课程关系量化分析的数学模型.docx（19页珍藏版）》请在冰豆网上搜索。

关于课程关系量化分析的数学模型.docx

关于课程关系量化分析的数学模型

2012高教社杯全国大学生数学建模竞赛

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括、电子、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。

我们知道，抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们重承诺，严格遵守竞赛规则，以保证竞赛的公正、公平性。

如有违反竞赛规则的行为，我们将受到严肃处理。

我们参赛选择的题号是（从A/B/C/D中选择一项填写）：

我们的参赛报名号为（如果赛区设置报名号的话）：

所属学校（请填写完整的全名）：

大学

参赛队员（打印并签名）：

1.瑞

2.呼建雪

3.朱培育

指导教师或指导教师组负责人（打印并签名）：

日期：

2012年8月27日

赛区评阅编号（由赛区组委会评阅前进行编号）：

2012高教社杯全国大学生数学建模竞赛

编号专用页

赛区评阅编号（由赛区组委会评阅前进行编号）：

赛区评阅记录（可供赛区评阅时使用）：

评

阅

人

评

分

备

注

全国统一编号（由赛区组委会送交全国前编号）：

全国评阅编号（由全国组委会评阅前进行编号）：

关于课程关系量化分析的数学模型

摘要

本文探讨研究了关于某高校两个专业四门课程分数、学生学习水平的差异显著性以及课程间相互影响的情况。

首先我们对两个专业的各科成绩分别统计了平均值、标准差、及格率以及优秀率这些统计量值，又根据这些数据作出了特性指标矩阵；然后采用模糊聚类分析中的最优划分法得到了聚类分类结果，得到结论为：

两专业的高级程序设计语言分数差异性显著，其他三门科目均没有显著差异。

接着我们根据课程间的联系，采用层次分析法得到各个科目在总成绩中所占的权重，即得到关于衡量学生学习水平的总成绩模型：

然后利用单因素方差分析法得到专业对学生学习水平影响的显著性

，即两个专业学生的学习水平无明显差异。

对于问题（3），我们直接利用SPSS软件中的回归分析法得到高级程序语言设计、离散数学两门课程学习的优劣会影响到数据结构和数据库原理的学习。

最后，综合以上分析得到对于专业主干课的学习，我们应该认真学好专业基础课，以便为后续课程的学习打好基础。

关键词：

模糊聚类分析层次分析单因素方差分析回归分析

一．问题重述

附件一、二分别给出了某高校两个专业的高级语言程序设计、离散数学、数据结构、数据库原理这四门课程的期末考试成绩数据，请根据数据分析并解决以下几个问题：

（1）分析每门课程两个专业学生的分数是否有明显差异？

（2）分析两个专业学生的学习水平有无明显差异？

（3）分析说明高级语言程序设计和离散数学两门课程学习的优劣是否影响数据结构和数据库原理两门课程的学习？

（4）根据1~3问所作出的分析，面向全校本科生同学，撰写一篇1000字左右的论文，阐述你们对于专业主干课程学习方面的看法。

二．问题分析

2.1针对于问题

（1）：

该题要求我们针对两个专业的每门课程的分数分析其差异性，所以对于四门课程，我们利用Excel计算出每科成绩相应的统计量，然后利用模糊最优划分法比较对应的统计量值得到差异显著性的相关结论。

2.2针对于问题

（2）：

由于要用成绩来衡量学生的学习水平，所以首先我们采用层次分析法得到各科成绩在总成绩中所占的权重，然后再利用单因素方差分析法作出总成绩受专业因素的影响情况，即可得到两个专业学生学习水平的差异性。

2.3针对于问题（3）：

按实际学习情况来看，高级语言程序设计和离散数学两门课程作为基础课，对后续课程的学习会有一定的影响。

为了进一步说明高级语言程序设计和离散数学两门课程的优劣是否对数据结构和数据库原理两门课程有影响，我们不考虑专业的影响，仅从这四门课程成绩的相关性进行考虑，即高级语言、离散数学与数据结构成绩的相关性，高级语言、离散数学与数据库原理成绩的相关性。

利用SPSS软件中的回归分析进行求解。

2.4针对于问题（4）：

综合分析问题

（1）—（3）的结论，得到一些关于专业主干课程的学习建议。

并按要求撰写1000字左右的建议信。

三．模型假设

1.对0分成绩视为缺考处理，即该项数据为无效数据；

2.学生与学生之间、班级与班级之间的成绩无相互影响，即为独立的；

3.学生的学习水平仅有成绩来衡量，该论文不考虑其他因素。

四.符号说明

符号

定义

学生的总成绩

第

个学生第

门课程的成绩

课程编号，附件表中依次为1、2、3、4号课程

学生编号

拉格朗日乘子

特性指标矩阵（相似矩阵）中的元素

满分级指标

评价标准集

五．模型建立与求解

5.1问题

（1）：

将附件所给数据利用Excel统计出两个专业每门课程的平均分、标准差、及格率、优秀率等统计量，为了对这些统计量进行分析比较，我们采用模糊逐步聚类分析给出分类标准，由此即可得到两个专业每门课程学生分数的差异性。

首先作出相应的统计量值：

表1：

两专业高级语言程序设计分数统计量表

专业课程

统计量

平均分

标准差

及格率

优秀率

专业一

高级语言

69.99

13.89

96.26%

18.69%

专业二

高级语言

71.32

32.87

94.12%

22.22%

表2：

两专业离散数学分数统计量表

专业课程

统计量

平均分

标准差

及格率

优秀率

专业一

离散数学

66.04

14.33

90.65%

6.54%

专业二

离散数学

70.12

10.22

96.73%

9.15%

表3：

两专业数据结构分数统计量表

专业课程

统计量

平均分

标准差

及格率

优秀率

专业一

数据结构

70.85

11.31

96.26%

12.15%

专业二

数据结构

70.68

14.61

95.42%

14.38%

表4：

两专业数据库原理分数统计量表

专业课程

统计量

平均分

标准差

及格率

优秀率

专业一

数据库原理

75.15

12.17

97.2%

23.36%

专业二

数据库原理

75.09

14.04

94.12%

28.1%

然后根据上表中的平均值、标准差、及格率以及优秀率构造特性指标矩阵如下：

其中，行依次为专业一、专业二高级程序语言设计、离散数学、数据结构和数据库原理相应的统计量值。

数据规格化：

采用最大值规格化后得到：

最后再利用最大最小法构造模糊相似矩阵为：

为了给出聚类划分标准，我们采用最优模糊划分法。

利用其相关公式可得拉格朗日方程为：

【1式】

对上式分别关于变量

求偏导得：

【2式】

利用MATLAB对上式求解，最后可得评价标准集为：

再结合上述的相似矩阵可得聚类分析的布尔矩阵为：

分析该矩阵可得模糊聚类分类为：

即这两个专业的学生的各科分数中，只有高级程序语言差异性较明显，其他三门科目均没有明显差异。

5.2问题

（2）：

该题要分析两个专业学生的学习水平有无明显差异，由于学习水平要用成绩来衡量，所以要求出四门课程的总成绩。

首先构建一个层次分析模型来求出各科在总成绩中的权重，然后再利用单因素方差分析模型来判断总成绩是否显著相关，将专业看做对成绩的影响因素进行分析。

5.2.1层次分析模型：

图1总成绩的层次分析图

取

，利用MATLAB求得

的最大特征根和它对应的特征根向量（运行程序及结果见附件），分析结果可得：

，它所对应的特征根向量为：

。

由于对于成对比较矩阵A，一致性指标为：

（为A的最大特征根，n为矩阵A的阶数）

随机一致性指标为

，所以一致性比率为

。

验证：

此时有：

所以该矩阵合适，

可以作为各门成绩在总成绩中占的比重。

所以求得总成绩为：

【3式】

5.2.2单因素方差分析模型：

先用Excel在表格中根据上述模型计算出各专业的总成绩，然后在SPSS中打开数据管理窗口，定义变量名专业和总成绩，然后按顺序输入相应总成绩，专业依次定为数值1，2。

然后运行“分析->比较均值->单因素ANOVA”进行单因素方差分析,得到如下结果：

描述

总成绩

均值

标准差

标准误

均值的95%置信区间

极小值

极大值

下限

上限

1.00

107

129.9566

18.08553

1.74839

126.4902

133.4229

86.53

178.32

2.00

153

133.3999

18.08476

1.46207

130.5113

136.2885

81.30

176.61

总数

260

131.9829

18.12980

1.12436

129.7688

134.1969

81.30

178.32

ANOVA

总成绩

平方和

均方

显著性

组间

746.573

2.283

.132

组

84384.073

258

327.070

总数

85130.646

259

由上表分析可得：

显著性为

，即由方差分析得这两个专业学生的学习水平无明显差异。

5.3问题（3）：

为了分析高级语言程序设计和离散数学两门课程的优劣是否对数据结构和数据库原理两门课程有影响，我们不考虑专业的影响，仅从这四门课程成绩的相关性进行考虑，即高级语言、离散数学与数据结构成绩的相关性，高级语言、离散数学与数据库原理成绩的相关性。

直接利用SPSS软件中的回归分析进行求解。

5.3.1高级语言、离散数学与数据结构分数的相关性：

选择“分析—回归—线性”，将因变量“高级语言、离散数学”、“数据结构”分别移至对应的框中，在“方法”中选择“进入”把所有自变量放入回归模型，选择统计量中的“估计、模型拟合度、R方变化、描述性”四项，点击“选项”选择“使用F的概率“及“在等式中包含常量”，保存后运行，输出如下结果：

回归模型的拟合度

模型

R方

调整R方

标准估计的误差

更改统计量

R方更改

F更改

df1

df2

Sig.F更改

.521a

.272

.266

11.42173

.272

47.892

257

.000

a.预测变量:

（常量）,离散数学,高级语言。

对表中的数据分析可得：

R表示复相关系数，反应的是自变量与因变量之间的密切程度，R方表示复相关系数的平方，称为决定系数，这里R=0.512，说明数据结构的成绩与高级语言、离散数学的成绩有一定的关系。

方差分析

模型

平方和

均方

Sig.

回归

12495.569

6247.785

47.892

.000a

残差

33527.181

257

130.456

总计

46022.750

259

a.预测变量:

（常量）,离散数学,高级语言。

b.因变量:

数据结构

上表中p值小于0.05，因此该回归模型有显著的统计意义，即线性回归方程高度显著。