硕士论文质量评价问题.docx
《硕士论文质量评价问题.docx》由会员分享,可在线阅读,更多相关《硕士论文质量评价问题.docx(32页珍藏版)》请在冰豆网上搜索。
硕士论文质量评价问题
装订线
第九届西北工业大学数学建模竞赛暨
全国大学生数学建模竞赛选拔赛题目
A题
密封号
2011年5月3日
剪切线
密封号
2011年5月3日
理学院第116队
队员1
队员2
队员3
姓名
李腾
姬士昌
王佩东
班级
11091001
11091001
11091001
装订线
硕士论文质量评价问题
摘要
“硕士论文质量评价问题”数学建模的目的是通过建立合理的数学模型全面分析和评价我国硕士生的招生质量、论文质量、培养质量等。
该问题要求我们能够合理的分析利用数据,考虑多种影响因素,例如,时间、专业以及不同专家、院校对论文评分的影响。
我们基于统计学的各种模型,对于问题一、问题三、问题五我们设计了合适的模型并检验的方法解决,对问题二、问题四采用统计绘图的方法解决。
问题一:
读题我们认为应考虑开题报告各个指标对开题总体评价的影响,基于这种考虑,我们建立多元线性回归模型,使用了SPSS软件求出了各个指标对开题总评的回归系数,由回归系数得到每个指标对开题总评影响程度的相对大小,并用F值检验了回归方程的显著性。
问题二:
我们通过统计数据、绘制柱状图与折线图分析得出总体评价。
问题三:
考虑到选题开题与论文得分之间是单一自变量影响的情况,我们建立了用统计学中的一元线性回归模型求它们之间的相关性,并通过求出选题开题与论文得分间的相关系数,检验它们的相关性。
问题四:
我们通过统计数据、绘制柱状图等图形分析得出总体评价。
问题五:
认识到本题要求我们对两组结果进行比较分析,我们建立了F值检验法模型,比较两组数据之间是否存在显著性差异,从而得出在自己院校与其他院校对论文审评之间的差异情况。
关键字:
多元线性回归模型一元回归模型 F检验法相关系数SPSS
目录
一、问题重述………………………………………………………………………4
二、问题分析………………………………………………………………………5
三、模型的假设……………………………………………………………………6
四、符号说明………………………………………………………………………6
五、模型的建立与求解……………………………………………………………8
(一)问题一……………………………………………………………………8
(二)问题二…………………………………………………………………11
(三)问题三…………………………………………………………………17
(四)问题四…………………………………………………………………19
(五)问题五…………………………………………………………………22
六、模型的评价与应用…………………………………………………………23
七、参考文献……………………………………………………………………24
八、附件…………………………………………………………………………25
一.问题重述
我国自1980年建立新的学位制度以来,已初步形成了具有我国特色的研究生招生和培养模式,并且随着社会环境的变化和人才培养的不同要求适时作出调整。
如:
入学类型开始有了在职人员和非在职人员、定向培养和非定向培养、直博和提前攻博等类型;招生工作中的计划内定向培养意识逐渐淡化,出现了在职攻读学位等进校不离岗的招生形式等等。
然而,这种多样化的招生和培养方式,也使得研究生论文质量问题日益引起人们关注。
特别是近年来研究生招生规模的迅速扩张,以及研究生在国家发展与社会进步中发挥的越来越大作用,更使研究生论文质量问题成为人们关注的焦点。
如何建立合理的研究生论文质量评价体系,并通过量化的手段找出当前国家在研究生招生过程中存在的问题,进而调整招生政策,改革招生方式,真正吸收综合素质高和研究能力强的优秀学生进入研究生队伍,已成为保证、提高硕士研究生论文质量的第一大关口,是国家乃至个人都十分关注的一项课题。
为全面贯彻科学发展观,落实以质量为核心的发展要求,全面分析和评价我国硕士生质量,制定进一步提高硕士研究生教育质量的政策,需要对硕士生的招生质量、论文质量、培养质量等进行综合评价。
请根据这些信息分析解决以下问题。
(1)对2006,2007,2008年各年硕士生论文选题与开题进行总体评价。
包括各专业的评价和各年的总体评价。
(2)对2006,2007,2008年各年硕士论文评分的评价。
包括各专业与各年的总体评价。
(3)对各专业、各年硕士论文选题开题与论文得分之间的相关性进行分析,你从中得出什么结论?
(4)对2006,2007,2008年复审(毕业后的重新评阅)论文的评价。
包括各专业与各年的总体评价。
(5)对硕士毕业前后论文的评分结果进行分析,你得出什么样的评论。
说明你的观点与结论。
对此你有什么建议。
二.问题分析
本题主要是通过对2006、2007、2008年硕士论文的评阅信息的统计分析得出评价,进而对研究生的招生质量、论文质量、培养质量等进行综合评价。
(一)问题一的分析
在选题分析中,可以通过对数据的分类汇总,在在进行绘图处理,得出评价。
在开题报告的数据统计分析中,我们看到表二中是硕士论文开题的各个指标的评分,而第六项则是论文开题报告的总体评分。
根据实际情况我们认为总体评价与各个指标之间存在相关性,即总评得分可以有各个指标得分计算而来,研究这个问题可以得出各个指标对于总评的相对重要性,从而看出研究生各项素质的要求。
考虑以上因素我们认为可以建立多元线性回归模型Ⅰ,从而得出各个指标对论文开题报告总评的相对性影响,再建立F值检验模型Ⅱ,检验所得回归方程的显著性。
(二)问题二的分析
研究问题二可以从中看出各年、各专业研究生的论文质量。
问题二属于统计数学问题,分析附件二中数据可知,论文的分可由专家所给的各个指标的评分求和得出。
根据要求我们认为可以通过统计各年各专业各等级人数以及论文得分,进而绘制出各种直观形象的图形得出对各年硕士论文的总体评价‘
(三)问题三的分析
研究问题三我们可以看出硕士论文评分与选题、开题之间的关系。
问题三属于相关性分析的数学问题。
对于这类问题我们可以用回归分析法确定他们之间是否具有显著的相关性。
根据以上因素,我们可以首先建立一个一元回归模型Ⅰ,从而得出选题开题与论文得分之间的线性关系,,然后再建立一个相关系数检验模型检验他们之间的相关性是否显著,并绘制图形确定三年的线性关系是否具有一致性。
(四)问题四的分析
研究该问题可以了解2006、2007、2008年复审论文的评分结果,从中了解在其他院校的老师的评审下研究生的论文质量、培养质量。
考虑到附件二数据的巨大。
问题四属于统计学数学问题,我们认为应该统计数据,确定各年的硕士论文得分等级,统计各专业硕士论文的平均分,绘制图形得出评价。
(五)问题五的分析
问题五是对两个结果进行比较的问题。
研究这个问题,我们可以比较出自己院校和其他院校对硕士论文的评价结果,对改善硕士论文的评审具有重要意义。
问题五属于比较类的数学问题,我们可以建立显著性检验模型,用F检验法进行检验,从而比较出两个结果之间是否有显著性差异,根据结果再进行统计分析,得出结论。
三.模型假设
1.假设问题中所给的数据真实可靠
2.假设专家给的评分全都客观真实;
3.假设抽取的样本随机
四.符号说明
XT1:
论文难度评分
XT2:
论文工作量评分
XT3:
研究方案可行性评分
XT4:
研究生对文献资料和课题的了解程度
XT5:
研究生在论文开题报告中反映出的综合表达能力
XT6:
对论文开题报告的总评价
β1:
XT1的线性系数
β2:
XT2的线性系数
β3:
XT3的线性系数
β4:
XT4的线性系数
β5:
XT5的线性系数
β:
多元线性回归方程的常量
XT:
由问题一中得到的开题报告的总评的多元线性回归方程得分
A:
专家一对硕士论文的盲审结果,即综合评价
B:
专家二对硕士论文的盲审结果,即综合评价
x:
专家一与专家二对论文的盲审结果平均分
a:
一元线性回归方程的系数
b:
一元线性回归方程的常量
s:
标准方差
:
方差
F:
问题一中F检验法的F值
F1:
问题五中F检验法德F值
r:
相关系数
五.模型的建立与求解
(一)问题一
1对选题进行总评
(1)数据处理
对附件一所给的数据处理得到
选题的发表
年份
2006
2007
2008
得一分人数
49
42
43
得两分人数
69
78
96
得三分人数
259
374
319
得四分人数
0
0
0
表1
绘制饼状图得到
图1
图2
图3
(2)评价
由以上三个饼状图可知,得四分的比例为零,即没有人的论文选题意义不大。
同时也可以知道大多数研究生选题有实际意义和实用意义,这一定程度上反映了我们的研究生的论文质量,具有实际意义与实用意义。
2关于问题一开题报告的模型建立与求解
(1)模型Ⅰ多元线性回归模型
定义:
在实际问题中,一个变量往往受到多个变量的影响。
例如,家庭消费支出,除了受家庭可支配收入的影响外,还受诸如家庭所有的财富、物价水平、金融机构存款利息等多种因素的影响,表现在线性回归模型中的解释变量有多个。
这样的模型被称为多元线性回归模型。
该模型的一般表达式:
Yi=β0+β1X1i+β2X2i+…+βkXki+μii=1,2,…,n其中k为解释变量的数目,βj(j=1,2,…,k)称为回归系数。
(2)立模型并求解
根据实际情况,对论文开题报告的总体评价评分受论文难度评分、论文工作量、研究方案可行性、研究生对文献资料和课题的了解程度以及研究生在论文选题报告中反映出的综合表达能力得分的影响,论文开题报告的评分受多个因素的影响,故可以建立多元线性回归模型。
利用附件一中的数据,使用SPSS软件,分别将2006、2007和2008年的开题报告的各项指标评分与总评分输入,得到按年份次序输出以下结果(完整输出信息见附件二)
表2
表3
表4
根据得到的结果分别得到:
2006年多元线性回归方程:
XT6=0.046*XT1+0.102*XT2+0.265*XT3+0.257*XT4+0.321*XT5-0.118
2007年多元线性回归方程:
XT6=0.003*XT1+0.004*XT2+0.303*XT3+0.208*XT4+0.390*XT5+0.038
2008年多元线性回归方程:
XT6=0.021*XT1+0.069*XT2+0.241*XT3+0.191*XT4+0.442*XT5-0.023
2.模型ⅡF值检验模型
将2006、2007、2008年开题报告各指标得分与总评得分输入SPSS的到以下输出结果(按年份顺序):
表5
表6
表7
从中得出2006年的F=98.335,而P(F>5861.519)=0,故不管检验水平取α=0.05还是α=0.1,都说明回归显著;
同样,2007年F=138.598,2008年F=126.965,均有P(F>5861.519)=0,故不管检验水平取α=0.05还是α=0.1,都说明回归显著;
(3)误差分析
观察模型Ⅰ的输出结果,可以看出XT3、XT4、XT5的相对标准误差较小,也通过了T检验,而XT1、XT2的相对标准较大,也没有通过T检验,说明误差主要存在于XT1、XT2之中,但考虑到实际中专家会根据论文难度、论文工作量适当调整硕士论文总评,故回归模型中考虑所有指标的影响。
(4)对各年的硕士论文的总体评价
从多元回归方程中我们可以看出XT3、XT4、XT5相对于XT1、XT2的线性系数较大,说明研究方案的可行性、硕士生对文献资料和课题的了解程度已及硕士生在论文选题报告中反映出的表达能力对论文开题报告的影响明显高于论文难度、论文工作量的影响。
这也说明我们对研究生的培养要求注重于能力,注重于在不同场合的应变能力。
3对各专业开题报告的总体评价
(二)问题二
1.数据处理
第一位专家对硕士论文盲审综合评价为:
A=A1+A2+A3+A4+A5+A6+A7
第二位专家对硕士论文盲审的综合评价为:
B=B1+B2+B3+B4+B5+B6+B7
两位专家对硕士论文盲审的综合评价为:
x=1/2*(A+B)
按以上公式处理数据。
2.对2006年硕士论文的评价
对得到的综合评价进行汇总处理得到以下结果:
2006年盲审等级人数
等级
较差
一般
良好
优秀
特优
第一位专家
1
4
138
225
9
第二位专家
0
8
143
207
19
两位的平均分
表8
由以上数据可以看出在盲审各个等级的分布中,优秀和良好的人数是最多的,占总人数的95%左右。
其中,优秀是数据的主体反映,占总体的55%,由此可得,研究生论文质量侧重于优秀层次;同时,良好等级的研究生论文数量所占比例为40%左右,在主题中的重要程度仅次于优秀;而较差的论文几乎不存在,这也说明了研究生对毕业论文的重视程度;同样,特优论文的分布只占5%左右,这也说明大多数研究生对论文质量很重视的同时,做得最好的人数并不太多,极有可能是学习的方法不得效果,或者是存在方向性错误,同样有可能是不重视细节的规范要求。
这个问题需要我们认真反思,并对其进行深入探讨研究。
2.对2007年硕士论文的评价
对的得到数据进行汇总处理得到以下结果
图4
图5
由此得出对该年的总评价:
2007年盲审结果与2006年类似,均是以优秀居最,良好、优秀居多,特优与一般较少。
不过与2006年相比,没有特差的人数,可以认为通过率为100%,这就说明该年研究生的培养质量、论文质量、以及招生质量都所提高。
但特优论文的相对较少也向我们表明,我们的研究生培养力度还可以增加,研究生的质量还可以提高。
3.对2008年硕士论文的评价
对的得到数据进行汇总处理得到以下结果
图6
图7
由此得到对2008年的总评价:
相对于2006、2007年,2008年硕士论文依旧是以优秀、良好居多,但
较差人数为零,一般人数大大减少,特优人数也相对增加,这说明硕士论文的质量一直有所提高,研究生的能力也有增加,表明我们的硕士培养质量的稳步提升,用折线图更能形象的表达这些结论,折线图如下:
图8
图9
4.对各专业的总体评价
分析附件一中的数据可以看出,专业个数多,每个专业的数据众多,也如果一一分析,则过于冗杂繁琐,不能很好的从中分析出有用的数据,因此我们求出各专业的平均分(见附录一),从而从中分析各专业之间、各年同专业之间的关系,从而得出结论。
数据处理结果如下:
图10
图11
图12
图13
分析上述折线图可以看出各专业在2006、2007、2008年的平均分基本持平,这就说明各专业平均分基本不随时间而变化。
而在各专业中虽然各专业平均分不同,当大部分专业的平均分在一定范围内波动。
(三)问题三
1.数据处理
在问题一中,我们已求出论文的开题报告总评与开题报告各个指标之间的多元回归方程,我们以由多元回归方程得到的开题报告的得分为专家对开题报告的总评,由此求出开题报告与论文得分之间的相关性。
因为有两位专家给出盲审评分,这就不好判断开题报告与论文得分之间的关系,因此我们用两位专家所给评分的平均分作为硕士论文的得分。
2.问题二的模型
(1)模型Ⅰ一元回归模型
一元回归模型是用来回归分析的数学模型(含相关假设)成为回归模型,只含有一个变量的回归模型成为一元回归模型。
一元回归模型的一般表达式为:
y=ax+b,a是一元回归系数,b是常量。
其中:
a=
b=
(2)模型的建立与求解
因为该题是求论文选题开题与论文得分之间的相关性,这是一个自变量与一个因变量之间的相关性,因此可以通过构建一元回归方程来分析他们之间的相关性。
a.选题与论文得分的相关性
考虑到数据的巨大,我们用以上公式进行人工运算太过复杂,因此我们依然采用SPSS软件进行求解,将选题得分与论文得分输入SPSS,得到以下输出结果(按年份顺序,完整输出结果见附件三):
表9
表10
表11
有输出结果可知三个结果的sig值均不为零,t值也过小,即没有通过t检验,可认为选题得分与论文得分之间相关性不显著。
b.开题报告得分与论文得分之间的相关性
与选题得分一样,开题报告得分是否冗杂,故采用SPSS软件,输入数据得到以下输出结果:
表12
表13
表14
分析输出结果可知三组输出结果的sig值均为0,t的绝对值也足够大,即通过了t检验,故可认为开题报告得分与论文得分之间的相关性显著,并由β值均为负数可知它们呈负相关。
2006年开题报告与论文得分之间的一元回归方程为:
y=-2.475x+89.779
2007年开题报告与论文得分之间的一元回归方程为:
y=-4.226x+91.696
2008开题报告与论文得分之间的一元回归方程为:
y=-3.078x+90.511
(2)模型Ⅱ相关系数模型检验
实际中,当两个变量间不是严格的线性关系,数据的偏离比较严重时,我们也能得到一回归曲线,但这条回归曲线是否有意义,可用相关系数来检验。
相关系数的定义式为:
r=b
a.求出选题与论文得分的相关系数为:
2006年选题与论文得分的相关系数:
r=-0.11672
2007年选题与论文得分的相关系数:
r=-0.0653
2008年选题与论文得分的相关系数:
r=0.0397
查表可知三组相关系数的绝对值均小于临界值,故可认为选题得分与论文得分的相关性不显著,与模型Ⅰ结论相同。
b.求出开题报告与论文得分的相关系数为:
2006年开题报告与论文得分间的相关系数:
r=-0.3411
2007年开题报告与论文得分间的相关系数:
r=-0.2994
2008年开题报告与论文得分间的相关系数:
r=-0.2522
查表可知三组相关系数的绝对值均大于临界值,故可认为选题得分与文得分的相关性显著,与模型Ⅰ结论相同。
(3)结论
选题得分与论文得分的相关性不显著;
开题报告得分与论文得分的相关性显著。
(四)问题四
(1)复审各专业总评
1.数据处理
各专业数据众多,专业也众多,因此采取求出各专业的平均分进行分析,从而得出跟专业的总评。
求出后绘制了柱状图,如下:
图14
2.总评
从上面柱状图可以看出复审的得分与专业之间并不存在联系,各专业的平均分大致相等。
(2)复审各年的总体评价
1.数据处理
处理附件二中的数据,我们可以求出各年的论文等级的人数分布,并由此绘制柱状图,如下:
图15
图16
图17
图18
2.总评
观察以上四个柱状图,可以看出复审结果中以良好为最,良好、优秀居多,一般与较差以及特优人数较少。
(五)问题五
1.关于问题五的模型建立与求解
(1)F值检验模型
F检验法是通过两组数据的方差,以确定他们之间是否有显著性差异的方法。
统计F的定义为:
两组数据的方差的比值,分子为大的方差,分母为小的方差,即:
F值为F=
而方差计算公式为s=
,
s为标准偏差,计算公式为s=
(2)模型的建立与求解
问题五要求分析硕士毕业前后论文的评分结果,这是比较类的问题,故我们可以建立F值检验模型,比较之间的差异。
当F值大于临界值是,认为这两组数据存在显著性差异,反之则不存在显著性差异。
利用公式求出:
2006年硕士论文盲审评分的方差为:
=22.65251
2007年硕士论文盲审评分的方差为:
=17.11155
2008年硕士论文盲审评分的方差为:
=14.50776
2006年硕士论文复审评分的方差为:
=40.19838
2007年硕士论文复审评分的方差为:
=31.60643
2008年硕士论文复审评分的方差为:
=52.04711
则2006年两组数据间的F值为:
F=1.77457
2007年两组数据间的F值为:
F=1.84708
2008年两组数据间的F值为:
F=3.58754
查表可得当样本很大时,F值为1.00
分析以上所得结果的F值可得:
2006、2007、2008年均有:
F>1.00
故可认为硕士毕业前后论文的评分结果存在显著性差异。
(3)结论
硕士毕业前后论文的评分结果存在显著性差异,说明在自己院校内对论文的评价结果与在其他院校中的评价结果有所不同。
在自己院校内对硕士论文进行评分,虽然是盲审,但总是会存在一些主观因素,而复审是在其他院校内的评审结果,评审时没有主观因素,所给的评分相对客观。
各高校也从复审结果中更加清晰地了解了自己所培养研究生的质量,也会更加客观、深刻的对自己研究生的招生质量、论文质量已及培养质量作出相对客观的评价。
当然,另一方面,由于是其他院校给予硕士论文的平均,而两所院校之中必然存在各种差异,这也会影响到硕士论文的得分,很可能因为两所院校的侧重点、方向等不同的地方而影响到论文的分数。
因此,我们建议应该综合盲审与复审结果给出硕士论文的正确得分,排除各种主观因素,客观的对硕士生的招生质量、论文质量、培养质量等进行综合评价,进一步制定提高研究生教育质量的政策。
六、模型的评价与应用
优点
此模型由于其简单易懂且便于操作的线性关系而通俗可行,并且是数据的利用达到最大化,在最大程度上减小了偶然性对结果的影响,使实际问题更加精确。
同时,该模型对数据中的整体与局部之间的关系定义了一个清晰明朗的概念,在大规模处理数据时尤显重要,具有一定的普遍性。
缺点
该模型在提出时并未将影响整体的因素考虑的十分严密周详。
例如,传统观念的影响及新时代人们对新概念的理解程度等,这将会使得模型在实际应用中稍减精确性。
应用
本模型在实际应用中不仅可以适用于大规模处理数据,在统计学以及国民经济学中都有很广泛的可应用性,也可用于对某项宏观调控政策的合理性反馈便于最佳决策的推断和参考。
,
参考文献
[1]武汉大学,分析化学,北京,高等教育出版社,2010年1月
[2]肖华勇,实用数学建模与软件应用,,西安,西北工业大学出版社,2010年8月
[3]蒋启源,谢金星,叶俊,数学模型,北京,高等教育出版社,2007年12月
[4]
[5]
附件一
表15
附件二
图19 2006年开题各指标与总评回归关系输出结果
图20 2007年开题各指标与总评回归关系输出结果
图21 2008年开题各指标与总评回归关系输出结果
附件三
图22
图23
图24