高教社杯全国大学生数学建模竞赛题目.docx

上传人:b****8 文档编号:9582376 上传时间:2023-02-05 格式:DOCX 页数:33 大小:360.81KB
下载 相关 举报
高教社杯全国大学生数学建模竞赛题目.docx_第1页
第1页 / 共33页
高教社杯全国大学生数学建模竞赛题目.docx_第2页
第2页 / 共33页
高教社杯全国大学生数学建模竞赛题目.docx_第3页
第3页 / 共33页
高教社杯全国大学生数学建模竞赛题目.docx_第4页
第4页 / 共33页
高教社杯全国大学生数学建模竞赛题目.docx_第5页
第5页 / 共33页
点击查看更多>>
下载资源
资源描述

高教社杯全国大学生数学建模竞赛题目.docx

《高教社杯全国大学生数学建模竞赛题目.docx》由会员分享,可在线阅读,更多相关《高教社杯全国大学生数学建模竞赛题目.docx(33页珍藏版)》请在冰豆网上搜索。

高教社杯全国大学生数学建模竞赛题目.docx

高教社杯全国大学生数学建模竞赛题目

 

2015江西财经大学数学建模竞赛

(B题)

关于某竞赛网评结果的建模与分析

 

参赛队员:

李紫薇、孙雪、黄爱珺

参赛队编号:

2015012

 

2015年5月22日~5月27日

 

2015江西财经大学数学建模竞赛

承诺书

我们仔细阅读了江西财经大学数学建模竞赛的竞赛章程。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们参赛选择的题号是(从A/B/C中选择一项填写):

B

我们的参赛队编号为201512

参赛队员(打印并签名):

队员1.姓名李紫薇专业班级信息管理与信息系统131

队员2.姓名孙雪专业班级信息与计算科学

队员3.姓名黄爱珺专业班级信息与计算科学

日期:

2015年5月27日

 

2015江西财经大学数学建模竞赛

编号和阅卷专用页

参赛队编号:

参赛队员填写

参赛队

员姓名

所有数学类与计算机类课程成绩

(意愿参加全国竞赛者填写)

是否选修建模课程

是否愿参加全国竞赛

在校获

奖项目

李紫薇

微积分Ⅰ:

80,微积分Ⅱ:

81,线性代数:

98,计量经济学:

98;VB:

89,C语言:

83,C语言实训:

96,C++:

89,数据结构:

93(已过计算机二级)

江西省大学生计算机作品赛二等奖、

三好学生、

数学建模知识竞赛优秀奖、现参与“视频追踪系统与目标检测”课题研究

孙雪

数学分析I:

73,数学分析II:

66,数学分析III:

68;

线性代数I:

72,概率统计I:

94;

计算机科学导论:

71,计算机应用技术:

84,程序设计基础:

76,程序设计基础课程设计:

92,数据结构与算法:

70,

面向对象程序设计(双语):

80

“PPT创意设计大赛”一等奖;“计算机知识竞赛”二等奖;“优秀PC卫士”称号

黄爱珺

数学分析I:

83,数学分析II:

63,数学分析III:

63;

计算机导论:

60,计算机应用:

84,程序设计基础课程设计:

89,

程序设计基础:

82,线性代数:

69,

概率统计:

90,数据结构与算法:

73,面向对象程序设计:

83

阅卷填写,参赛者不得填写

评分(百分制)

评阅人

最终得分

小组评价负责人

阅卷

专家

评语

 

备注

1、是否选修数学建模:

指本学期是否选修了数学建模课程

2、是否有意愿参加全国竞赛:

指参加今年的全国大学生数学建模竞赛,一经选定,不得退赛,否则将建议学生所在学院给予处分。

培训时间:

2013年8月5日开始。

江西财经大学数学建模竞赛组委会

2015年5月15

关于某竞赛网评结果的建模与分析

摘要

1、问题1中分别建立了OLS模型[1]和Pearson相关系数模型,通过OLS模型Yi=

0+

1Xi+ei及F检验显著性分析和Pearson相关性系数ρx,y=

和显著性分析得出,A题相关性较差,B、C、D、E均具有较强的相关性;

2、问题二中通过评委学术水平,是否了解评卷规则、打分细则及每项的得分范围等,评委评分是否独立,评分的科学性、合理性、公正性等方面对评委基本素质的指标体系进行分析;

3、问题三按照多属性群决策理论[2],用“分值偏差”δi=

来描述评委Ei与其他评委打分的偏差程度。

并建立了评阅水平系数模型Qi=1-|δi|

,通过计算评阅水平系数并且绘制相对应的带正态分布曲线的频率直方图得出评委符合评委基本素质的结论;

4、问题4通过P-P图分析出各题标准平均成绩之间呈现正态分布规律,进而进行F检验和t检验,通过公式

,计算得出F12=1.74,F13=1.0F14=1.19,F15=1.17;F23=1.74,F24=1.46,F25=1.48;F34=1.19,F35=1.17;F45=1.01;t1=0.12,t2=-1.4,t3=1.49,t4=0.71,t5=0.09,将计算出的F值、t值与临界的F、t值相比较,得出在一般容忍范围内B与其他题存在一定的差异,而A、C、D、E之间不存在显著差异的结论。

5、由于每篇论文在网评阶段的评委人数多于集中评审阶段,网评成绩较之于集中评审更加客观。

然而这并不能否定网评阶段有一定的偶然性,所以设计的参考方案应尽可能消除减弱而不是放大偶然因素的影响,因此,设计的方案应减小网评成绩对最终成绩的影响。

我们设计出集中评审成绩计算公式:

W=4*W1/n*Ui+W2,在一定程度上削弱了网评成绩的权重,使得最终成绩更加客观真实。

关键字:

OLS模型、Pearson相关系数模型、多属性群决策理论、分值偏差、评阅水平系数、P-P图

 

一、问题重述

竞赛是选拔人才,培养人才的一种方式,随着时代的发展,竞赛的评阅方式也越来越多,某竞赛的评阅过程分两阶段进行,分别称为网评阶段与集中评审阶段。

在某竞赛中,网评阶段中的论文随机分配给各评委且一篇论文被随机分配给4个评委,每位评委每位评委以“百分制”记分,通过附录中yk=

(其中xk为第k份论文的原始分k,

为某一评委所评阅的所有论文的平均分为

,σ为其均方差,即标准差)标准分计算公式,将评委的“原始分”转换成“标准分”,按照标准分总分排序,前55%的论文进入集中评审。

集中评审阶段每份论文由三位评委按“百分制”独立评审,所有评委评审结束后,换算成标准分,然后将每份论文的三个标准分与网评中该论文的平均标准分一起求平均分,即为该论文的最终成绩。

要求根据附件所给数据完成以下问题的建模:

1、根据附件中的评审结果,求出网评成绩与最终成绩的相关性,给出结论,并对网评结果作出评价;

2、从不同角度出发,提出合理的度量评委基本素质的指标体系;

3、建立评价评委基本素质的数学模型,运用于附件中的评审数据,给出结论;

4、分析附件中ABCDE题的评委的整体表现之间是否存在显著差异,若存在,分析出现差异的可能原因;

5、分析将网评成绩加入总成绩的利弊,对如何更有效地利用网评成绩给出建模结论。

二、问题分析

对于问题1,为求的标准成绩与最终成绩的相关性,可以用spss中的Pearson系数及显著性分析来分析其皮尔逊相关系数,或者是通过计量经济学中的一元线性回归模型的建立及其显著性检验来判断一元线性回归方程是否成立,从而判断最终成绩与标准成绩之间的相关性;

对于问题2,为分析评价评委基本素质的指标体系,我们可以从评委学术水平,是否了解评卷规则、打分细则及每项的得分范围等,评委评分是否独立,评分的科学性、合理性、公正性等方面进行分析;

对于问题3,可以通过建立评委的评阅水平系数来分析评价评委基本素质;

对于问题4,通过P-P图分析各评委评分是否服从正态分布,然后分别用F检验,t检验来进行检验,得出差异性情况;

对于问题5,由于每篇论文在网评阶段的评委人数多于集中评审阶段,网评成绩较之于集中评审更加客观。

然而这并不能否定网评阶段有一定的偶然性,所以设计的参考方案应尽可能消除减弱而不是放大偶然因素的影响。

故可以设置权重网评阶段Ui因子以及集中评审阶段成绩与网评成绩相关公式来减小偶然因素的影响。

三、模型假设

1、假设评委的经验和知识背景都足够的丰富,评分具有权威性,避免造成评阅的明显的不公平性;

2、假设每位评委在评卷前应统一进行相关培训,了解评卷规则、打分细则及每项的得分范围等;

3、假设各评审老师在评审过程中互不影响且在评卷过程中不会交流讨论评卷信息,评审结果彼此独立;

4、假设各评审老师评阅每道题目状态均衡,不带有任何主观色彩及倾向性;

5、假设在评标过程中评委的评分具有科学性、合理性和公正性;

四、符号说明

Nj

第j个评委评阅的论文总数

di(Aj)

评委Ei对第j篇论文的打分

D(Aj)

第di(Aj)篇论文的最终成绩

Δi

分值偏差

Qi

评委Ei的评阅水平系数

第i个样本方差

第i个样本测定次数

Ui

网评成绩所占的权重因子

W1

网评阶段得分

W2

集中评审阶段得分

五、模型的建立与求解

5.1问题一

5.1.1相关关系

定义1[3]相关关系,是指两个以上变量的样本观测值序列之间表现出来的随机数学关系,用相关系数来衡量。

定理1如果两个以上变量的样本观测值序列之间的相关系数的绝对值为1,则两者之间具有完全相关性(完全正相关或完全负相关);

定理2如果相关关系的绝对值为0或接近于0,则两者之间不具有相关性。

5.1.2普通最小二乘法模型(OLS模型)

为揭示被解释变量与其他多个解释变量之间的关系。

则可建立最小二乘法相关性检验模型:

5.1.2.1定义样本回归函数:

i=f(Xi)=

0+

1Xi。

其中,

i表示总体条件均值E(Y|Xi)的一个估计值,读作“Y-帽”。

0=β0的估计量,

1=β1的估计量。

样本回归函数也可以表示为如下的随机形式,即

Yi=

0+

1Xi+ei

ei为(样本)残差(或剩余项)(Residual),可将其认为是随机干扰项的一个估计量。

5.1.2.2最小二乘法(OLS)模型建立

为求得网评成绩与最终成绩的相关性,根据附件中所给标准分转换公式,用excel将A、B、C、D、E题中的网评成绩转换成标准成绩,再将附件中的的最终成绩中的一等奖、二等奖、三等奖、不获奖分别用“3”、“2”、“1”、“0”进行量化。

根据5.1.2.1定义建立OLS模型:

Yi=

0+

1Xi+ei

其中ei为(样本)残差(或剩余项)(Residual)。

线性回归方程确定后的任务是利用已经收集到的样本数据,根据一定的统计拟合准则,对方程中的各参数进行估计。

普通最小二乘就是一种最为常见的统计拟合准则。

最小二乘法将偏差距离定义为离差平方和,即

Q=∑(Yi-

i)2=∑(Yi-β0-β1Xi)2

通过求Q最小,即确定

0、

1的估计值,此处通过eviews对

0、

1的值进行计算,计算结果如下图1-图5所示,分别为A、B、C、D、E五题的回归结果分析:

图1A题回归结果分析图2B题回归结果分析

图3C题回归结果分析图4D题回归结果分析

图5E题回归结果分析

由上述图1-图5可知A、B、C、D、E五题的回归方程分别如下所示:

A:

y=-0.000327x+1.399376

(0.010472)(0.625564)

B:

y=0.098286x-4.951620

(0.023908)(1.699037)

C:

y=0.101367x-5.376175

(0.042531)(2.898878)

D:

y=0.168467x-9.558442

(0.011804)(0.789299)

E:

y=0.084881x-4.066960

(0.015155)(1.052032)

5.1.2.3回归方程的显著性检验(F检验)

一般地,回归方程的假设检验包括两个方面:

一个是对模型的检验,即检验自变量与因变量之间的关系能否用一个线性模型来表示,这是由F检验来完成的;另一个检验是关于回归参数的检验,即当模型检验通过后,还要具体检验每一个自变量对因变量的影响程度是否显著而多元线性回归方程显著性检验的零假设是各个偏回归系数同时为零,检验采用F统计量,其数学定义为:

即平均的SSA/平均的SSE,F统计量服从(p,n-p-1)个自由度的F分布。

SPSS将会自动计算检验统计量的观测值以及对应的概率p值,如果p值小于给定的显著性水平α,则应拒绝零假设,认为y与x的全体的线性关系显著。

针对图1-图5F检验值,给定显著性水平α=0.05,在F分布表中查出自由度为3和27的临界值Fα(3,27)=2.96,则F1=0.000973Fα(3,27)=2.96,F3=5.680531>Fα(3,27)=2.96,F4=203.7077>Fα(3,27)=2.96,F5=27.94572>Fα(3,27)=2.96,显著性检验通过,原假设成立,即B、C、D、E题对应的线性回归方程存在,即B、C、D、E题标准平均分与最终成绩之间存在较强相关性。

5.1.3皮尔逊相关性检验模型

5.1.3.1定义2皮尔逊相关也称为积差相关(或积矩相关)是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法。

假设有两个变量X、Y,那么两变量间的皮尔逊相关系数可通过以下公式计算:

公式一:

ρx,y=

=

=

公式二:

ρx,y=

公式三:

ρx,y=

公式四:

ρx,y=

以上列出的四个公式等价,其中E是数学期望,cov表示协方差,N表示变量取值的个数。

5.1.3.2Pearson(皮尔逊)相关系数模型的建立

根据定义2公式3可得,皮尔逊相关系数

其中X为每个人的网评标准成绩,

为网评标准平均成绩,Y为每个人经量化的最终成绩,

为最终平均成绩,利用SPSS对处理过的A、B、C、D、E题数据进行皮尔逊相关性检验,可得相关性分析如下表1-表5:

相关性

y1

x1

y1

Pearson相关性

1

.055

显著性(双侧)

.299

N

355

355

x1

Pearson相关性

.055

1

显著性(双侧)

.299

N

355

355

表1A题皮尔逊相关性分析

相关性

y2

x2

y2

Pearson相关性

1

.689**

显著性(双侧)

.000

N

1366

1366

x2

Pearson相关性

.689**

1

显著性(双侧)

.000

N

1366

1366

**.在.01水平(双侧)上显著相关。

表2B题皮尔逊相关性分析

相关性

y3

x3

y3

Pearson相关性

1

.606**

显著性(双侧)

.000

N

488

488

x3

Pearson相关性

.606**

1

显著性(双侧)

.000

N

488

488

**.在.01水平(双侧)上显著相关。

表3C题皮尔逊相关性分析

相关性

y4

x4

y4

Pearson相关性

1

.746**

显著性(双侧)

.000

N

1709

1709

x4

Pearson相关性

.746**

1

显著性(双侧)

.000

N

1709

1709

**.在.01水平(双侧)上显著相关。

表4D题皮尔逊相关性分析

相关性

y5

x5

y5

Pearson相关性

1

.657**

显著性(双侧)

.000

N

958

958

x5

Pearson相关性

.657**

1

显著性(双侧)

.000

N

958

958

**.在.01水平(双侧)上显著相关。

表5E题皮尔逊相关性分析

由上述系列表格的皮尔逊相关系数及显著性分析值,x1与y1相关性很差,即A题数据的标准平均成绩与最终成绩的相关性很差;而x2与y2、x3与y3、x4与y4、x5与y5,即B、C、D、E题标准平均成绩与最终成绩相关性显著。

5.2问题二

5.2.1评委基本素质指标体系

1、每个评委须有可靠且相当的学术水平,以保证评分的权威性,从而在一定程度上保证了阅卷的公平性;

2、每位评委在评卷前应统一进行相关培训,了解评卷规则、打分细则及每项的得分范围等,以便于在评阅时有相近评判方法,确定得分体现了评分的合理性;

3、各评审老师在评审过程中互不影响、每个评委在评卷过程中不会交流讨论评卷信息,评审结果彼此独立;且各评审老师评阅每道题目状态均衡,不带有任何倾向性体现了评委评分的公正性;

4、在评标过程中评委评分的科学性、合理性和公正性反映了评委的综合素质,与评标结果的科学性、合理性和公正性息息相关。

5、每组评委的打分不受论文内容不同的影响,即各评分数据间独立;

6、注意到不同的题目的难度不同,在评阅时引起的评委之间的分歧也不同。

从题目均值反映出的差异来看均值小的题目可以认为是难度较大,相反均值大的题目难度较小;具体来说D题难度较大而B题难度较从目的方差反映出的差异来看,方差较大的题目表明评委在评阅时产生的分歧比较大,说明该题的灵活性较大;具体来说C题的灵活性较大,其余题目基本相当

5.3问题三

5.3.1评委评阅水平系数模型的建立

设评委Ei评阅论文数为N,记di(Aj)为评委Ei对第j篇论文的打分,D(Aj)为该篇论文的最终成绩,则该评委对n篇论文的评价结果矩阵为

d(A)=(d(A1),d(A2),……,d(An))

论文最终成绩矩阵为

D(A)=(D(A1),D(A2),……,D(An))

按照多属性群决策理论,我们用“分值偏差”来描述评委Ei与其他评委打分的偏差程度。

“分值偏差”为

δi=

则评委Ei的评阅水平系数为

Qi=1-|δi|

Q反映评委的公正性以及评阅水平,Q越高说明该评为的评阅水平越高。

5.3.2模型求解

通过excel表格对评委的评阅水平系数进行求解,得到A题评委评委水平系数图下表6所示(B、C、D、E题评委评阅水平系数如附件所示)

评委

评阅水平系数

评委

评阅水平系数

专家A01

0.51

专家A08

0.74

专家A02

0.91

专家A09

0.69

专家A03

0.02

专家A10

0.80

专家A04

0.96

专家A11

0.52

专家A05

0.93

专家A12

0.03

专家A06

0.46

专家A13

0.67

专家A07

0.82

专家A14

0.40

表6A题评委评阅水平系数

由上表可知A题评委评阅水平系数集中在范围内,为了直观的了解Q,根据以上数据绘制评委评阅水平系数概率分布直方图,如下图6-图10所示:

图6A题评委评阅水平系数概率分布直方图图7B题评委评阅水平系数概率分布直方图

图8C题评委评阅水平系数概率分布直方图图9D题评委评阅水平系数概率分布直方图

图10E题评委评阅水平系数概率分布直方图

通过以上图表可得出结论:

虽然不同评委、评阅不同的论文,但大多数评委的评阅水平处于同一水平,且近似满足正态分布,由此说明了评阅的公正性,即评委基本素质相当。

5.4问题四

5.4.1显著差异检验模型

5.4.1.1各论文样本评分数据概率分布的确定

评阅水平系数概率分布直方图在问题3中已经给出,由问题三的结论知A、B、C、D、E各评委的评阅水平呈正态分布,用spss对A、B、C、D、E五题数据做P-P图,得到分析结果如下表7所示:

估计的分布参数

AS

BS

CS

DS

ES

正态分布

位置

60.3097

59.6552

60.3097

59.9997

59.9017

标度

6.39220

8.42918

6.39220

6.97801

6.92646

个案未进行加权。

表7A、B、C、D、E题估计的分布参数

表中位置、标度分别代表A、B、C、D、E每个人的标准平均分的平均数和标准差,通过上表中数据分析可知,A、B、C、D、E五题的总体标准平均分和标准差都非常接近,平均分均在60分左右,标准差出B题波动性大一点之外,均为6.5左右,通过如下图11-图15P-P图所示:

图11A题评委评阅水平系数概率分布直方图图12B题评委评阅水平系数概率分布直方图

图13C题评委评阅水平系数概率分布直方图图14D题评委评阅水平系数概率分布直方图

图15E题评委评阅水平系数概率分布直方图

又上述系列图可看出,A、B、C、D、E的变化趋势及范围几乎相同且其正态P-P图均趋近于正态分布图线,为了进一步说明评委评分的科学性,检查不同题目评委给出的评分是否有显著差异,即对数据进行显著性检验。

5.4.1.2F检验模型(方差齐性检验模型)

下面用F-检验,验证各不同题目得分方差有无差异,运用excel对A、B、C、D四组的论文的总分进行F-检验。

F-检验法步骤如下:

F=(Si*Si)/(Sj*Sj)(i≠j)

其中,Si为第i题的标准差,Sj为第j题的标准差(且Si的值大于Sj的值)

查F分布表当计算所得的F值大于F分布表中的相应显著水平α和自由度f1,f2的临界值Fα(f1,f2),即F大于Fα(f1,f2)时,则两组方差之间方差之间有显著性差异;当F小于Fα(f1,f2)时,则两组无显著性差异。

(其中f1,f2的取值取决有个人容忍错误率),一般而言,α=0.05,f2=8,f1=2,此时r=0.707

由计算可得

F12=1.74,F13=1.00,F14=1.19,F15=1.17;

F23=1.74,F24=1.46,F25=1.48;

F34=1.19,F35=1.17;

F45=1.01

由于F12,F13,F14,F15,F23,F24,F25,F34,F35,F45均大于0.707,故存在较大差异性

5.4.1.3t检验模型

选定所用的检验统计量,当检验样本均值X与总体均值u是否存在显著差异时,使用统计量,一般而言。

式中s--标准差。

当检验两个平均值之间是否存在显著性差异时,使用统计量

;

其中s2为合并标准差,按下试计算

式中

--第i个样本方差

--第i个样本的测定次数

计算统计量,如果由样本值计算的统计量大于t分布表中相对应显著性a和相对应自由度f下的临界值ta,f则表明被检验的均值由显著性的差异;反之差异不显著。

应用t检验时,要求被检验的两组数据具有相同或相近的方差,因此,在进行t检验之前必须进行f检验,只有在两方差一致性的前提下才能进行t检验

通过计算,可得:

u=59.88,x1=59.91,x2=59.56,x3=60.31,x4=60.00,x5=59.90

s1=6.39,s2=8.42,s=6.39,s4=6.98,s5=6.93

由于5组方差很接近,故继续进行t检验:

t1=0.12,t2=-1.4,t3=1.49,t4=0.71,t5=0.09

一般而言取α=0.01,n=119,此时t=2.326,

由于t1,t2,t3,t4,t5均小于t=2.236,故A、B、C、D、E之间不存在显著差异。

综合F检验和t检验的结果可以看出:

在一般性的容忍度范围内,B与其他题存在一定的差异,而A、C、D、E之间不存在显著差异。

5.5问题五

5.5.1网评成绩计入总成绩的利弊分析

利:

a.网评过程中各评委打分时彼此相互独立,互

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1