数学建模获奖论文.docx

上传人:b****3 文档编号:4622567 上传时间:2022-12-07 格式:DOCX 页数:31 大小:501.16KB
下载 相关 举报
数学建模获奖论文.docx_第1页
第1页 / 共31页
数学建模获奖论文.docx_第2页
第2页 / 共31页
数学建模获奖论文.docx_第3页
第3页 / 共31页
数学建模获奖论文.docx_第4页
第4页 / 共31页
数学建模获奖论文.docx_第5页
第5页 / 共31页
点击查看更多>>
下载资源
资源描述

数学建模获奖论文.docx

《数学建模获奖论文.docx》由会员分享,可在线阅读,更多相关《数学建模获奖论文.docx(31页珍藏版)》请在冰豆网上搜索。

数学建模获奖论文.docx

数学建模获奖论文

2012高教社杯全国大学生数学建模竞赛

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写):

A

我们的参赛报名号为(如果赛区设置报名号的话):

所属学校(请填写完整的全名):

参赛队员(打印并签名):

1.

2.

3.

指导教师或指导教师组负责人(打印并签名):

日期:

年月日

赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛

编号专用页

 

赛区评阅编号(由赛区组委会评阅前进行编号):

 

赛区评阅记录(可供赛区评阅时使用):

 

 

全国统一编号(由赛区组委会送交全国前编号):

 

全国评阅编号(由全国组委会评阅前进行编号):

 

基于统计分析法对葡萄酒质量评价模型

摘要

本文主要针对葡萄酒的评价问题,利用信息统计方法建立了葡萄酒评价的数学模型。

首先我们对葡萄酒品尝评分以及葡萄和葡萄酒的理化指标进行预处理,主要是修改异常数据和用Matlab软件做正态性检验。

然后针对第一问,属于分析显著性差异问题,又由于两组评价得分均值大体满足正态分布,我们可以采用方差齐性检验即F检验法对两组评分值进行比较,最终得到对于第一组评酒员得到的结果没有显著性差异,而第二组评酒员得到的结果具有显著性的差异。

进而通过计算出每一组评酒员中的每一种葡萄酒样品的方差并画出其离散图,通过图形的离散程度判断出可信程度,得到第二组评酒员得到的数据更可靠。

针对第二问,首先求出十位评酒员在对葡萄酒的平均综合打分,由此把红白葡萄酒分为五级。

再通过主成份分析法分析出酿酒葡萄载荷较大的理化指标。

对这些载荷较大的理化指标进行聚类分析,把量酒葡萄分为五类。

因为葡萄酒的质量受量酒葡萄质量的影响,所以根据葡萄酒的质量分级进行综合分析对分类好量酒葡萄分级。

对于第三问,根据题目中给出的葡萄酒的理化指标运用主成分析法提取出影响葡萄酒质量的主要因子,再对酿酒葡萄与葡萄酒显著相关的主要因子一对一进行线性拟合并用回归分析进行检验。

从得出各主要因子二者之间的关系之后我们用线性拟合以及回归分析进行验证分析出它们总体上都是一次线性相关的,从而得出酿酒葡萄与葡萄酒的理化指标之间总体上是服从一次线性相关的。

对于问题四,通过问题3我们分析出葡萄酒和葡萄的理化指标具有一致性,我们可以对显著性相关的理化指标进行主成分分析,提取主因子,建立相关性分析对多个影响因子进行深入分析,即通径分析法。

通过通径相关分析表明,单宁和总酚与葡萄质量的相关系数和直接通径系数均排在前两位,表明这两种质量指标与葡萄酒质量起着极其重要的作用。

 

关键词:

F检验主成分分析法聚类分析回归分析线性拟合通径分析

一、问题的提出

1、背景知识

葡萄酒是国内外受欢迎的一种饮料酒,其工艺精良,风味独特。

为了准确合理对葡萄酒进行评价,通过聘请一批有资质的评酒员对葡萄酒质量进行品评,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

因此研究葡萄酒和普通的相关评价体系至关重要。

2、相关数据

1、葡萄酒品尝评分表(见附录表1)

2、葡萄和葡萄酒的理化指标(见附录表2)

3、葡萄和葡萄酒的芳香物质(见附录表3)

3、要解决的问题

1、问题一:

已知某一年份一些葡萄酒的评价结果,分析两组评酒员的评价结果有无显著性差异,判断出哪一组结果更可信。

2、问题二:

根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3、问题三:

分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4、问题四:

分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

二、模型的假设

1.假设题目所给的数据真实可靠。

2.假设各种指标都是正常的,不存在人为操作。

3.假设酿酒方式和过程对葡萄酒的质量无影响。

4假设各评酒员之间的评分都是相互独立的,他们之间没有影响。

5、各评酒员的评分满足正态分布。

三、符号说明

F-----F检验的F分布值

--判断矩阵A的特征根

----第

种样品葡萄第

个指标的值

---为第

个指标的样本均值

-----为第

个指标样本标准差

R-----相关系数矩阵

----第

种样品红葡萄酒的品尝平均得分

----第

种样品白葡萄酒的品尝平均得分

---第

样品红葡萄酒品尝得分的方差

---第

样品白葡萄酒品尝得分的方差

---第

样品红葡萄第

个品酒员品尝酒得分

---第

样品白葡萄第

个品酒员品尝酒得分

---第一组红葡萄酒样品方差的平均值

---第二组红葡萄酒样品方差的平均值

四、模型的建立和求解

4.1问题一模型建立与求解

问题一主要研究两组评酒员对葡萄酒的评价结果的差异性并确定哪组结果的可信度高,首先通过系统的分析葡萄酒品尝评分表时发现第一组白葡萄酒样品3中品酒员7的评分明显出现误差,因此对此评分给予舍去。

然后通过计算两组评酒员分别对每一种葡萄酒的得分,计算每一组评酒员对每种葡萄酒样品的平均得分,再假设各评酒员的得分满足正态分布的前提下,利用F检验来比较两组评酒员对评价结果的差异性,进一步通过每种葡萄酒样本的方差来确定两组评酒员中可信度高的的情况。

根据附件一的评分表,用excel表格计算出每一种葡萄酒样品的平均得分(如图1、图2)。

图1:

红葡萄酒样本品尝得分均值

酒样品

第一组均值

第二组均值

酒样品

第一组均值

第二组均值

酒样品

第一组均值

第二组均值

1

62.7

68.1

10

74.2

68.5

19

78.6

72.6

2

80.3

78.2

11

72.2

61.6

20

78.6

75.8

3

80.4

74.6

12

68.6

68.3

21

77.1

72.2

4

68.6

71.2

13

74.6

68.8

22

77.2

71.6

5

73.3

72.1

14

73

72.6

23

85.6

77.1

6

72.2

66.3

15

58.7

65.7

24

78

71.5

7

71.5

65.3

16

74.9

69.9

25

69.2

68.2

8

72.3

66

17

79.3

74.5

26

73.8

72

9

81.5

74

18

59.9

65.4

27

73

71.5

 

图2:

白葡萄酒样本品尝得分均值

酒样品

第一组均值

第二组均值

酒样品

第一组均值

第二组均值

酒样品

第一组均值

第二组均值

1

82

77.9

11

72.3

71.4

21

76.4

79.2

2

74.2

75.8

12

63.3

72.4

22

71

79.4

3

79.7

75.6

13

65.9

73.9

23

75.9

77.4

4

79.4

76.9

14

72

77.1

24

73.3

76.1

5

71

81.5

15

72.4

78.4

25

77.1

79.5

6

68.4

75.5

16

74

67.3

26

81.3

74.3

7

77.5

74.2

17

78.8

80.3

27

64.8

77

8

71.4

72.3

18

73.1

76.7

28

81.3

79.6

9

72.9

80.4

19

72.2

76.4

10

74.3

79.8

20

77.8

76.6

通过对两组评价得分均值的情况,通过matlab软件可以得出以上数据大体满足正态分布。

根据附件一的评分表,用excel表格计算出每一种葡萄酒样品的方差(如图3、4)

图3:

红葡萄酒样本方差

酒样品

第一组方差

第二组方差

酒样品

第一组方差

第二组方差

酒样品

第一组方差

第二组方差

1

92.9

81.9

10

30.4

36.2

19

47.4

55.2

2

39.8

16.2

11

70.8

38

20

26

39.1

3

45.8

30.7

12

79.7

25.1

21

116.1

35.5

4

108

41.3

13

44.9

15.3

22

50.6

24.3

5

62

13.7

14

36

23.2

23

32.5

24.8

6

59.7

21.1

15

85.6

41.3

24

74.9

10.7

7

103.6

63.7

16

18.1

21.1

25

64.6

43.7

8

44

65.1

17

88

9.2

26

31.3

41.6

9

32.9

25.7

18

47.2

50.3

27

49.8

20.5

 

图4:

白葡萄酒样本方差

酒样品

第一组方差

第二组方差

酒样品

第一组方差

第二组方差

酒样品

第一组方差

第二组方差

1

92.2

25.9

11

177.1

87.8

21

172.7

64.4

2

201.1

49.1

12

115.8

140

22

138.7

53.6

3

53.8

142.5

13

170.8

46.8

23

43.7

11.6

4

44.7

42.1

14

114.2

15.9

24

111.1

38.5

5

126.4

26.3

15

131.6

54

25

33.9

106.5

6

162.7

22.7

16

178

82.2

26

72.9

102.9

7

39.2

42.2

17

144.2

38.5

27

144.4

35.6

8

183.6

31.1

18

156.5

30.2

28

80.5

25.4

9

92.8

106.3

19

46.4

26

10

212.7

70.4

20

64.4

50

由于两组评酒员品尝得分大体满足正态分布,因此可以通过F检验法来判别两组评价有没有显著性差异。

首先求出第一组和第二组葡萄酒的平均方差,用平均方差来代替第一组的整体方差更具有说服力,也就是由excel表格算出每一组红、白葡萄酒样品方差的平均值,即为所对应的每一组红、白葡萄酒的方差(如图5)

图5

第一组红葡萄酒品尝评分的方差

58.61481

第二组红葡萄酒品尝评分的方差

33.87037

第一组白葡萄酒品尝评分的方差

118.075

第二组白葡萄酒品尝评分的方差

56.01786

根据F检验法公式:

得到

通过查得F表[1],我们采用F分布0.95分位数表,然后计算的F值与查表得到的F表值比较,如果

表明两组数据没有显著性差异;

表明两组数据存在显著差异。

因此可以得到红葡萄酒:

F计=1.730563

白葡萄酒:

F计=2.10781

查文献F表值,比较出红葡萄酒F计F表,即对于白葡萄酒来说两组评酒员的评价结果有显著性差异。

对于判别可信度,我们通过excel分别两组评酒员对每一种葡萄酒样品的方差以及方差的离散程度图(如图6、7)来比较离散程度。

根据方差的特性,离散度越小,可信度越高。

 

图6

 

图7

由以上两图我们可以得知,红葡萄酒中第二组方差离散程度较小即可信度较高,白葡萄酒中也是第二组方差离散程度较小即可信度较高,综述,我们判断出第二组评酒员的评价结果更可信。

4.2问题二的模型建立与求解

根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

首先求出十位评酒员在对葡萄酒的平均综合打分,从而对红白葡萄酒进行分级。

再通过主成份分析法分析出酿酒葡萄载荷较大的指理化指标。

对这些载荷较大的理化指标进行聚类分析,得出量酒葡萄的分类。

二者结合起来分析,从而对得到量酒葡萄的分级。

4.2.1对葡萄酒进行分级

第一步,求出每个评酒员对葡萄酒进行品尝后对其分类指标打分求和得到其总分,然后分别求出十位评酒员在对某葡萄酒样品的平均综合打分即是求十个中分的平均值,平均值大小可以反映葡萄酒的质量好坏,从而通过综合平均份的大小分别对红白葡萄酒进行分级。

由第一问分析得第二组评酒员的得分(如图所示)更为可靠,因此根据第二组评酒员对红葡萄酒和白葡萄酒的评价得分,可以大致把红葡萄酒和白葡萄酒分成下面几类,具体如图(8)所示。

图8

红葡萄酒样品11

61.6

白葡萄酒样品16

67.3

红葡萄酒样品7

65.3

白葡萄酒样品11

71.4

红葡萄酒样品18

65.4

白葡萄酒样品8

72.3

红葡萄酒样品15

65.7

白葡萄酒样品12

72.4

红葡萄酒样品8

66

白葡萄酒样品13

73.9

红葡萄酒样品6

66.3

白葡萄酒样品7

74.2

红葡萄酒样品1

68.1

白葡萄酒样品26

74.3

红葡萄酒样品25

68.2

白葡萄酒样品6

75.5

红葡萄酒样品12

68.3

白葡萄酒样品3

75.6

红葡萄酒样品10

68.8

白葡萄酒样品2

75.8

红葡萄酒样品13

68.8

白葡萄酒样品24

76.1

红葡萄酒样品16

69.9

白葡萄酒样品19

76.4

红葡萄酒样品4

71.2

白葡萄酒样品20

76.6

红葡萄酒样品27

71.5

白葡萄酒样品18

76.7

红葡萄酒样品24

71.5

白葡萄酒样品4

76.9

红葡萄酒样品22

71.6

白葡萄酒样品27

77

红葡萄酒样品26

72

白葡萄酒样品14

77.1

红葡萄酒样品5

72.1

白葡萄酒样品23

77.4

红葡萄酒样品21

72.2

白葡萄酒样品1

77.9

红葡萄酒样品19

72.6

白葡萄酒样品15

78.4

红葡萄酒样品14

72.6

白葡萄酒样品21

79.2

红葡萄酒样品9

74

白葡萄酒样品22

79.4

红葡萄酒样品17

74.5

白葡萄酒样品25

79.5

红葡萄酒样品3

74.6

白葡萄酒样品28

79.6

红葡萄酒样品20

75.8

白葡萄酒样品10

79.8

红葡萄酒样品23

77.1

白葡萄酒样品17

80.3

红葡萄酒样品2

78.2

白葡萄酒样品9

80.4

白葡萄酒样品5

81.5

图9

分级

红葡萄酒样品

白葡萄酒样品

样品2,23

样品5,9,17

良好

样品20,3,17,9

样品10,28,25,22,21

一般

样品14,19,21,5,26,22,24,27,4

16,13,12,10,25,1

样品15,1,23,14,27,4,18,20,

19,24,2,3,6

低等

样品7,18,15,8,6

样品11,8,12,13,7,26

劣质

样品11

样品16

4.2.2用主成份分析法分析出酿酒葡萄载荷较大的指理化指标,并通过聚累分析法分析酿酒葡萄的分类

主成分分析是将多项指标重新组合成一组新的互相无关的几个综合指标,根据实际需要从中选取载荷较大的指理化指标。

具体步骤如下:

(1)数据的标准化处理

利用公式:

其中

为第

种样品葡萄第

个指标的值,

为第

个指标的样本均值和样本标准差。

(2)计算数据表的相关系数矩阵

(程序见附录)

利用matlab编程可得到相关系数矩阵(表1)

(3)求

个特征向量值:

,以及对应的特征向量

,它们的标准正交,

称为主轴。

利用Matlab软件编程运行结果如表2(Matlab程序见附录):

得到相关系数矩阵对应的特征值。

(4)求主成分:

分别对27红葡萄28白葡萄样品的一级理性指标进行住成分分析后.得到五个主成分,累计贡献率大于85%。

具有统计学上的意义。

首先利用Matlab软件运行得到主因子载荷矩阵如表4(matlab程序见附录):

图10正交旋转后的主因子载荷矩阵(红葡萄)

x1

x2

x3

x4

x5

x6

x7

x8

x9

z1

-0.3552

-0.6401

0.1253

-0.8273

-0.4094

-0.396

-0.34

-0.2943

-0.606

z2

-0.5683

0.4967

0.4181

0.0601

-0.0507

-0.279

-0.1294

-0.1673

0.0503

z3

-0.0518

-0.0023

-0.0777

0.1925

-0.2938

-0.174

-0.4232

0.1085

-0.1022

z4

0.4733

0.2751

-0.0059

-0.3346

0.4389

-0.643

-0.3013

-0.6102

-0.6978

z5

-0.2162

0.2046

-0.5539

0.0636

0.3434

0.0552

0.3799

0.2628

-0.0079

x10

x11

x12

x13

x14

x15

x16

x17

x18

z1

-0.7716

-0.844

-0.7229

-0.7047

-0.183

-0.569

-0.2224

-0.0363

-0.1956

z2

0.4243

0.1044

0.0847

0.2337

0.2038

-0.074

-0.8204

-0.7789

-0.8233

z3

0.2713

0.3622

0.4222

0.4417

-0.5983

-0.002

0.1241

0.0054

0.2693

z4

0.1738

0.1716

-0.1353

0.2187

0.1607

-0.067

0.2522

0.1332

0.1144

z5

-0.0718

-0.0671

-0.2301

-0.0407

-0.2328

-0.149

0.0955

0.1354

0.1042

x19

x20

x21

x22

x23

x24

x25

x26

x27

z1

-0.2991

0.3878

-0.4501

-0.3235

0.3427

0.5671

-0.6116

-0.5074

0.3012

z2

0.2753

-0.5068

0.0924

-0.8897

0.4513

0.3239

0.1621

0.137

0.1566

z3

-0.0365

0.5174

-0.3526

0.1228

0.3522

0.5623

-0.2065

0.4155

0.6711

z4

0.7123

-0.0875

0.0585

0.0828

0.0161

-0.007

-0.185

0.1031

-0.2132

z5

0.1484

-0.3862

0.5653

0.0908

0.5552

0.2042

-0.3635

-0.0418

0.2682

取得前五个主成分,各理化指标因子的二维载荷主超平面数据表(见表3)可知:

对于主成分Z1中各个因子载荷值,从正方向上看,比较大的是果梗比(为0.5671),

从负方向上看比较大的是花色苷,褐变度,单宁,分别为-0.8273,-0.606,-0.5074.依次分析五种主成分,得出载荷较大的理化指标因子为蛋白质,花色苷,褐变度,DPPH自由基,总酚,单宁,葡萄总黄铜,还原糖,果穗质量,百粒质量,果梗比。

图11正交旋转后的主因子载荷矩阵(白葡萄)

x1

x2

x3

x4

x5

x6

x7

x8

x9

z1

-0.5497

-0.0628

0.383

0.2109

-0.454

-0.0196

-0.2796

0.3226

-0.12

z2

0.2782

0.7143

-0.2202

-0.4494

-0.3865

0.4145

0.0261

-0.4805

0.1414

z3

0.0542

0.0214

-0.4163

0.3702

0.1597

0.0625

0.3395

0.1241

-0.1042

z4

-0.534

0.3052

0.3313

-0.2927

-0.2446

-0.6235

-0.076

0.2013

0.5818

z5

-0.0537

0.053

-0.3676

-0.1297

-0.5326

-0.439

-0.4152

-0.1055

-0.3546

x10

x11

x12

x13

x14

x15

x16

x17

x18

z1

-0.257

0.0727

-0.3963

0.126

-0.0804

-0.2532

-0.7645

-0.7219

-0.8513

z2

0.467

0.8549

0.5316

0.8481

0.1569

0.4793

-0.0218

0.116

-0.096

z3

-0.3342

0.2893

-0.101

0.3262

0.1582

0.3829

-0.3532

-0.3

-0.252

z4

0.1366

0.1252

0.1425

0.0401

-

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1