全国大学生数学建模竞赛安徽赛区获奖论文.docx

上传人:b****8 文档编号:10300678 上传时间:2023-02-10 格式:DOCX 页数:33 大小:692.42KB
下载 相关 举报
全国大学生数学建模竞赛安徽赛区获奖论文.docx_第1页
第1页 / 共33页
全国大学生数学建模竞赛安徽赛区获奖论文.docx_第2页
第2页 / 共33页
全国大学生数学建模竞赛安徽赛区获奖论文.docx_第3页
第3页 / 共33页
全国大学生数学建模竞赛安徽赛区获奖论文.docx_第4页
第4页 / 共33页
全国大学生数学建模竞赛安徽赛区获奖论文.docx_第5页
第5页 / 共33页
点击查看更多>>
下载资源
资源描述

全国大学生数学建模竞赛安徽赛区获奖论文.docx

《全国大学生数学建模竞赛安徽赛区获奖论文.docx》由会员分享,可在线阅读,更多相关《全国大学生数学建模竞赛安徽赛区获奖论文.docx(33页珍藏版)》请在冰豆网上搜索。

全国大学生数学建模竞赛安徽赛区获奖论文.docx

全国大学生数学建模竞赛安徽赛区获奖论文

A题:

葡萄酒的评价

摘要

针对于问题一:

首先对数据进行处理,然后使用Matlab软件对数据进行是否是正态分布的检验。

然后进行T检验判断其显著性。

通过方差分析,得出第二组评酒员的打分更可信。

针对于问题二:

对酿酒葡萄的各个理化指标和酒的质量,进行主成分分析。

通过贡献度得出各个理化指标和酒的质量的权重,在用模糊评价矩阵对酿酒葡萄分级,共分为四类(优,良,中,差)。

针对于问题三:

对酿酒葡萄与葡萄酒的理化指标数据进行处理,采用insight模块实现典型相关分析的方法,得到了两者之间的联系。

针对于问题四:

分别对红白葡萄的酿酒葡萄与葡萄酒的理化指标进行数据处理,并且只考虑一级指标,根据葡萄酒、酿酒葡萄分别与感官分析的结果,利用SPSS11.0以及AMOS6.0软件进行统计分析与数据处理,经过对数据的相关分析、通径分析、变异系数分析、主成分分析、聚类分析以及回归分析过程可以得到葡萄酒和酿酒葡萄的理化指标对葡萄酒质量影响的大小。

从而可以判断出不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

 

关键词:

Matlab软件SAS软件回归分析主成分分析聚类分析模糊评价典型相关分析

 

问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

请尝试建立数学模型讨论下列问题:

1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

问题分析

1﹑对于问题一附表1给出了某一年份两组各10位评酒员分别对红白葡萄酒的评价结果。

要想知道两组评酒员评价结果有无显著性差异以及哪一组结果更可信,若评酒员的评分服从正态分布,则可用T检验分析比较两组评酒员评分的平均值。

这点可用matlab软件进行计算。

根据软件进行T检验得出T值及P值,当P值小于0.05时,说明两组评酒员对相应种类葡萄酒的评价存在明显的差异,此时对比分析相应的方差可看出第一﹑第二组评酒员评价结果的可信度。

若评酒员的评分不服从正态分布则可对原始数据进行筛选处理,去除一些偏差极大的数据。

然后对剩余的数据进行相同的分析处理。

2﹑对于问题二附表2给出了红白葡萄的理化指标,想要根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,可以用模糊分析,但必须要知道各个主要成分的权重。

所以可以通过主成分分析确立主要成分,在通过聚类分析给出各个主要成分的贡献率来确立各自的权重。

最后利用模糊分析对酿酒葡萄进行分级。

3﹑对于问题三要找出酿酒葡萄与葡萄酒的理化指标之间的联系,由于酿酒葡萄与葡萄酒都有很多指标,并且酿酒葡萄与葡萄酒的理化指标不对应如果只是采取简单的回归模型的话,不能通过检验。

所以采用insight模块实现典型相关分析的方法,通过SAS软件得到了两者之间的联系。

4﹑对于问题四要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

由于酿酒葡萄和葡萄酒的理化指标是影响葡萄酒质量的因素。

是不是直接用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

我们需要去论证,这里分别对红白葡萄的酿酒葡萄与葡萄酒的理化指标进行数据处理,并且只考虑一级指标,根据葡萄酒、酿酒葡萄分别与感官分析的结果,利用SPSS11.0以及AMOS6.0软件进行统计分析与数据处理,经过对数据的相关分析、通径分析、变异系数分析、主成分分析、聚类分析以及回归分析过程可以得到葡萄酒和酿酒葡萄的理化指标对葡萄酒质量影响的大小。

从而可以判断出不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

模型假设

1﹑假设评酒员对各样品的评价不受外界因素干扰。

2﹑假设各葡萄样品均采自良好的生长环境,能保证本种葡萄的特性。

3﹑假设评酒员能对样品进行客观的评价。

定义与符号说明

个变量的平均值

个变量的标准差

模糊关系矩阵

评价结果矩阵

权重矩阵

模糊评价矩阵

问题一的模型建立与求解

一﹑模型的分析

1﹑要想知道两组评酒员评价结果有无显著性差异以及哪一组结果更可信,若评酒员的评分服从正态分布则可用T检验分析比较两组评酒员评分的平均值。

这点可用matlab软件进行计算。

2﹑若评酒员的评分不服从正态分布则可对原始数据进行筛选处理。

经分析得知对于白葡萄酒的评分,第一组评酒员2号对于葡萄酒样品2﹑5﹑6﹑15﹑18﹑22等的评分明显低于整体评分均值水平,第二组评酒员8号对于葡萄酒样品3﹑9﹑12﹑15﹑21﹑26等的评分明显低于整体评分均值水平。

因此,我们排除极值的影响,对剩余数据重新进行正态检验。

发现此时整体评分数据服从正态分布。

既而我们仍可以用matlab进行T检验。

3﹑根据matlab软件进行T检验得出T值及P值,当P值小于0.05时,说明两组评酒员对相应种类葡萄酒的评价存在明显的差异,此时对比分析相应的方差可看出第一﹑第二组评酒员评价结果的可信度。

二﹑模型建立与求解

首先根据附表1给出的评酒员评分情况分别对第一﹑二组的评价总分数据进行正态检验(程序见附录)。

可知,第一﹑二组10位评酒员对红葡萄酒评价总分的数据服从正态分布,可用T检验(程序见附录)进行分析。

算出两组评酒员对红葡萄酒评分的平均值﹑方差﹑标准差﹑T﹑P值,如下表所示。

 

第一组

第二组

T

P

样本编号

均值

方差

标准差

均值

方差

标准差

0.0003

-4.4486

12

53.9

79.66

8.92

68.3

25.12

5.01

0.0023

3.5523

23

85.6

32.49

5.70

77.1

24.77

4.98

0.0159

2.6620

2

80.3

39.79

6.31

74

16.22

4.03

0.0190

2.5768

11

70.1

70.77

8.41

61.6

38.04

6.17

0.0198

2.5582

16

74.9

18.10

4.25

69.9

20.10

4.48

0.0296

2.3635

13

74.6

44.93

6.70

68.8

15.29

3.91

0.0394

2.2215

24

78

74.89

8.65

71.5

10.72

3.27

0.0504

2.0965

3

80.4

45.82

6.77

74.6

30.71

5.54

0.0508

2.0928

10

74.2

30.40

5.51

68.8

36.18

6.01

0.0526

2.0749

6

72.2

59.73

7.73

66.3

21.12

4.60

0.0556

2.0463

22

77.2

50.62

7.11

71.6

24.27

4.93

0.0650

-1.9649

15

58.7

85.57

9.25

65.7

41.34

6.43

0.0726

1.9071

8

72.3

44.01

6.63

66

65.11

8.07

0.0773

1.8738

19

78.6

47.38

6.88

72.6

55.16

7.43

0.0951

-1.7616

18

59.9

47.21

6.87

65.4

50.27

7.09

0.1410

1.5398

17

79.3

88.01

9.38

74.5

9.17

3.03

0.1458

1.5204

7

71.5

103.61

10.18

65.3

62.68

7.92

0.1899

1.3623

9

81.5

32.94

5.74

78.2

25.73

5.07

0.2128

-1.2917

1

62.7

92.9

9.64

68.1

81.88

9.05

0.2243

1.2584

21

77.1

116.10

10.77

72.2

35.51

5.96

0.2870

1.0973

20

78.6

26.04

5.10

75.8

39.07

6.25

0.5096

-0.6728

4

68.6

108.04

10.39

71.2

41.29

6.43

0.5133

0.6669

26

73.8

31.29

5.59

72

41.56

6.45

0.5785

0.5658

27

73

49.78

7.06

71.5

20.50

4.53

0.6678

0.4362

5

73.3

62.01

7.87

72.1

13.66

3.70

0.7648

0.3038

25

69.2

64.62

8.04

68.2

43.73

6.61

0.8712

0.1645

14

73

36.00

6.00

72.6

23.16

4.81

由此可知,对于红葡萄酒样本2﹑11﹑12﹑13﹑16﹑23﹑24第一﹑二组评酒员的评分存在显著的差异(其中

),而其他红葡萄酒样本的评分没有显著的差异。

由表格数据可看出对于这几种红葡萄酒样本的评分情况,第一组较第二组方差大。

因此可说明对于红葡萄酒的评分第一组评分波动大,第二组评酒员的评分较为可信。

对于白葡萄酒的评分,第一组评酒员2号对于葡萄酒样品2﹑5﹑6﹑15﹑18﹑22等的评分明显低于整体评分均值水平,而第二组评酒员8号对于葡萄酒样品3﹑9﹑12﹑15﹑21﹑26等的评分明显低于整体评分均值水平。

因此,在没踢出干扰数据时第一、二组的评价差不多,这样我们就可以排除极值的影响,对剩余数据重新进行正态检验。

发现此时整体评分数据服从正态分布。

既而我们仍可以进行T检验(程序见附录)。

算出两组评酒员对白葡萄酒评分的平均值﹑方差﹑标准差﹑T﹑P值以及进行数据筛选改进后的方差﹑标准差,如下表所示。

 

第一组

第二组

 

改进P值

P

T

均值

改进均值

标准差

改进标准差

均值

改进均值

标准差

改进标准差

样本编号

0.0020

0.0101

-2.8759

64.80

66.13

12.02

8.18

77.00

77.88

5.96

3.14

27

0.0068

0.0151

-2.6868

71.00

72.38

11.24

7.35

81.50

81.38

5.13

3.25

5

0.0099

0.1100

-1.6811

72.90

73.63

9.63

7.21

80.40

82.63

10.31

4.57

9

0.0106

0.0888

-1.7991

63.30

64.25

10.76

7.50

72.40

74.50

11.83

6.37

12

0.0195

0.0714

-1.9157

71.00

71.50

11.78

7.13

79.40

79.88

7.32

5.46

22

0.0310

0.5299

-0.6406

77.10

77.25

5.82

4.20

79.50

81.88

10.32

3.48

25

0.0526

0.1361

-1.5604

72.20

72.00

6.81

5.55

76.40

76.88

5.10

3.40

19

0.0539

0.2055

1.3134

74.00

75.00

13.34

9.86

67.30

66.88

9.07

4.70

16

0.0697

0.2483

1.1931

82.00

83.00

9.60

5.50

77.90

78.25

5.09

4.06

1

0.0728

0.1035

-1.7152

65.90

66.75

13.07

9.77

73.90

74.50

6.84

5.68

13

0.0917

0.1807

-1.3925

72.40

73.63

11.47

7.21

78.40

79.13

7.35

4.67

15

0.1080

0.1165

-1.6488

68.40

69.38

12.76

9.75

75.50

75.63

4.77

3.29

6

0.1083

0.1744

-1.4139

72.00

73.50

10.69

6.44

77.10

77.63

3.98

2.20

14

0.1092

0.1123

1.6695

81.30

81.75

8.54

6.36

74.30

75.88

10.14

7.34

26

0.1927

0.2624

1.1570

77.50

78.13

6.26

5.00

74.20

74.88

6.49

4.49

7

0.2205

0.3149

-1.0337

74.30

76.25

14.58

8.96

79.80

80.88

8.39

4.88

10

0.2726

0.4073

0.8485

79.40

80.13

6.69

4.09

76.90

77.38

6.49

5.45

4

0.3826

0.6077

0.5226

81.30

82.13

8.97

7.64

79.60

79.50

5.04

3.07

28

0.4511

0.5724

-0.5750

76.40

78.38

13.14

9.55

79.20

81.13

8.02

3.09

21

0.4530

0.4785

-0.7238

73.30

73.88

10.54

8.76

76.10

76.63

6.21

4.98

24

0.4666

0.5314

-0.6381

75.90

75.75

6.61

4.95

77.40

77.25

3.41

2.76

23

0.5351

0.4158

-0.8330

73.10

75.13

12.51

7.20

76.70

77.00

5.50

4.21

18

0.6267

0.7269

0.3547

77.80

78.63

8.02

5.85

76.60

77.38

7.07

4.03

20

0.6298

0.8631

0.1748

72.30

73.63

13.31

9.58

71.40

71.38

9.37

8.67

11

0.7519

0.7527

-0.3199

74.20

75.50

14.18

10.52

75.80

76.75

7.00

3.11

2

0.8231

0.6717

-0.4308

70.40

71.88

12.78

9.99

72.30

72.75

5.58

4.27

8

0.8853

0.7297

-0.3510

78.80

80.25

12.01

8.38

80.30

80.75

6.20

4.74

17

0.8999

0.5621

0.5907

78.30

78.38

8.15

6.65

75.60

78.00

11.94

4.93

3

由上表数据可看出对于白葡萄酒样本5﹑9﹑12﹑22﹑25﹑27第一﹑二组评酒员的评分存在显著的差异(其中

),其他白葡萄酒样本的评分没有显著的差异。

由表格数据可看出对于这几种白葡萄酒样本的评分情况,第一组较第二组方差大。

因此可说明对于红酒的评分,第二组评酒员的评分较为可信。

综上所述,可知对于红葡萄酒样本2﹑11﹑12﹑13﹑16﹑23﹑24第一﹑二组评酒员的评分存在显著的差异(其中

),对于白葡萄酒样本5﹑9﹑12﹑22﹑25﹑27第一﹑二组评酒员的评分存在显著的差异(其中

)。

而无论白﹑红葡萄酒其存在显著差异的葡萄酒样本的评分情况均为第一组较第二组方差大。

因此可说明对于葡萄酒的评分,第二组评酒员的评分较为可信。

问题二的模型建立与求解

一、模型分析

对于该问题,我们从两方面进行分析。

首先由问题一得知,第二组评酒员的评分更可信,我们以第二组评酒员的评分为参考,对葡萄酒进行分级,从而初步得出酿酒葡萄的分级情况。

另一方面,因为酿酒葡萄的理化指标很多(28种),为了确定对酿酒葡萄质量产生影响的理化指标有哪些,我们采用主成分分析法。

利用SAS软件求出各主成分对酿酒葡萄品质的贡献率大小,以此确定其权重,既而建立模糊评价模型。

最后结合葡萄酒质量及酿酒葡萄理化指标确定酿酒葡萄的分级情况。

二、模型的建立与求解

此题研究的是关于

个样品,

个指标(因素)

的问题

因此我们采用主成分分析法并创建模糊评价矩阵。

其原始统计资料整理的原始数据矩阵为:

(2.1)

附表2中给出的指标具有不同的量纲,有的指标值在数量级上也有很大的差异,为了消除由于量纲的不同而可能带来的一些不合理的影响,在进行主成分分析之前需要先对数据进行标准化处理,以使每一个变量的平均值为0,方差为1。

变量标准化的公式为:

其中,

分别是第

个变量的平均值和标准差。

将数据标准化后的矩阵仍用式(2.1)的

记,那么

个变量综合成

个新变量,新的综合变量可以由原来的变量

线性表示,即:

并且满足:

其中,系数

由下列原则来确定:

相互无关。

的所有线性组合中的方差最大者,

是与

不相关的

的所有线性组合中的方差最大者,

是与

都不相关的

的所有线性组合中的方差最大者。

如此决定的综合变量

分别称为原变量的第一、第二,…,第

个主成分。

其中

在总方差中占的比重最大,其余综合变量

的方差依次递减。

在具体分析时,我们只挑选前几个方差最大的主成分(一般占85%以上),从而达到简化系统结构,抓住问题实质的目的。

由此利用SAS系统中的File中的Import导入功能将数据转换为SAS数据集。

调用procprincomp过程(程序见附录)对资料进行聚类分析结果如图:

由表中数据可知,前十个特征值较大,累计贡献率已达到89.24%,所以选前10个主成分就可以表示原来的28个指标所包含信息的89.24%。

然后对红葡萄的指标进行分类,

(图中a1-a28为红葡萄成分依次代号,z1-z9为主成分代号)

第一组主成分为花色苷,DPPH自由基,总酚,单宁,葡萄总黄酮。

第二组主成分为总糖,还原糖。

第三组主成分为酒的质量。

第四组主成分为多酚氧化酶活力。

第五组主成分为柠檬酸,果穗质量。

第六组主成分为黄酮醇,果梗比,果皮质量。

第七组主成分为固酸比。

第八组主成分为vc含量。

第九组主成分为苹果酸。

第十组主成分为白藜芦醇。

并且由其贡献率的大小确定权重

=[0.24340.17030.11650.10250.07110.05440.04370.3560.02880.061]来判断10个主要成分权重并对数据进行处理去除单位。

根据模糊评价,

是一个模糊关系矩阵,称为模糊评价矩阵,并表示如下:

红葡萄质量评价模糊集如下:

=[0.7897850.7601490.7315990.5621570.7022710.6030220.5383170.8161650.7474270.5311480.5103990.5330940.6281270.7762490.5507460.5277860.6396660.5577940.7069990.5168730.6506740.6019240.7773910.672950.522030.6768310.555773]

中元素进行归一化处理得:

=[0.0459510.0442270.0425660.0327080.040860.0350850.0313210.0474860.04348710.0309030.0296960.0310170.0365460.0451640.0320430.0307070.0372170.0324540.0411340.0300730.0378580.0350210.0452310.0391540.0303730.039380.032336]

最终评价根据得分的不同红色酿酒葡萄可分为4个等级结果如下:

优秀的样品为8,1,23,14,2,9,3,19,5号样品,良好的样品为26,24,21,17,13,6,22号样品,中等的样品为4,18,27,15,7,12号样品,差的样品为10,16,25,20,11号样品。

同理,对白葡萄样品进行SAS聚类分析,结果如图

由表中数据可知,前12个特征值较大,累计贡献率已达到88.82%,所以选前12个主成分就可以表示原来的28个指标所包含信息的88.82%。

然后对白葡萄指标进行分类,如下图

(图中a1-a28为白葡萄成分依次代号,z1-z12为主成分代号)

得到白葡萄主要成分:

第一组主成分为总糖,还原糖,可溶性固形物,干物质含量。

第二组主成分为葡萄总黄酮,总酚,蛋白质。

第三组主成分为固酸比。

第四组主成分为苹果酸,酒的质量。

第五组主成分为褐变度,黄酮醇,VC含量。

第六组主成分为酒石酸。

第七组主成分为柠檬酸。

第八组主成分为果皮质量。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1