葡萄酒的评价数学建模论文.docx

上传人:b****7 文档编号:10071323 上传时间:2023-02-08 格式:DOCX 页数:68 大小:219.05KB
下载 相关 举报
葡萄酒的评价数学建模论文.docx_第1页
第1页 / 共68页
葡萄酒的评价数学建模论文.docx_第2页
第2页 / 共68页
葡萄酒的评价数学建模论文.docx_第3页
第3页 / 共68页
葡萄酒的评价数学建模论文.docx_第4页
第4页 / 共68页
葡萄酒的评价数学建模论文.docx_第5页
第5页 / 共68页
点击查看更多>>
下载资源
资源描述

葡萄酒的评价数学建模论文.docx

《葡萄酒的评价数学建模论文.docx》由会员分享,可在线阅读,更多相关《葡萄酒的评价数学建模论文.docx(68页珍藏版)》请在冰豆网上搜索。

葡萄酒的评价数学建模论文.docx

葡萄酒的评价数学建模论文

2012高教社杯全国大学生数学建模竞赛

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写):

A

我们的参赛报名号为(如果赛区设置报名号的话):

所属学校(请填写完整的全名):

参赛队员(打印并签名):

1.

2.

3.

指导教师或指导教师组负责人(打印并签名):

日期:

2012年9月10日

 

赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛

编号专用页

 

赛区评阅编号(由赛区组委会评阅前进行编号):

 

赛区评阅记录(可供赛区评阅时使用):

 

 

全国统一编号(由赛区组委会送交全国前编号):

 

全国评阅编号(由全国组委会评阅前进行编号):

 

葡萄酒的评价

摘要

本文以酿酒葡萄和葡萄酒为对象,根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级,建立了酿酒葡萄与葡萄酒理化指标间的联系,并就酿酒葡萄与葡萄酒理化指标对葡萄酒质量的影响进行了分析讨论。

针对问题一,首先用EXCEL软件分别对红白葡萄酒的两组评价结果进行处理,得到其打分分数的平均值,然后考虑到本题确定的两个独立样本的分布形态不确定,所以选用非参数检验中的Mann-WhitneyU检验和Kolmogorov-Smirnov检验方法对评价结果进行显著性分析,发现两组评酒员的评价结果有显著性差异,最后分别对两组评分数据求标准差并进行比较,确定出第二组评酒员的评价结果可信度高。

针对问题二,我们用聚类分析和主成分分析两种方法对葡萄样品进行分类,并比较两种方法的优劣性。

首先用SPSS软件中的聚类分析法对葡萄样品进行分类,结果将葡萄分为四类,然后用主成分分析法简化酿酒葡萄的理化指标,并求出简化后理化指标的权重,得出葡萄样品的综合排名,对其进行排序,用建立好的评级指标可以将样品分为如下四类:

等级

红葡萄

白葡萄

最佳

8,10,14

1,13

良好

2,3,5,26

3,5,6,10,15,16,17,20,21,24,27

中等

1,6,9,13,17,19,21,23,24,27

2,4,7,8,9,11,12,14,18,19,22,23,25,28

4,7,11,12,15,16,20,22,25,28

26

最后通过对两种方法的比较,得出主成分分析法为较优方法。

针对问题三,首先根据问题二中主成分分析法的结果对酿酒葡萄的指标进行简化,将问题转化为一个多元函数的求解问题,然后分别对酿酒葡萄中的指标和葡萄酒理化指标进行相关性分析,得出指标间的相关性关系,将问题转化为求解超定方程组的解,最后利用最小二乘法建立了酿酒葡萄与葡萄酒理化指标间的关系式。

针对问题四,首先把评酒员对酒样品的评分作为葡萄酒质量的评价,用相关性分析方法求出酿酒葡萄和葡萄酒的理化指标与葡萄酒质量之间的相关性,然后再把芳香度作为葡萄酒质量的评价,求出理化指标与葡萄酒质量之间的相关性,对比这两种方法的结果可以得出结论:

在一定程度上不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

关键词:

非参数检验聚类分析法主成分分析法相关性分析

 

一问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

请尝试建立数学模型讨论下列问题:

1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

二问题分析

对于问题一,要想得到差异的显著性,首先就要处理数据得到两组评价结果的平均值,但考虑到两个独立样本的分布形态不确定,所以用非参数检验法更加准确。

针对这个问题,我们采用最常用的两种方法:

Mann-WhitneyU检验和Kolmogorov-Smirnov检验来判断是否有显著性差异。

对于可信度,考虑到标准差是反应一组数据离散程度最常用的一种量化形式,是表示精确度的重要指标,可以反映组内个体间的离散程度,所以采用标准差值的大小来衡量测量结果的可信度。

对于问题二,我们可以用聚类分析对葡萄样品进行分类,也可以用主成分分析求出主要的影响指标及其权重,进而对样品进行排序并分类。

最后通过对比两种方法的优劣性得出较优方法,从而得到葡萄的质量分级。

对于问题三,由于酿酒葡萄的指标很多,所以首先应该对酿酒葡萄的指标进行简化将问题转化为一个多对多的模型,然后分别对酿酒葡萄中的指标和葡萄酒理化指标进行相关性分析,得出指标间的相关性关系,将问题转化为求解超定方程组的解,最后可以利用最小二乘法建立酿酒葡萄与葡萄酒理化指标间的联系。

对于问题四,首先根据问题三的结果可以将酿酒葡萄和葡萄酒的理化指标进行进一步的简化,然后把评酒员对酒样品的评分作为葡萄酒质量的评价,用

软件中的相关性分析方法求出酿酒葡萄和葡萄酒的理化指标与葡萄酒质量之间的相关性,就可以得出他们之间的影响程度,然后再把芳香度作为葡萄酒质量的评价,求出理化指标与葡萄酒质量之间的相关性,对比这两种方法的结果来论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

三模型假设

1.假设酿酒葡萄和葡萄酒是一一对应的关系;

2.假设葡萄酿酒过程中的卫生指标符合规定,本题不予以考虑;

3.假设评酒员在评分时不受其他主观因素的影响;

4.假设酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系;

5.假设两组评酒员都是随机选取的;

6.为了便于问题解决,假设酿酒葡萄和葡萄酒的理化指标属于线性关系;

7.芳香物质是葡萄酒质量的重要指标,文中将芳香物质摩尔总和用于评价葡萄酒质量。

四符号说明

符号名称

符号意义

双侧显著性水平

显著水平

理论葡萄酒累积频数分布

次观测的随机样本的经验分布函数

检验统计量

综合主成分值

红葡萄酒的理化指标

红葡萄的指标

白葡萄酒的理化指标

白葡萄的指标

五模型的建立与求解

5.1问题一求解

本文首先分析了影响评酒员对葡萄酒进行评价的相关因素,发现他们是从外观、香气和口感等方面来对白葡萄酒和红葡萄酒的各样本进行打分的,为了综合这些因素,能够更好地比较出两组评分结果的差异性与可信度,需要对附件

的数据进行处理,这里我们分别求出第一组和第二组评酒员对白葡萄酒和红葡萄酒打分分数的平均值。

处理的数据见表1.1.1,表1.1.2,表1.1.3,表1.1.4:

表1.1.1:

第一组红酒各样品分数平均值

样品

1

2

3

4

5

6

7

8

9

平均值

62.7

80.3

80.4

68.6

73.3

72.2

71.5

72.3

81.5

样品

10

11

12

13

14

15

16

17

18

平均值

74.2

70.1

53.9

74.6

73

58.7

74.9

79.3

59.9

样品

19

20

21

22

23

24

25

26

27

平均值

78.6

79.8

77.1

77.2

85.6

78

69.2

73.8

73

表1.1.2:

第二组红酒各样品分数平均值

样品

1

2

3

4

5

6

7

8

9

平均值

68.1

74

74.6

71.2

72.1

66.3

65.3

66

78.2

样品

10

11

12

13

14

15

16

17

18

平均值

68.8

61.6

68.3

68.8

72.6

65.7

69.9

74.5

65.4

样品

19

20

21

22

23

24

25

26

27

平均值

72.6

75.8

72.2

71.6

77.1

71.5

68.2

75

71.5

表1.1.3:

第一组白酒各样品分数平均值

样品

1

2

3

4

5

6

7

平均值

82

74.2

78.3

79.4

71

68.4

77.5

样品

8

9

10

11

12

13

14

平均值

71.4

72.9

74.3

72.3

63.3

65.9

72

样品

15

16

17

18

19

20

21

平均值

72.4

74

78.8

73.1

72.2

77.8

76.4

样品

22

23

24

25

26

27

28

平均值

71

75.9

73.3

77.1

81.3

64.8

81.3

表1.1.4:

第二组白酒各样品分数平均值

样品

1

2

3

4

5

6

7

平均值

77.9

75.8

75.6

76.9

81.5

75.5

74.2

样品

8

9

10

11

12

13

14

平均值

72.3

80.4

79.8

71.4

72.4

73.9

77.1

样品

15

16

17

18

19

20

21

平均值

78.4

67.3

80.3

76.7

76.4

76.6

79.2

样品

22

23

24

25

26

27

28

平均值

79.4

77.4

76.1

79.5

74.3

77

79.6

根据不同组评酒员针对不同品种和样本葡萄酒的打分情况,可以将这两组的打分情况看作两个独立的样本。

这样就将问题转化为求两独立样本的参数检验问题。

利用T检验方法可以得到两个总体是否存在显著性差异,但T检验方法要求两个独立样本来自的总体服从正态分布,甚至对两个总体的方差也要求相等或者已知。

所以我们利用两独立样本的非参数检验过程对两个总体的分布是否存在显著性差异进行检验。

由于非参数检验的方法比较多,这里主要运用Mann-WhitneyU检验和Kolmogorov-Smirnov检验两种方法,并给出不同检验的相关结果。

1.Mann-WhitneyU检验

Mann-WhitneyU检验可用于检验两独立样本是否来自于同一总体,它是最常用的两独立的非参数检验方法,该检验方法的零假设是这种检验方法是利用两独立样本的秩的比较得到的。

它的检验步骤为:

(1)提出假设

:

两样本来自于无显著差异的总体

两样本来自于有显著差异的总体

(2)计算相应检验统计量值或

(3)作出判断

接受

,认为两个样本无显著性差异;否则,拒绝

,认为两个样本有

显著性差异(

值为双侧显著性水平,

)。

分别将表1.1.1和表1.1.3、表1.1.2和表1.1.4的数据导入SPSS软件运用Mann-WhitneyU检验得到红葡萄酒和白葡萄酒的秩和检验统计量,如表1.1.5和表1.1.6所示:

表1.1.5:

红葡萄酒检验的秩和检验统计量

g

N

秩均值

秩和

sur

1.00

27

32.69

882.50

2.00

27

22.31

602.50

总数

54

检验统计量b

sur

Mann-WhitneyU

224.500

WilcoxonW

602.500

Z

-2.422

渐近显著性(双侧)

.015

MonteCarlo显著性(双侧)

显著性

.000a

95%置信区间

下限

.000

上限

.105

MonteCarlo显著性(单侧)

显著性

.000a

95%置信区间

下限

.000

上限

.105

 

表1.1.6:

白葡萄酒检验的秩和检验统计量

g

N

秩均值

秩和

sur

1.00

28

23.79

666.00

2.00

28

33.21

930.00

总数

56

检验统计量a

sur

Mann-WhitneyU

260.000

WilcoxonW

666.000

Z

-2.163

渐近显著性(双侧)

.031

a.分组变量:

g

 

从表1.1.5和表1.1.6可以看出,两种葡萄酒的

值均小于0.05,所以拒绝

,认为两个样本即两组评价结果有显著性差异。

2.Kolmogorov-Smirnov(K-S)检验

Kolmogorov-Smirnov检验用于检验一组样本观测结果的经验分布同某一指定的理论分布之间是否一致。

K-S检验的基本思路为:

将顺序分类数据的理论积累频率分布同观测的经验累积频率分布加以比较,求出它们最大的偏离值,然后再给定的显著性水平上检验这种偏离值是否是偶然出现的。

设理论葡萄酒累积频数分布为

次观测的随机样本的经验分布函数

,K-S检验的步骤如下:

(1)零假设

经验分布与理论分布没有显著差别。

(2)把样本观测值从小到大排列为:

,计算经验累积分布函数:

和理论累积分布函数

记检验统计量

,K-S检验将计算

值以及相应的概率

值。

在给定显著性水平的条件下,如果概率

值小于显著性水平,则拒绝零假设,认为两样本有显著性差异,反之,则没有显著性差异。

分别将表1.1.1和表1.1.3、表1.1.2和表1.1.4的数据导入SPSS软件运用Kolmogorov-Smirnov检验得到红葡萄酒和白葡萄酒的频率(频数)和检验统计量,如表1.2.1和表1.2.2所示:

表1.2.1:

红葡萄酒检验的频率和检验统计量

频率

g

N

sur

1.00

27

2.00

27

总数

54

检验统计量b

sur

最极端差别

绝对值

.407

.111

-.407

Kolmogorov-SmirnovZ

1.497

渐近显著性(双侧)

.023

MonteCarlo显著性(双侧)

显著性

.000a

95%置信区间

下限

.000

上限

.105

a.基于27个具有起始种子334431365的采样表。

b.分组变量:

g

 

表1.2.2:

白葡萄酒检验的频率和检验统计量

频率

g

N

sur

1.00

28

2.00

28

总数

56

检验统计量a

sur

最极端差别

绝对值

.357

.357

-.071

Kolmogorov-SmirnovZ

1.336

渐近显著性(双侧)

0.056

a.分组变量:

g

 

这里给出显著性水平

=0.06,从上面的表格可以看出,概率

值均小于显著性水平,所以拒绝零假设,认为两组结果有显著性差异。

通过上面两种检验方法,可以得出结论:

两组评酒员的评价结果均有显著性差异。

3.可信度的评判

对于可信度,我们用标准差进行评判。

因为标准差是反应一组数据离散程度最常用的一种量化形式,是表示精确度的重要指标,可以反映组内个体间的离散程度,即标准差小的表示数据的波动小,离散程度低,稳定性高,可信度高。

反之,则离散程度高,稳定性低,可信度小。

结合表1.1.1、表1.1.2、表1.1.3和表1.1.4的数据进行计算,得出两组评酒员对葡萄酒的评价结果的标准差,见表1.3.1。

 

表1.3.1两种葡萄酒评价的标准差

红葡萄酒

白葡萄酒

第一组

第二组

第一组

第二组

标准差

7.38

3.98

4.80

3.17

由表1.3.1的数据中可以看出,第二组评价结果的标准差均小于第一组,所以认为第二组的可信度高。

5.2问题二的求解

在处理此问题前,首先要对问题所给的数据(附件1,附件2)进行分析处理。

通过对葡萄理化指标资料的查找知道白藜芦醇由反式白藜芦醇,顺式白藜芦醇,反式白藜芦醇苷和顺式白藜芦醇苷等物质组成;黄醇酮由杨梅黄铜,槲皮素,山奈酚和异鼠李素组成;氨基酸由苏氨酸,丝氨酸等氨基酸组成;还原糖由葡萄糖和果糖组成,同时又因为我们通过对题目所给的二级指标数据求和后,与一级指标数据进行比较发现其值相同,故最终认为建模中我们只需考虑一级指标的理化性质即可。

接着根据附件2给出的色泽中

的数据,结合查找出的公式:

色泽饱和度

色调角

葡萄和葡萄酒的颜色指标为

可以求出酿酒葡萄所对应的颜色指标,如下表2.1.1,表2.1.2所示。

表2.1.1:

红葡萄的颜色指标

样品

1

2

3

4

5

6

7

8

9

颜色指标

7.08

6.55

6.79

8.35

6.78

6.04

6.73

6.54

7.18

样品

10

11

12

13

14

15

16

17

18

颜色指标

6.15

4.33

7.49

6.11

6.82

5.53

6.91

6.54

4.75

样品

19

20

21

22

23

24

25

26

27

颜色指标

6.52

6.65

6.47

7.41

6.59

6.83

6.28

6.17

6.01

表2.1.2:

白葡萄的颜色指标

样品

1

2

3

4

5

6

7

颜色指标

3.75

3.49

3.55

2.89

2.92

3.35

3.18

样品

8

9

10

11

12

13

14

颜色指标

4.16

3.49

3.42

3.18

3.66

3.63

3.12

样品

15

16

17

18

19

20

21

颜色指标

3.74

4.19

3.08

3.40

4.46

3.26

3.06

样品

22

23

24

25

26

27

28

颜色指标

3.78

3.05

3.47

3.87

3.23

3.19

2.81

又因为葡萄酒质量包括理化指标和感官指标,其中芳香物质属于感官指标,所以需要根据附件3对葡萄酒的芳香物质数据进行处理,如表2.1.3,表2.1.4所示:

表2.1.3:

红葡萄酒样品芳香物质的平均摩尔数

样品

1

2

3

4

5

6

7

8

9

摩尔数

4.91

4.56

3.82

3.55

3.89

4.63

3.24

3.94

3.55

样品

10

11

12

13

14

15

16

17

18

摩尔数

2.87

2.51

4.41

3.57

2.05

4.42

3.37

4.53

3.73

样品

19

20

21

22

23

24

25

26

27

摩尔数

3.56

3.27

3.69

5.16

3.83

4.65

2.96

3.2

4.51

表2.1.4:

白葡萄酒样品芳香物质的平均摩尔数

样品

1

2

3

4

5

6

7

摩尔数

4.39

3.19

7.43

4.42

3.75

4.73

2.37

样品

8

9

10

11

12

13

14

摩尔数

4.18

8.09

4

3.2

2.46

2.29

7.18

样品

15

16

17

18

19

20

21

摩尔数

3.78

1.34

5.41

2.52

4.46

6.57

4.82

样品

22

23

24

25

26

27

28

摩尔数

5.69

5.53

6.35

5.25

2.76

5.94

4.77

在问题二中葡萄酒的质量可选用评酒员对每种样品酒打分的分数平均值作为标准,由于问题一分析的第二组数据的可信度较高,所以分别选用红白葡萄酒评价的第二组数据进行分析,即表1.1.2,表1.1.4。

最后,根据对数据的处理,综合表1.1.2,表1.1.4,表2.1.1,表2.1.2,表2.1.3,表2.1.4,附件2,可以得到关于酿酒葡萄理化指标与葡萄酒质量的综合数据表,见附录1,附录2。

对于问题二,需要对酿酒葡萄进行分级。

考虑到影响酿酒葡萄的因素包括葡萄自身多种的理化性质,还有所酿成葡萄酒的标准对葡萄的要求等,为了分析各种因素之间的关系并对其进行分类,本文我们分别选用聚类分析法和主成分分析法处理此问题。

1.聚类分析法

聚类分析法是理想的多变量统计技术,主要有分层聚类和迭代聚类法。

聚类分析也称群分析、点群分析,是研究分类的一种多元统计方法。

根据附录1,附录2,分别将数据导入

软件,运用分层聚类法分别得到红白葡萄理化性质和与其对应的葡萄酒质量的群集成员表(见表2.2.1,表2.2.2)和树状图(见图2.2.1,图2.2.2):

表2.2.1:

红葡萄群集成员表

案例

1:

1

2:

2

3:

3

4:

4

5:

5

6:

6

7:

7

8:

8

9:

9

4群集

1

1

2

3

3

3

3

1

1

案例

10:

10

11:

11

12:

12

13:

13

14:

14

15:

15

16:

16

17:

17

18:

18

4群集

3

4

3

3

1

3

3

3

3

案例

19:

19

20:

20

21:

21

22:

22

23:

23

24:

24

25:

25

26:

26

27:

27

4群集

3

3

2

3

1

3

3

3

3

 

表2.2.2:

白葡

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 表格模板 > 合同协议

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1