高教社杯全国大学生数学建模竞赛葡萄酒的评价.docx

上传人:b****3 文档编号:5456806 上传时间:2022-12-16 格式:DOCX 页数:24 大小:457.41KB
下载 相关 举报
高教社杯全国大学生数学建模竞赛葡萄酒的评价.docx_第1页
第1页 / 共24页
高教社杯全国大学生数学建模竞赛葡萄酒的评价.docx_第2页
第2页 / 共24页
高教社杯全国大学生数学建模竞赛葡萄酒的评价.docx_第3页
第3页 / 共24页
高教社杯全国大学生数学建模竞赛葡萄酒的评价.docx_第4页
第4页 / 共24页
高教社杯全国大学生数学建模竞赛葡萄酒的评价.docx_第5页
第5页 / 共24页
点击查看更多>>
下载资源
资源描述

高教社杯全国大学生数学建模竞赛葡萄酒的评价.docx

《高教社杯全国大学生数学建模竞赛葡萄酒的评价.docx》由会员分享,可在线阅读,更多相关《高教社杯全国大学生数学建模竞赛葡萄酒的评价.docx(24页珍藏版)》请在冰豆网上搜索。

高教社杯全国大学生数学建模竞赛葡萄酒的评价.docx

高教社杯全国大学生数学建模竞赛葡萄酒的评价

2011高教社杯全国大学生数学建模竞赛

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们参赛选择的题号是(从A/B/C/D中选择一项填写):

我们的参赛报名号为(如果赛区设置报名号的话):

所属学校(请填写完整的全名):

参赛队员(打印并签名):

1.

2.

3.

指导教师或指导教师组负责人(打印并签名):

日期:

年月日

 

赛区评阅编号(由赛区组委会评阅前进行编号):

2011高教社杯全国大学生数学建模竞赛

编号专用页

 

赛区评阅编号(由赛区组委会评阅前进行编号):

 

赛区评阅记录(可供赛区评阅时使用):

 

 

全国统一编号(由赛区组委会送交全国前编号):

 

全国评阅编号(由全国组委会评阅前进行编号):

 

葡萄酒的评价

摘要

本文是对葡萄酒的评价分析,葡萄酒的评价是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

而葡萄酒的质量由很多因素决定,比如酿酒技术,酿酒条件,窖藏年份……我们主要考虑葡萄酒和酿酒葡萄检测的理化指标对葡萄酒质量的影响。

本论文通过对酿酒葡萄与葡萄酒的理化指标之间的相关关系和评酒员打分进行了深入系统地分析,给出了葡萄酒质量评价的量化研究。

针对问题一:

我们用Excel中方差计算函数对附件1中两组评酒员的评价结果的平均方差进行计算,由于组数的多少对于评价的结果不会有影响,所以我们选择红葡萄酒的数据进行比较。

通过对各组对于各评价指标平均方差进行比较,方差小的较为可信。

结果表明第二组评酒员的评价结果更可信。

针对问题二:

我们用计算综合得分的方法对酿酒葡萄的理化指标和葡萄酒的质量之间的关系进行了分析。

我们假设酿酒葡萄的理化指标对酿酒葡萄的影响最终会体现到葡萄酒的质量上来。

所以我们对葡萄酒根据外观,口感,和香气的平均得分进行排名,然后计算综合得分,进而对葡萄进行分类。

针对问题三:

我们用关联分析的方法对葡萄与葡萄酒的理化指标之间的联系进行了分析,我们通过Excel建立相对应的理化指标的走势折线图,然后用关联分析计算对应的理化指标的关联度,关联度表示对应的理化指标的亲密程度。

针对问题四:

我们用建立多元线性回归模型的方法对酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响进行了分析,结果发现酿酒葡萄和葡萄酒中的一些理化指标会对葡萄酒的质量产生一定的影响但是影响的显著性并不明显,所以我们认为不能仅仅用酿酒葡萄和葡萄酒中的理化指标来评价葡萄酒的质量,要综合一些其他因素进行评价。

 

关键词:

T检验主成分分析关联分析多元线性回归

一、问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果。

附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

我们用数学模型讨论下列问题:

1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

 

二、问题的分析

数据分析:

葡萄酒的质量是通过各评酒员的评价的总分决定的,总分100分,评价指标有九种,评酒员有十组,葡萄酒分为白葡萄酒和红葡萄酒(其中白葡萄酒有28种样品,红葡萄酒有27种样品),葡萄分为白葡萄和红葡萄(白,红葡萄具有相同的指标)。

问题一分析:

问题一要求分析评酒员评价的差异和可信度。

其中两组评酒员所评价的酒的质量是一定的,之所以会出现差异是因为评酒员自身的爱好,经验,心情。

等主观因素的影响,所以判断可信度就是要找出差异较小的那一组。

问题二分析:

问题二要求我们根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

由于酿酒葡萄的理化指标对酿酒葡萄的影响最终会体现到葡萄酒的质量上来,所以我们可以通过主成分分析法和聚类分析的方法对葡萄的质量数据化,从而比较葡萄的质量。

问题三分析:

问题三要求我们分析酿酒葡萄与葡萄酒的理化指标之间的联系,我们可以根据问题一二得到的分析结果和附件二三中葡萄酒各指标数值建立数学模型对两者之间的联系进行关联度分析。

问题四分析:

问题四要求我们分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

根据问题三的分析结果继续分析两者对葡萄酒质量的影响,确定酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响关系,或者根据问题一中葡萄酒的评分和葡萄酒的理化指标建立线性回归模型,来确定酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响关系,然后根据关系论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

 

三、模型假设

假设1:

由于附表中给出了28中白葡萄酒和28中白葡萄样本,给出了27中红葡萄酒和27中红葡萄样本,所以我们假设一种葡萄酒是用对应的一种葡萄样本酿出的。

假设2:

假设各种葡萄酒与酿酒葡萄之间的联系是相同的,即红葡萄酒与白葡萄酒与其各理化指标之间的联系是相同的

 

四、符号说明

表示第j个指标的评价方差

表示第i个评酒员对第j个指标的评分

表示葡萄样品和葡萄酒第i个理化指标之间的最大差值

表示葡萄样品和葡萄酒第i个理化指标之间的最小差值

表示葡萄样品和葡萄酒第i个理化指标之间的关联系数

表示葡萄样品和葡萄酒第i个理化指标之间的关联度

分辨系数

五、模型的建立与求解

5.1问题一的模型建立和求解:

模型的建立:

通过Excel中的方差计算函数计算各各组对各评价指标的方差:

(n=1,2,…10)

求解结果如下表:

红葡萄酒品尝评分表

样品编号

1

2

3

4

5

6

7

8

9

10

第一组

62.7

80.3

80.4

68.6

73.3

72.2

71.5

72.3

81.5

74.2

第二组

68.1

74

74.6

71.2

72.1

66.3

65.3

66

78.2

68.8

样品编号

11

12

13

14

15

16

17

18

19

20

第一组

70.1

53.9

74.6

73

58.7

74.9

79.3

59.9

78.6

79.2

第二组

61.1

68.3

68.8

72.6

65.7

69.9

74.5

65.4

72.6

75.8

样品编号

21

22

23

24

25

26

27

第一组

77.1

77.2

85.6

78

69.2

73.8

73

第二组

72.2

71.6

77.1

71.5

68.2

72

71.5

提出假设

(两组酒员的两组评价结果没有显著差异)

(两组酒员的两组评价结果有显著差异)

利用Excel表格进行T检验,结果如下表:

 

第一组

第二组

平均

73.07778

70.4963

方差

54.18333

16.17652

观测值

27

27

假设平均差

0

df

40

tStat

1.599147

P(T<=t)单尾

0.058829

t单尾临界

1.683851

P(T<=t)双尾

0.117658

t双尾临界

2.021075

 

可得出结论:

所以拒绝原假设

,说明对于红葡萄酒,两组评酒员的评价结果有显著性差异。

同理对两组评酒员对28种白酒样品的评价结果的差异性进行分析。

白葡萄酒品尝评分表

样品编号

1

2

3

4

5

6

7

8

9

10

第一组

82

74.2

78.3

79.4

71

68.4

77.5

70.4

72.9

74.3

第二组

77.9

75.8

75.6

76.9

81.5

75.5

74.2

72.3

80.4

79.8

样品编号

11

12

13

14

15

16

17

18

19

20

第一组

72.3

63.3

65.9

72

72.4

74

78.8

73.1

72.2

77.8

第二组

71.4

72.4

73.9

77.1

78.4

67.3

80.3

76.7

76.4

76.6

样品编号

21

22

23

24

25

26

27

28

第一组

76.4

71

75.9

73.3

77.1

81.3

64.8

81.3

第二组

72.2

79.4

77.4

76.1

79.5

74.3

77

79.6

提出假设

(两组酒员的两组评价结果没有显著差异)

(两组酒员的两组评价结果有显著差异)

利用Excel表格进行F检验结果如下表:

 

第一组

第二组

平均

73.975

76.28214

方差

23.30787

10.42152

观测值

28

28

假设平均差

0

df

47

tStat

-2.10208

P(T<=t)单尾

0.020466

t单尾临界

1.677927

P(T<=t)双尾

0.040932

t双尾临界

2.011741

 

可得出结论:

所以拒绝原假设

,说明对于红葡萄酒,两组评酒员的评价结果有显著性差异。

因此可以说两组评酒员的评价结果有显著性差异。

各组对各评价指标的平均方差

澄清度

色调1

纯正度1

浓度1

质量

纯正度

浓度

持久性

质量

整体评价

第一组

0.508

2.321

0.823

1.370

2.821

0.808

1.584

0.632

5.449

0.642

第二组

0.397

2.076

0.471

1.177

1.848

0.444

1.278

0.588

3.467

0.404

(注:

为了区分我们对外观的色调,纯正度和浓度进行了区别标识)

由上表可以看出,第二组各组对各评价指标的平均方差明显小于第一组,所以第二组的评价值更可信一些。

5.2问题二的模型建立和求解:

模型建立:

数据分析过程中,需要分析多个变量之间的因果关系,而变量之间信息的高度重叠和高度相关会给统计数据带来许多障碍,因此本题考虑采用主成分分析法来有效地降低变量维数。

1、标数据的标准化采集p维随机向量

个样品

构造样本针,对本阵元素进行如下标准化变换:

其中

得标准化阵

2、对标准化阵

求相关系数矩阵:

其中,

3、解样本相关矩阵

的特征方程

得p个特征根,确定主成按

确定m值,使信息的利用率达

以上,对每个

解方程组

得单位特征向量

4、化后的指标转换为主成分:

称为第一主成分,

称为第二主成分,…,

称为第p主成分。

5、对m个主成分进行综合评价:

对m个主成分进行加权求和,既得最终评价值,权数为每个主成分的方差贡献率。

红酒:

应用MATLAB对34个酿酒葡萄的指标以及评分员对各样品葡萄酒质量的平均值经主成分分析后,得到9个主成分,累计贡献率为85.2534%。

MATLAB输出结果见表一。

根据综合得分的疏密程度对样品进行等级划分如表二。

(代码见附表二)

输出结果:

排名:

392111212381422161351917246122018157262741025

综合得分:

1.58111.48631.22840.99110.97110.86750.4770.42510.38770.12210.1133-0.0491-0.0778-0.1281-0.2655-0.3116-0.3514-0.413-0.5265-0.5282-0.5789-.6053-0.64-0.7551-0.8354-1.0998-1.4851

表一、综合得分及排名

样品编号

1

2

3

4

5

6

7

8

9

10

综合得分

0.9911

1.2284

1.5811

-0.8354

-0.0778

-0.3514

-0.6053

0.4251

1.4863

-1.0998

综合排名

4

3

1

25

13

17

22

8

2

26

样品编号

11

12

13

14

15

16

17

18

19

20

综合得分

0.9711

-0.413

-0.0491

0.3877

-0.5789

0.1133

-0.2655

-0.5382

-0.1281

-0.5265

综合排名

5

18

12

9

21

11

15

20

14

19

样品编号

21

22

23

24

25

26

27

综合得分

0.8675

0.1221

0.477

-0.3116

-1.4851

-0.64

-0.7551

综合排名

6

10

7

16

27

23

24

表二、等级划分(注:

第一类最好,以此类推)

分类

葡萄样品的编号

第一类

1、2、3、9、11、21

第二类

8、14、23

第三类

4、5、6、7、10、12、13、15、16、17、18、19、20、22、24、26、27

第四类

25

白葡萄

用同样的方法对白葡萄进行分析,综合得分及排名如表三所示,等级划分见表四。

表三、综合得分及排名

样品编号

1

2

3

4

5

6

7

8

9

10

综合得分

-0.9265

-0.3112

0.3403

-0.1984

0.445

0.1267

0.249

-1.1868

0.2629

0.1954

综合排名

26

21

6

18

4

13

8

28

7

11

样品编号

11

12

13

14

15

16

17

18

19

20

综合得分

-0.3174

-0.0117

-0.5064

-0.2798

-0.2731

-0.9831

-0.6684

-0.1462

-0.4848

0.2247

综合排名

22

14

24

20

19

27

25

15

23

9

样品编号

21

22

23

24

25

26

27

28

综合得分

-0.1798

-0.1612

0.1697

1.0141

0.2211

0.353

2.3358

0.6972

综合排名

17

16

12

2

10

5

1

3

表四、等级划分(注:

第一类最好,以此类推)

分类

葡萄样品的编号

第一类

3、5、6、7、9、10、12、20、23、24、25、26、27、28

第二类

4、18、21、22

第三类

2、11、13、14、15、17、19

第四类

1、8、16

5.3问题三的模型建立和求解:

由于附录2所给的葡萄酒的理化指标只有九种所以我们从酿酒葡萄中拿出相对应的理化指标进行相关性比较。

(注:

根据假设2只对红葡萄酒进行分析)

相关系数不是等距的度量值,因此在比较相关程度时,只能说绝对值大者比绝对值小者相关更密切一些,如只能说相关系数r=0.50的两列数值比相关系数r=0.25的两列数值之间的关系程度更密切,而绝不能说前二者的密切程度是后二者密切程度的两倍。

也不能说相关系数从0.25到0.50与从0.50到0.75所提高的程度一样多。

存在相关关系,即相关系数取值较大的两类事物之间,不一定存在因果关系,这一点要从事物的本质方面进行分析绝不可简单化。

模型的建立:

=0.5

花色苷

(注:

红色为葡萄酒,蓝色为酿酒葡萄下同)

关联度:

0.7886

 

单宁

关联度:

0.6652

 

总酚

关联度0.7579

酒总黄酮

关联度0.7378

 

白藜芦醇

关联度:

0.8502

DPPH

关联度0.7341

 

L

关联度0.6498

A

关联度:

0.4206

 

B

关联度:

0.5530

根据折线图和葡萄酒与酿酒葡萄之间的关联度可以得出葡萄酒与酿酒葡萄理化指标之间的联系:

其中葡萄酒与酿酒葡萄花色苷,总酚酒,总黄酮,白藜芦醇,DPPH半抑制体积这几个理化指标之间的联系较为密切,单宁,果皮颜色(L,a,b)几个理化指标之间的联系不是很密切。

5.4问题四的模型建立和求解:

模型的建立:

1.以第二组评酒员的平均评分为自变量,以葡萄酒的各理化指标为因变量用spss建立多元线性回归模型:

表一

表二

表三

根据表二可以看出显著性概率是0.815>0.5,表明模型建立失败

根据表三可以看出花色苷,L,b三者的显著性概率小于0.5所以可以按下表重建模型

VariablesEntered/Removed

Model

VariablesEntered

VariablesRemoved

Method

1

b,L,花色苷a

.

Enter

a.Allrequestedvariablesentered.

表一

 

ANOVAb

Model

SumofSquares

df

MeanSquare

F

Sig.

1

Regression

53.435

3

17.812

1.892

.159a

Residual

216.530

23

9.414

Total

269.965

26

a.Predictors:

(Constant),b,L,花色苷

b.DependentVariable:

质量

表二

Coefficientsa

Model

UnstandardizedCoefficients

StandardizedCoefficients

t

Sig.

B

Std.Error

Beta

1

(Constant)

91.009

6.422

14.171

.000

花色苷

-.013

.007

-.929

-2.000

.057

L

-.148

.067

-.982

-2.201

.038

b

-.241

.113

-.569

-2.134

.044

a.DependentVariable:

质量

表三

根据表二得显著性概率小于0.5,但显著性不是很明显

所以可以根据表三建立线性回归模型(

(花色苷),

(L),

(b)):

线性回归方程Y=91.009-0.13

-0.148

-0.241

2.以第二组评酒员的平均评分为自变量,以葡萄酒的各理化指标为因变量用spass建立多元线性回归模型:

ANOVAd

Model

SumofSquares

df

MeanSquare

F

Sig.

1

Regression

55.120

1

55.120

6.414

.018a

Residual

214.845

25

8.594

Total

269.965

26

2

Regression

107.946

2

53.973

7.995

.002b

Residual

162.019

24

6.751

Total

269.965

26

3

Regression

133.380

3

44.460

7.487

.001c

Residual

136.585

23

5.938

Total

269.965

26

a.Predictors:

(Constant),柠檬酸

b.Predictors:

(Constant),柠檬酸,单宁

c.Predictors:

(Constant),柠檬酸,单宁,果穗质量

d.DependentVariable:

质量

上表是逐步回归每一步的回归模型的方差分析表,F值为7.487,显著性概率是0.01>0.5,表明回归较为显著。

Coefficientsa

Model

UnstandardizedCoefficients

StandardizedCoefficients

t

Sig.

B

Std.Error

Beta

1

(Constant)

78.332

1.027

76.291

.000

柠檬酸

-1.973

.779

-.452

-2.533

.018

2

(Constant)

75.710

1.306

57.958

.000

柠檬酸

-2.363

.704

-.541

-3.354

.003

单宁

.220

.079

.451

2.797

.010

3

(Constant)

73.762

1.545

47.741

.000

柠檬酸

-2.339

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1