数学建模A题葡萄酒评价国家奖.docx

上传人:b****6 文档编号:3661385 上传时间:2022-11-24 格式:DOCX 页数:68 大小:349.08KB
下载 相关 举报
数学建模A题葡萄酒评价国家奖.docx_第1页
第1页 / 共68页
数学建模A题葡萄酒评价国家奖.docx_第2页
第2页 / 共68页
数学建模A题葡萄酒评价国家奖.docx_第3页
第3页 / 共68页
数学建模A题葡萄酒评价国家奖.docx_第4页
第4页 / 共68页
数学建模A题葡萄酒评价国家奖.docx_第5页
第5页 / 共68页
点击查看更多>>
下载资源
资源描述

数学建模A题葡萄酒评价国家奖.docx

《数学建模A题葡萄酒评价国家奖.docx》由会员分享,可在线阅读,更多相关《数学建模A题葡萄酒评价国家奖.docx(68页珍藏版)》请在冰豆网上搜索。

数学建模A题葡萄酒评价国家奖.docx

数学建模A题葡萄酒评价国家奖

葡萄酒的评价

摘要

本文主要运用统计分析方法,解决与所酿葡萄酒有关的问题。

对于问题一,,分别对白酒和红酒的两组数据进行差异性检验。

构建一个能反应葡萄酒本身质量的量,对两组数据分别进行相关性分析,得到第二组评酒员的结果更可信。

对于问题二,先做聚类分析,再做线性回归分析,得到白、红葡萄分为4级和3级。

对于问题三,利用问题二中聚类得到的7个主成分,把每种葡萄酒的理化指标与酿酒葡萄之间的7个主成分进行相关性分析,得到7个回归方程,即为酿酒葡萄与葡萄酒的理化指标之间的联系。

对于问题四,首先建立模型:

其中a,b分别为酿酒葡萄和葡萄酒对葡萄酒质量的贡献率,

分别为两种因素的贡献值。

然后,通过确定芳香物质是否对葡萄酒的评分有影响来论证能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。

问题一中,本文运用excel做两组数据的显著性差异检验,得到两组评酒员在评论白酒和红酒都存在显著性差异,且通过了F检验。

接着本文通过确定各指标的权重,构建一个能反应各葡萄酒实际平分的量,把两组数据与之做相关性分析,发现第二组与之相关性更大,故第二组评酒员的结果更可信。

问题二中,本文通过SPSS做理化指标的聚类分析,得到7个主成分;再做指标与评分的线性回归分析,得到白葡萄的分级结果为4级:

一级:

白酿酒葡萄14,22;

二级:

白酿酒葡萄4,5,9,19,23,25,26,28;

三级:

白酿酒葡萄24,27;

四级:

白酿酒葡萄1,2,3,6,7,8,10,11,12,13,15,16,17,18,20。

红葡萄酒为3级:

一级:

红酿酒葡萄2,9;

二级:

红酿酒葡萄3,4,10,22,24;

三级:

红酿酒葡萄

1,5,6,7,8,11,12,13,14,15,16,17,18,19,20,21,23,25,26,27。

问题三中,本文运用excel将葡萄酒的一级指标分别与7个主成分进行相关

性分析然后对每种主要成分利用SPSS进行线性回归分析得到以下7个回归方程:

即为每种酿酒葡萄与葡萄酒理化指标之间的联系。

问题四中,建立模型:

对模型运用线性回归的方法,得到红色葡萄酒中红色酿酒葡萄和葡萄酒对葡萄酒质量的影响方程为:

白色葡萄酒中酿酒白葡萄对葡萄酒质量的影响力为:

;白葡萄酒的理化指标对葡萄酒的质量无影响。

考虑到葡萄酒的评分与芳香物质有关,于是通过单独确定芳香物质是否对葡萄酒的评分有影响来论证能否用葡萄喝葡萄酒的理化指标评价葡萄酒的质量。

最终得到能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

关键词:

聚类分析主成分分析多元线性回归spssexcel

 

一、问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件中给出了某一年份一些葡萄酒的评价结果以及该年份这些葡萄酒的和酿酒葡萄的成分数据。

建立数学模型讨论下列问题:

1.

(1)分析附件1中两组评酒员的评价结果有无显著性差异;

(2)两组评酒员哪一组结果更可信?

2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

二、模型假设

1.假设所给附件中,数据均准确可靠。

三、符号说明

四组数据的偏度值。

四组数据的峰度值。

,则假设两组品酒员的两组评价结果无显著差异。

不相等,则假设两组品酒员的两组评价结果有显著差异。

:

相关系数。

回归方程。

四、问题分析

4.1第一问需要根据附件1中给出的两组评酒员的评价结果数据,判断两组评价结果有无显著性差异,在判断哪一组结果更可信。

本文用Excel对两组评价结果进行方差分析,直接比较输出结果即可得出有无显著性差异的结论。

但是能够进行方差分析的先决条件是数据满足正态分布,所以实现要验证四组将进行方差分析的四组数据是否满足正态分布。

对于可信度的判断,本文将从选取葡萄酒样品的一级指标进行权重分析,将权重与一级指标进一步计算得到新的权值,再将这组权值与两组评酒员的评价结果的平均值进行相关分析,对得到的相关系数作比较即可判断可信度的高低。

为了更全面的考虑其可信度,本文也会对其标准差进行对比,双重验证其可信度。

4.2用相关分析法和主成分分析法将用于计算的酿酒葡萄理化指标进行了筛选,最终确定的7个主成分所包含的成分指标基本可以代表所有测定的成分指标。

用SPSS求出红酿酒葡萄和白酿酒葡萄的多元线性回归方程,用聚类分析法绘制树状聚类图,再利用回归方程,对酿酒葡萄进行分级。

4.3要分析酿酒葡萄与葡萄酒的理化指标之间的联系,用SPSS将葡萄酒的一级指标分别与酿酒葡萄的7个主成分进行相关性分析,建立回归方程,既能说明酿酒葡萄与葡萄酒的理化指标之间的联系。

 

五、模型的建立与求解

5.1对第一问求解

5.1.1

(1)

分析判断附件一中两组评酒员的评价结果有无显著性差异,利用双因素方差分析,以红酒为例,将问题转述为:

分析第一组和第二组评酒员对27种红酒样品的评价结果有无显著差异性。

要利用双因素方差分析,首先数据要满足正态分布。

判断数据是否满足正态分布可以根据其偏度和峰度来衡量。

偏度:

峰度:

偏度反应分布的对称性。

称为右偏态,此时数据位于均值右边的比位于左边的多;

称为左偏态,情况相反;而

接近于

则可认为分布是对称的。

峰度是分布形状的另一种度量。

正态分布的峰度为

,若

大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数据,因而峰度可用作衡量偏离正态分布的尺度之一。

用Matlab计算出四组数据的偏度与峰度:

对于红葡萄酒,第一组评酒员的评价结果

第二组评酒员的评价结果

对于白葡萄酒,第一组评酒员的评价结果

第二组评酒员的评价结果

为四组数据的偏度值,

为四组数据的峰度值。

四组偏度值均趋近于

,四组峰度值均趋近于3,所以可以认为方差分析要使用到得四组数据均服从正态分布。

5.1.1

(2)

现在可以进行差异性的分析。

①先准备表格(见表1)。

表1红葡萄酒品尝评分表

红葡萄酒样品

1

2

3

4

24

25

26

27

第一组

62.7

80.3

80.4

68.6

78

69.2

73.8

73

第二组

68.1

74

74.6

71.2

71.5

68.2

72

71.5

白葡萄酒样品

1

2

3

4

25

26

27

28

第一组

82

74.2

78.3

79.4

77.1

81.3

64.8

81.3

第二组

77.9

75.8

75.6

76.9

79.5

74.3

77

79.6

②然后提出假设

(两组品酒员的两组评价结果无显著差异)

不相等(两组品酒员的两组评价结果有显著差异)

③最后在Excel内进行计算,输出结果见表2。

表2红葡萄酒样品评价结果的方差分析的Excel输出结果

差异源

SS

df

MS

F

P-value

Fcrit

88.67852

1

88.67852

6.140657

0.020027

4.225201

1444.729

26

55.56651

3.847774

0.000507

1.929213

误差

375.4715

26

14.44121

总计

1908.879

53

可得出结论:

,拒绝原假设

,说明对于红葡萄酒,两组评酒员的评价结果有显著性差异。

同理对两组评酒员对28种白酒样品的评价结果的差异性进行分析。

进行方差分析的Excel输出结果见表3。

表3白葡萄酒样品评价结果的方差分析的Excel输出结果

差异源

SS

df

MS

F

P-value

Fcrit

89.00643

1

89.00643

6.890355

0.014093

4.210008

545.8343

27

20.21608

1.56501

0.12544

1.904823

误差

348.7736

27

12.91754

总计

983.6143

55

可得出结论:

,拒绝原假设,说明对于白葡萄酒,两组评酒员的评价结果有显著性差异。

现综合对两组评酒员对葡萄酒的评价结果的差异性进行分析,其方差分析的输出结果见表4。

表4两种葡萄酒评价结果综合方差分析的输出结果

差异源

SS

df

MS

F

P-value

Fcrit

0.017818

1

0.017818

0.001067

0.974064

4.019541

2322.559

54

43.01035

2.57515

0.000339

1.570884

误差

901.9122

54

16.70208

总计

3224.489

109

可得出结论:

,接受原假设,说明两组评酒员虽然对于红葡萄酒和白葡萄酒的品评上虽存在显著差异,但综合来看两组评酒员的综合评价结果并无显著性差异。

5.1.2判断结果的可信度

先对红葡萄酒的评价结果的可信度进行分析。

在葡萄酒的理化指标中,选取一级指标进行权重分析,其中多次测量的数据取其平均值。

通过简单计算可以得到各一级指标的所占权重如表5。

表5红葡萄酒理化指标中各一级指标权重表

花色苷

单宁

总酚

酒总黄酮

白藜

DPPH

色泽

平均值

263.8990

7.2660

6.2650

4.8970

3.6300

0.2230

41.0870

50.3730

22.0810

标准差

230.0348

2.9044

2.5254

2.9850

2.8941

0.1275

21.3687

13.2688

7.5975

变异系数

0.8717

0.3997

0.4031

0.6095

0.7972

0.5706

0.5201

0.2634

0.3441

权重

0.1824

0.0836

0.0843

0.1275

0.1668

0.1194

0.1088

0.0551

0.0720

将每种葡萄酒样品一级理化指标的数值分别与其一级指标所占权重相乘再相加,得到一组由27个数值新构成的权值。

再将这组权值与两组评酒员的评价结果的平均值进行相关分析,数据表见附录一。

运用Excel数据分析,得到结果为,对于红葡萄酒,第一组的评分结果与评分权值的相关系数为

,第二组的评分结果与评分权值的相关系数为

,可见第二组评分结果与评分权值的相关性强于第一组,可以认为第二组对红葡萄酒的评分结果更可信。

对于白葡萄酒,第一组的评分结果与评分权值的相关系数为

,第二组的评分结果与评分权值的相关系数为

,可以看出,

,第一组的评分结果与评分权值相关性比第二组的强,但由于是负相关,相关性越弱越好,所以可以认为,第二组对白葡萄酒的评分结果更可信。

为更全面的说明评分结果的可信性,本文对评分结果的稳定性也做了调查。

第一组对红葡萄酒的评分结果的标准差为

,第二组为

;第一组对白葡萄酒的评分结果的标准差为

,第二组为

,可见第二组评酒员评价结果的稳定性高于第一组评酒员的评价结果。

在其评价结果的稳定性上再次证明了第二组评酒员评价结果的可信度。

综上所述,可以得出结论,即第二组的评分结果更可信。

5.2对第二问求解

5.2.1相关性分析

在数据分析的过程中,需要分析两个或两个以上变量之间的因果关系,本文采用相关性分析方法,它不需要区分自变量和因变量,两个或者多个变量之间是平等的关系,通过相关分析可以了解变量之间的关系密切程度。

分析附件二的酿酒葡萄的理化指标,将一级指标作为研究对象,一级指标共27组数据。

对29列数据进行相关性分析,得出的数据见附录二。

选取相关系数要求大于0.2,相关系数大于0.2的酿酒葡萄指标按相关性大小依次为黄酮,总酚,DPPH,PH,蛋白质,单宁,出汁率,酒石酸,固酸比,花色苷,黄酮醇,果皮质量,果穗质量。

5.2.2主成分分析

进行主成分分析是将多项指标重新组合成一组新的互无关系的几个综合指标,已达到尽可能多的反映原指标信息的分析方法。

应用SPSS对20个酿酒葡萄的指标经主成分分析后,得到7个主成分,累计贡献率为

SPSS输出结果见表6,整理数据得到表7,经分析比较,得酿酒红葡萄指标的主成分分析结果见表8。

表6酿酒红葡萄主成分分析SPSS输出结果

Component

InitialEigenvalues

ExtractionSumsofSquaredLoadings

Total

%ofVariance

Cumulative%

Total

%ofVariance

Cumulative%

1

5.759

28.795

28.795

5.759

28.795

28.795

2

3.443

17.214

46.009

3.443

17.214

46.009

3

2.462

12.311

58.320

2.462

12.311

58.320

4

1.767

8.833

67.152

1.767

8.833

67.152

5

1.323

6.613

73.766

1.323

6.613

73.766

6

1.195

5.974

79.740

1.195

5.974

79.740

7

1.110

5.548

85.288

1.110

5.548

85.288

8

.632

3.158

88.446

9

.521

2.605

91.051

10

.490

2.448

93.498

11

.378

1.889

95.387

12

.309

1.545

96.932

13

.229

1.144

98.076

14

.156

.780

98.856

15

.107

.534

99.391

16

.042

.212

99.603

17

.031

.155

99.758

18

.027

.136

99.894

19

.018

.088

99.982

20

.004

.018

100.000

ExtractionMethod:

PrincipalComponentAnalysis.

1

2

3

4

5

6

7

VAR00001

.762

.144

-.361

.196

.136

-.128

-.002

VAR00002

.807

-.001

.446

.063

-.180

.153

.064

VAR00003

.356

.433

-.231

.156

.290

-.089

-.653

VAR00004

.193

.321

.803

.047

-.251

.270

.080

VAR00005

.178

.480

.404

.441

.282

-.030

-.412

VAR00006

.210

-.184

.527

.511

-.064

-.183

.248

VAR00007

.891

-.006

-.137

-.145

.187

.017

.192

VAR00008

.911

-.081

.038

-.267

-.036

.023

-.013

VAR00009

.762

-.201

.322

-.223

.216

.036

-.070

VAR00010

.833

-.122

-.072

-.299

.124

.163

-.010

VAR00011

.049

.778

-.118

-.224

.249

-.024

.390

VAR00012

.468

.039

.170

.138

.409

-.540

.291

VAR00013

.428

.155

-.716

-.017

-.233

.021

.060

VAR00014

-.420

-.497

.345

-.450

.304

.066

-.210

VAR00015

.399

.489

-.097

.463

-.343

.127

.019

VAR00016

-.097

-.276

-.358

.539

.272

.580

.114

VAR00017

.618

-.204

-.012

-.196

-.080

.414

-.090

VAR00018

-.103

-.621

-.028

.351

.507

.232

.210

VAR00019

-.408

.774

-.028

-.222

.228

.155

.221

VAR00020

-.279

.765

.226

-.146

.246

.335

.026

表7酿酒红葡萄SPSS输出数据整理表

1

2

3

4

5

6

7

蛋白质

0.762396

0.143912

-0.36076

0.195734

0.135569

-0.12757

-0.002

花色苷

0.8074

-0.00074

0.445957

0.062771

-0.18028

0.152747

0.063521

酒石酸

0.355822

0.432512

-0.23138

0.156473

0.289506

-0.089

-0.6528

苹果酸

0.192972

0.321208

0.80261

0.047012

-0.25066

0.270393

0.08049

柠檬酸

0.17818

0.479589

0.403785

0.44087

0.281629

-0.03031

-0.41245

多酚氧化

0.209692

-0.18403

0.527325

0.51132

-0.06433

-0.18338

0.247611

DPPH

0.89127

-0.00579

-0.13714

-0.14515

0.186672

0.017144

0.192185

总酚

0.91087

-0.081

0.038169

-0.26698

-0.03579

0.023419

-0.0133

0.76204

-0.20095

0.321643

-0.2232

0.216064

0.036447

-0.06961

黄酮

0.83332

-0.12216

-0.07173

-0.29942

0.123968

0.163026

-0.01027

白藜

0.0492

0.77762

-0.11766

-0.2242

0.248905

-0.02442

0.389812

黄酮醇

0.467749

0.039491

0.170204

0.138029

0.408693

-0.54015

0.290515

PH

0.427846

0.154757

-0.716

-0.01712

-0.23335

0.020727

0.06041

可滴定酸

-0.42003

-0.49724

0.345432

-0.45041

0.303941

0.065967

-0.21038

固酸比

0.399278

0.489407

-0.09675

0.462655

-0.3433

0.12731

0.018977

果穗质量

-0.09735

-0.27613

-0.35828

0.539369

0.272061

0.57968

0.114497

出汁率(%)

0.618455

-0.20412

-0.01246

-0.19603

-0.08019

0.413829

-0.09013

果皮质量

-0.10264

-0.621

-0.02832

0.351306

0.50696

0.232294

0.210325

a*

-0.40818

0.77439

-0.0277

-0.22182

0.227819

0.155174

0.220655

b*

-0.27892

0.76545

0.226222

-0.14647

0.245896

0.334935

0.026259

表8酿酒红葡萄指标的主成分分析结果

主成分

包含成分名称

贡献率(%)

第一主成分

花色苷,DPPH,总酚,黄铜

28.795

第二主成分

白藜,a*,b*

46.009

第三主成分

苹果酸,PH

58.320

第四主成分

多酚氧化

67.152

第五主成分

果皮质量

73.766

第六主成分

果穗质量

79.740

第七主成分

酒石酸

85.288

表8表明,7个主成分所包含的成分指标基本可以代表所有测定的成分指标。

5.2.3回归方程

选择用评酒员评价结果作为葡萄酒质量的表示值,第一问已经求出第二组评酒员的评价结果更可信,所以在此问中以第二组评分作为因变量,7组主成分作为自变量进行多元线性分析。

其计算数据表见表9。

表9计算红酿酒葡萄多元线性回归方程预备表

红葡萄

第二组评分

1

68.1

366.0584

3.2877

12.0664

17.2585

0.0558

106.0401

-1.3448

2

74

228.9272

3.3484

0.9841

15.8018

0.0826

47.3131

-6.4822

3

74.6

285.1294

4.0737

-0.4240

9.8700

0.0862

48.1884

-5.2746

4

71.2

96.7920

3.7949

1.8419

7.9428

0.0882

79.9779

-2.4610

5

72.1

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1