数学建模A题目关于葡萄酒质量的评价.docx
《数学建模A题目关于葡萄酒质量的评价.docx》由会员分享,可在线阅读,更多相关《数学建模A题目关于葡萄酒质量的评价.docx(25页珍藏版)》请在冰豆网上搜索。
数学建模A题目关于葡萄酒质量的评价
2012高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
A
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
参赛队员(打印并签名):
1.
2.
3.
指导教师或指导教师组负责人(打印并签名):
数模组
日期:
2012年09月10日
赛区评阅编号(由赛区组委会评阅前进行编号):
2012高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
评
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
葡萄酒的评价
摘要
本文对葡萄酒的评价结果、葡萄的分级、葡萄和葡萄酒的理化指标之间的关系等,进行定量分析并确定合理的评价指标体系。
针对问题一,利用SPSS13.0对两组评酒员的评价结果进行配对比较分析,结果说明有显著性差异,再根据变异系数,得出第二组的结果更可信。
针对问题二,采用第二组评酒员对葡萄酒的评价结果作为根据,以组距(组距=(最大值-最小值)÷组数)为标准对葡萄酒划分为3或4个等级,然后以葡萄的理化指标为辅,综合两者的结果来对酿酒葡萄进行分级。
通过主成分分析和聚类分析将酿酒葡萄的理化指标进行分类,根据各主成份在葡萄样品中的理化指标的标准化值与贡献率的乘积之和:
来确定各酿酒葡萄品质的高低,最后将红葡萄分为3级,白葡萄分为4级。
针对问题三,先根据酿酒葡萄和葡萄酒所共有的理化指标之间的关系强度大小进行相关性分析,进而得到各个理化指标之间的相关关系及关系的强弱程度,再采用线性回归分析法求出共有的理化指标的回归方程,从而进一步阐述了这些理化指标之间的关系,最后较全面地分析出了葡萄和葡萄酒的理化指标之间的联系。
针对问题四,先通过主成分分析和聚类分析将酿酒葡萄的理化指标进行简化,求出各主成分中的各个理化指标的贡献率,再以这些贡献率作为自变量,以第二组品酒员的品酒得分作为因变量,进行非线性曲线拟和的相关性分析,最后得出相关系数R1。
随后,对酿酒葡萄的芳香物质采用同样的分析方法,将酿酒葡萄的芳香物质与理化指标的贡献率综合成一组新的贡献率,并以此新贡献率为自变量,以第二组品酒员的品酒得分为因变量,再次进行同样的相关性分析,得出新的相关系数R2,最后把R1和R2进行对比,依此类推,用相同的方法求出葡萄酒的两个相关系数,进行对比,发现无论是酿酒葡萄还是葡萄酒,综合芳香物质后的相关系数都比单独用理化指标的相关系数大,因此,最终得出结论:
不能单独用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,必须综合芳香物质才能较准确、合理地评价葡萄酒的质量。
最后,对全文做出总结,并对模型进行了评价和推广。
关键词:
配对比较相关性分析主成分分析聚类分析线性回归分析
问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
本文将研究以下问题:
1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
问题分析
葡萄酒中含有丰富的营养物质,至今多达600种以上的物质被测定出来。
葡萄具有的营养和医疗作用很早就被认识,如本草纲目中有“葡萄酒益气调中,耐饥强志”和葡萄酒驻颜、耐寒的记载[1]。
之所以葡萄酒有如此的保健和营养价值,不仅由于葡萄赋予葡萄酒以丰富的糖分和较丰富的矿质元素,尤其是大量元素钾,锌、硒等微量元素对调节人体生理平衡,增强免疫系统都有很好的作用。
葡萄酒中维生素、氨基酸、丰富的有机酸与多酚类物质、单宁等物质使得葡萄酒具有其它类酒中没有的保健作用。
葡萄酒因其特殊的营养价值和较好的保健效果,越来越受到广大消费者的欢迎。
在此形势下,葡萄酒认证和质量评价得到关注。
葡萄酒的质量,即葡萄酒优秀的程度,它是产品的一种特性,且决定购买者的可接受性。
因此,葡萄酒能够满足人类需求的各种特性的总和即构成了它的质量。
葡萄酒认证保证了市场中酒的质量,同时保护了消费者的利益。
葡萄酒的认证包括理化性质分析、感官评价、物理化学指标、卫生指标等手段。
质量评价是认证中的重要阶段,它有益于提高葡萄酒的酿造工艺,同时为市场定位提供决策信息[2]。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系。
葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒的质量。
葡萄酒的每一项理化指标是其质量的单一体现,而感官指标则是葡萄酒质量的综合概括,换句话说,一个理化指标、卫生指标都合格的葡萄酒未必是高质量的葡萄酒。
在今后的一个时期,我们需要做的是从葡萄酒的特点出发,围绕葡萄和葡萄酒理化指标、感官指标等众多因素对葡萄酒质量的联系进行研究,尽可能确定较为合理的葡萄酒质量评价标准,从而实现既保证市场中酒的质量,保护消费者利益,又能为市场定位提供决策信息,达到经济效益的目的,实现双赢。
模型假设
1.假设红葡萄与白葡萄样品酒的生产工艺都相同。
2.假设评酒员的评酒水平基本是稳定的。
符号说明
评酒员的评分结果的标准差
评酒员的评价结果的均值
评酒员的评价结果的变异系数
第
主成份的各个指标的标准化测量值之和
第
主成分的贡献率
红葡萄样品
的理化指标得分
红葡萄样品
的第
主成分的各个指标的标准化测量值之和
红葡萄酒对应的理化指标
红葡萄对应的理化指标
模型的建立和求解
问题一
1.问题分析
针对问题1,我们把第一组的红葡萄酒的品尝得分的平均值归为一个样本组,把第二组对应编号的红葡萄酒的品尝得分的平均值归为一个样本组,再把第一组的白葡萄酒的品尝得分的平均值归为一个样本组,把第二组对应编号的白葡萄酒的品尝得分的平均值归为一个样本组,并采用SPSS13.0进行两次配对比较分析。
2.模型一的建立与求解
接着通过运用SPSS13.0软件运算可得,检验值P=0.020,由于P﹤a,(a=0.05),所以可以认为两组评酒员的评价结果有显著性差异。
如图1
PairedSamplesTest
PairedDifferences
t
df
Sig.(2-tailed)
Mean
Std.Deviation
Std.ErrorMean
95%ConfidenceIntervaloftheDifference
Lower
Upper
Pair1
Ft-Sd
2.56296
5.37424
1.03427
.43699
4.68894
2.478
26
.020
Pair2
f2-s2
-2.52143
5.35934
1.01282
-4.59956
-.44329
-2.490
27
.019
图1两组评酒员的品尝评分的检验结果
因为两组的评价结果有显著性差异,所以利用变异系数来确定哪一组的评价结果更可信。
同样利用SPSS13.0软件运算可得,第一组评价结果的标准差
=7.36093,第二组评价结果的标准差
=3.97799。
第一组评价结果的均值
=73.0778,第二组评价结果的均值
=70.5148。
变异系数
,第一组评价结果的变异系数
=1.41661,第二组评价结果的变异系数为
=0.76556,由于
>
,
>
所以可以认为第二组的结果更可信,如图2。
PairedSamplesStatistics
Mean
N
Std.Deviation
Std.ErrorMean
Pair1
First
73.0778
27
7.36093
1.41661
Second
70.5148
27
3.97799
.76556
Pair2
f2
74.0107
28
4.80404
.90788
s2
76.5321
28
3.17094
.59925
图2两组评酒员的品尝评分的变异系数分析
问题二
1.数据分析—主成分分析法
首先对红葡萄的理化指标数据进行分析,考虑到理化指标较多,因此,采用主成份分析法对指标进行重新筛选和组合。
按照主成份分析的理论,若前R个主成份的累计贡献率达到了85%原则,则这R个主成份能反映足够的信息[3]。
利用SPSS13.0对红葡萄的28个理化指标进行主成份分析得出前9个主成份的累计贡献率已达到86.278%,故选取前9个特征值作为相互独立的新的综合性指标。
如表1
表1评价因子的特征根和累计贡献率
Tabal1Thelatentrootandvariancecontributionrateofevaluationfactor
主成分
特征根
初始特征值贡献率(%)
累计方差贡献率(%)
PrincipalComponent
latentroot
Contributionrate
Cunulativecontributionrate
1
6.963
23.211
23.211
2
4.984
16.612
39.824
3
3.692
12.305
52.129
4
2.842
9.472
61.601
5
1.994
6.647
68.248
6
1.738
5.795
74.042
7
1.428
4.761
78.803
8
1.274
4.245
83.048
9
0.969
3.230
86.278
可以分析出以下结果,第1主成分与蛋白质、单宁、DPPH自由基、葡萄总黄铜、花色苷、总酚有较大正相关;第2主成分与总糖、干物质含量、还原糖、可溶性固形物有较大正相关;第3主成分与白藜芦醇、果皮颜色A、果皮颜色B有较大正相关,但与可滴定酸、果皮质量有较大负相关;第4主成分与PH值有较大正相关,但与苹果酸、褐变度、多酚氧化酶有较大负相关;第5主成分与果穗质量、固酸比有较大正相关,但与VC含量有较大负相关;第6主成分与黄铜醇有较大负相关;第7主成分与黄铜醇、果皮质量有较大正相关;第8主成分与柠檬酸、酒石酸有较大负相关;第9主成分与有VC含量有较大正相关。
如表2
表2红葡萄主成分矩阵
Table2Principalcomponentmatrix
变量
因子Factor
Variable
1
2
3
4
5
6
7
8
9
氨基酸
0.382
0.532
0.021
0.463
-0.256
-0.28
0.172
0.001
0.092
蛋白质
0.608
-0.502
0.198
0.254
0.207
-0.134
0.112
-0.16
0.024
VC含量
-0.147
-0.398
0.107
-0.022
-0.532
0.151
-0.015
0.141
0.626
花色苷
0.845
-0.115
-0.107
-0.299
0.099
0.187
-0.111
0.076
0.012
酒石酸
0.378
0.102
0.364
0.383
0.304
-0.14
0.225
-0.5
0.053
苹果酸
0.392
0.324
0.146
-0.654
0.089
0.353
-0.152
0.151
-0.026
柠檬酸
0.297
0.298
0.317
-0.374
0.351
-0.045
0.333
-0.427
0.221
多酚氧化酶
0.318
0.093
-0.221
-0.598
0.243
-0.359
0.019
0.106
-0.013
褐变度
0.595
-0.088
0.042
-0.707
-0.02
-0.066
-0.09
0.108
0.101
DPPH自由基
0.751
-0.473
0.006
0.205
-0.012
0.115
0.206
0.123
-0.21
总酚
0.862
-0.191
-0.163
0.228
-0.019
0.184
-0.03
0.109
-0.236
单宁
0.757
-0.161
-0.272
-0.07
-0.154
0.26
0.249
-0.052
0.092
葡萄总黄酮
0.717
-0.302
-0.18
0.283
0.04
0.298
0.11
0.078
-0.276
白藜芦醇
0.06
-0.05
0.828
0.048
-0.191
0.166
0.29
0.289
0.043
黄酮醇
0.557
0.014
0.026
-0.065
-0.193
-0.49
0.466
0.245
0.077
总糖
0.268
0.776
-0.148
0.271
0.101
-0.05
-0.077
0.274
0.069
还原糖
0.085
0.759
-0.128
0.155
0.086
-0.111
-0.086
0.119
0.063
可溶性固形物
0.258
0.75
-0.319
0.162
0.114
-0.056
-0.034
0.255
0.011
PH值
0.264
-0.293
0.202
0.692
0.126
-0.123
-0.291
0.218
0.205
可滴定酸
-0.291
0.454
-0.598
0.01
-0.33
0.245
0.296
-0.115
-0.026
固酸比
0.391
-0.051
0.43
-0.008
0.534
-0.138
-0.328
0.204
0.095
干物质含量
0.386
0.849
-0.197
0.111
0.085
-0.025
0.047
0.041
0.103
果穗质量
-0.347
-0.453
-0.223
0.065
0.602
0.029
0.225
0.097
0.229
百粒质量
-0.536
-0.357
-0.474
0.09
0.262
0.146
0.193
0.234
-0.044
果梗比
0.578
-0.219
0.174
-0.217
-0.426
-0.392
0.085
0.055
-0.067
出汁率
0.547
-0.192
-0.255
0.162
0.036
0.397
-0.133
-0.014
0.384
果皮质量
-0.257
-0.248
-0.621
-0.099
0.314
-0.08
0.459
0.254
0.126
果皮颜色L
-0.571
-0.321
0.302
-0.046
0.045
-0.314
0.07
0.336
-0.12
果皮颜色A
-0.332
0.292
0.737
0.034
0.002
0.289
0.245
0.221
-0.071
果皮颜色B
-0.136
0.502
0.594
-0.034
0.213
0.446
0.277
0.115
-0.024
2.数据验证—聚类分析法
下面的工作我们进一步采用聚类分析法对结果进行验证。
聚类分析是研究分类问题的多元统计方法之一,就是根据研究对象的特征把性质相近的个体归为一类,使得同一类中的个体具有高度的同质性,不同类之间的个体具有高度的异质性的多元分析技术的总称[4]。
对红葡萄的理化指标进行R型因子聚类分析,得到理化指标的聚类谱系图,同时依据主成分分析的结果将28项指标聚成9类,从聚类图谱的聚类距离和聚类的先后步骤可以看出,果穗质量、百粒质量、果皮质量聚成一类,说明这3个指标间的相关性很高,也就是说这3个性状为相似水平类;依次类推,PH值与固酸比聚成一类,即这2个性状为相似水平类;花色苷、苹果酸、多酚氧化酶活力、黄酮醇、褐变度、果梗比聚为一类,即这6个性状为相似水平类;蛋白质、DPPH自由基、总酚、单宁、葡萄总黄酮、出汁率聚为一类,即这6个性状为相似水平类;白藜芦醇、果皮颜色A、果皮颜色B聚为一类,即这3个性状为相似水平类;酒石酸与柠檬酸聚为一类,即这2个性状为相似水平类;氨基酸总量、还原糖、可溶性固形物、干物质含量、可滴定酸、总糖聚成一类,即这6个性状为相似水平类;果皮颜色L、VC含量无相似项单独为一类。
这表明,同为一相似类别的果实品质理化指标之间具有较高的相关性,可选用一个理化指标代表同一水平类其它理化指标,将28个酿酒红葡萄理化指标予以简化,其中无相似项的果实理化指标具有相对独立性,结果表明,聚类分析验证了主成分分析结果的正确性。
如图3
图3红葡萄不同理化指标聚类分析结果(n=30)
3.模型二的建立和求解
然后,通过上述的主成分分析和聚类分析,我们得到了红葡萄理化指标中具有代表性的9个主成分以及每个主成分所包含的指标,如表3。
表3红葡萄理化指标的主成分分析结果(n=30)
主成分
包含成分名称
贡献率(%)
第一主成分
果皮颜色L
23.211
第二主成分
果穗质量,百粒质量,果皮质量
16.612
第三主成分
VC含量
12.305
第四主成分
PH值,固酸比
9.472
第五主成分
花色苷,苹果酸,多酚氧化酶活力,黄酮醇,褐变度,果梗比
6.647
第六主成分
蛋白质,DPPH自由基,总酚,单宁,葡萄总黄酮,出汁率
5.795
第七主成分
白藜芦醇,果皮颜色A,果皮颜色B
4.761
第八主成分
酒石酸,柠檬酸
4.245
第九主成分
氨基酸总量,还原糖,可溶性固形物,干物质含量,可滴定酸,总糖
3.230
在主成份分析法理论中,贡献率达到85%以上便具有统计学上的意义,因此,基于这一理论,我们不妨用各个指标的测量值与各自对应的贡献率的乘积的和来作为葡萄的理化指标得分,而为了使指标的测量值具有计算意义,我们把各个指标的测量值进行量纲统一,即把各个指标的测量值的均值标准化,以此新数据作为葡萄的各个指标的新的测量值,再以主成份为顺序进行排序。
(详见附录。
)
设第
主成份的各个指标的标准化测量值之和为
,第
主成分的贡献率为
,红葡萄样品
的理化指标得分为
,红葡萄样品
的第
主成分的各个指标的标准化测量值之和为
,则可建立如下模型:
表4红葡萄的理化指标得分和评酒师对红葡萄的评分
红葡萄样品
理化指标得分
评酒师得分
葡萄样品01
18.99734
681
葡萄样品02
46.41101
740
葡萄样品03
51.67698
746
葡萄样品04
-99.604
712
葡萄样品05
72.28346
721
葡萄样品06
-60.9712
663
葡萄样品07
-93.878
653
葡萄样品08
109.0392
660
葡萄样品09
25.43808
782
葡萄样品10
35.6495
688
葡萄样品11
11.19592
616
葡萄样品12
-22.6788
683
葡萄样品13
-21.1032
688
葡萄样品14
28.3185
726
葡萄样品15
-65.9898
657
葡萄样品16
-63.2904
699
葡萄样品17
52.23925
745
葡萄样品18
-79.9643
654
葡萄样品19
1.075881
726
葡萄样品20
30.78321
758
葡萄样品21
-46.9646
722
葡萄样品22
-56.9601
716
葡萄样品23
80.72203
771
葡萄样品24
32.27933
715
葡萄样品25
-48.8541
682
葡萄样品26
78.52161
720
葡萄样品27
-14.3728
715
4.模型二的检验与分析
通过以上的计算,我们得到了红葡萄的理化指标得分,又因为酿酒葡萄的质量与所酿葡萄酒的质量有直接的关系,即葡萄酒的质量的高低应与酿酒葡萄的理化指标得分的高低相一致,因此,可以利用评酒师对葡萄酒的感官得分来验证以上理化指标计算的合理性和正确性,如图4。
图4红葡萄的理化指标得分和评酒师对红葡萄的评分比较
显然可见,所计算出的红葡萄的理化指标得分与评酒师的感官得分在图表上具有高度的一致性,说明了指标模型的正确性和可行性。
所以,一般而言,葡萄酒的质量越高,可以推断酿酒葡萄的质量也越高,这是因为虽然能有许多工艺措施对葡萄的缺点进行补救,但想用先天不足的葡萄酿出香气馥郁、结构丰满协调、典型性独特的葡萄酒几乎是不可能的,所以葡萄酒的质量高,酿酒葡萄的质量也会高;反过来,虽然酿酒葡萄的质量是决定葡萄酒的关键因素,但却不一定能推断出葡萄酒的质量也越高。
这是因为酿酒工艺及关键步骤对葡萄酒的风格和质量都有重要影响,所以葡萄的理化指标只能在一定程度上反映葡萄酒的质量[5]。
因此,我们要以葡萄酒的质量得分为主,葡萄的理化指标为辅对红葡萄进行分级,根据这个思路,我们以将酿酒红葡萄按评酒员的评分高低划分为3个等级,以组距为划分标准,组距=(最大值-最小值)÷组数=(782-616)÷3=56,以56组距划分,可得到第一组得分是782~740,第二组得分是726~681,第三组得分是663~616,即对应为一级,二级,三级,如表5。
表5红葡萄的分级
级