高教社杯全国大学生数学建模竞赛A题葡萄酒的评价论文范文Word格式.docx
《高教社杯全国大学生数学建模竞赛A题葡萄酒的评价论文范文Word格式.docx》由会员分享,可在线阅读,更多相关《高教社杯全国大学生数学建模竞赛A题葡萄酒的评价论文范文Word格式.docx(25页珍藏版)》请在冰豆网上搜索。
问题二,我们采用多元统计分析方法中的聚类分析对酿酒葡萄的理化指标进行了简化,选出酿酒葡萄中最具代表的几种理化指标,再运用相关系数分析他们对葡萄酒品质的影响程度,从而进一步结合酿酒葡萄的理化指标和酒的质量对葡萄进行分级。
问题三,用葡萄酒质量作为桥梁,采用统计学分析方法中的相关性分析方法分别筛选出与酿酒葡萄与葡萄酒的理化指标中对葡萄酒质量影响比较重要的几个因素,再对选出的两组重要因素进行相关性分析得出的相关系数,通过比较分析它们之间的相关系数做出准确合理的结论。
问题四,利用主成分分析方法,用葡萄酒质量分别对酿酒葡萄和葡萄酒理化指标中显著性较高的几组数据建立多元回归方程,由此可以得出两种理化指标对葡萄酒质量的影响。
糖、酸、单宁、色素和芳香物质是构成酿酒葡萄品质优劣的重要元素
,在不考虑芳香物质的条件下,笼统的论证用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量是不合理的。
关键词:
离散系数聚类分析相关性分析
(一)问题的重述
在给出某一年份一些葡萄酒品尝评分表、葡萄和葡萄酒的理化指标的两个表格以及葡萄和葡萄酒的芳香物质的四个表格后,为了简化问题,我们对表中数据的各项指标进行计算,得出其对应的均值与标准差,适当的进行数据筛选,提取出相应的指标进行分析,建立数学模型。
现在我们需要解决以下四个问题:
1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3、分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
(二)问题分析
本题为判断葡萄酒的评价标准是否合理可行及酿酒葡萄与葡萄酒两者之间的联系并对酿酒葡萄进行等级划分,同时分析论证葡萄和葡萄酒的理化指标可不可以作为评价葡萄酒质量的依据。
问题1要评价两组评酒员所评结果的显著性差异与可信度。
首先要考虑每组所有成员对同一种酒样品的综合评价,考虑独立样本的计算,利用SPSS11.5软件算出其样本的均值和标准差,然后用两组成员的样本均值来判断有无显著性差异,得出结论。
若有显著性差异,则在此基础上,用离散系数判断可信度,离散系数越小说明波动程度越小,评价的结果越稳定,可信度就越高。
问题2是根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,要对酿酒葡萄进行,我们需要考虑两个因素:
一是酿酒葡萄的理性指标是如何规定;
二是分析葡萄酒的质量,根据葡萄酒质量的不同等级对酿酒葡萄进行不同等级的划分。
运用多元统计分析方法对酿酒葡萄的理化指标进行聚类分析,将其理化指标进行简化,其次,进一步对理化指标与酒的质量进行相关系数分析,找出酿酒葡萄对酒质量最具影响的几种理化指标,接着用这些理化指标把葡萄进行等级划分。
问题3要求分析出酿酒葡萄与葡萄酒理化指标的联系,要求分析出酿酒葡萄与葡萄酒理化指标的联系,我们首先运用SPSS11.5进行相关性分析分别选出红、白酿酒葡萄和红、白葡萄酒中与葡萄酒质量密切相关的五个因素,再对得出的两组数据进行一次的相关性分析,便可从得出的相关系数表中得到它们之间的联系。
问题4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,先用主成分分析法,考虑利用葡萄酒质量(评分)对酿酒葡萄和葡萄酒理化指标中显著性较高的几组数据建立多元回归方程,这样可以得出它的影响结果,而要论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,需要充分的利用来判断,可以查阅资料,找出影响葡萄酒质量的要素。
要论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,使用SPSS11.5软件对葡萄酒的芳香物质各指标和葡萄酒的质量进行相关系数分析,根据相关性分析葡萄的芳香物质以及葡萄酒的芳香物质对酒质量是否有影响。
(三)模型的假设
(1)不考虑两种酿酒葡萄本身的品种
(2)两组葡萄出自相同的地方
(3)两组葡萄酒都是有同样的酿酒师酿造出来的,且排除他们的非系统性误差
(4)橡木桶的陈化程度没有差别
(5)酿酒葡萄和葡萄酒的贮存方式、条件都是一样的
(6)排除评酒员在评价过程中视觉、嗅觉、味觉等产生的误差
(四)符号说明
表示红葡萄酒中第i组的样本均值
表示红葡萄酒中第i组的样本标准差
表示红葡萄酒中第i组的离散系数
表示白葡萄酒中第i组的样本均值
表示白葡萄酒中第i组的样本标准差
表示白葡萄酒中第i组的离散系数
表示显著性水平为0.05
(五)模型建立与解答
问题1:
分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
题目其实需要我们分两步去解决,首先,先利用独立样本均值判断两组评酒员的评价结果有无显著性差异,在此基础上,再利用离散系数考虑哪组结果更可信。
顺着这种思路,我们从10种小项目中利用SPSS11.5软件分别对两组评酒员的评价结果中的红葡萄酒和白葡萄酒计算其样本均值和标准差,得出了如下的表1.1、表1.2。
表1.1红葡萄酒
澄清度
色调
纯正度
浓度
质量
持久性
平衡/整体评价
第一组
3.58
7.13
4.47
5.09
12.13
4.72
5.81
5.99
15.10
8.76
第二组
3.48
6.35
4.13
5.64
11.72
3.94
5.50
14.90
8.74
0.81
1.59
1.02
1.17
1.656
1.34
0.89
2.35
0.62
1.37
0.67
1.07
1.311
0.63
1.14
0.76
1.84
表1.2白葡萄酒
3.39
6.65
4.59
6.36
12.65
4.09
5.91
6.64
15.3
8.96
3.41
6.77
4.51
6.29
12.59
4.50
6.15
6.39
16.7
9.25
1.85
0.94
1.177
1.73
2.98
1.00
0.69
1.31
0.70
1.06
1.41
0.02
0.73
2.12
0.72
如上述两表所示,可知,红葡萄酒和白葡萄中第一组、第二组的独立样本均值是存在显著性差异的,在此条件下,对第一组和第二组的标准差系数进行比较。
利用标准差系数数学模型:
对红葡萄酒进行分析,得出如下的表1.3、表1.4
表1.3红葡萄酒
0.22
0.23
0.14
0.15
0.16
0.10
0.19
0.1
0.11
0.21
0.13
0.12
0.07
表1.4白葡萄酒
0.26
0.28
0.20
0.17
0.09
0.01
从两表中,可得出,红葡萄酒中,十个项目的
,可以认为红葡萄酒中第二组更加可信;
白葡萄酒中,虽然存在质量的离散系数中第二组大于第一组,但从整体来看,第二组的离散系数还是小于第一组。
综上所述,无论是红葡萄酒还是白葡萄酒,两组评酒员的评价结果有显著性差异,第二组的结果更加可信。
问题2:
根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
本题附件2中测定了28个白葡萄样的59个理化指标,其中有30个一级指标,29个二级指标。
为了找出影响葡萄品质的主要指标,我们采用SPSS11.5软件,运用聚类分析法
和相关系数分析法对30个一级指标数据进行分析。
首先,对白葡萄的30个一级指标进行R型聚类分析
,具体做法为打开附录1中数据文件“白葡萄.sav”,选择Analyze→Classify→HierarchicalCluster→把要进行聚类的指标选入Variable(s)→把样品编号选入LabelCasesby→选择Cluster栏的Variable→选择Plots窗体中的Dendrogram→OK输出结果得到指标的聚类谱系图(图2.1),同时根据分析将30项指标聚成5类,从谱系图的聚类距离和聚类的先后步骤可以看出,DPPH自由基、果皮质量、白藜芦醇、花色苷、柠檬酸、PH值、果梗比、单宁、葡萄总黄酮、果酸、可滴定酸、酒石酸、总酚、果皮颜色a*、黄酮醇、干物质含量、果皮颜色b*、果皮颜色L*、多酚氧化酶活力、出汁率这20项先聚为一类,再与固酸比聚类,说明21个指标间的相关性较高,即这21项指标为相似水平类;
同样的,总糖、可溶性固行物、还原糖、果穗质量、百粒质量、VC含量这6项指标为相似水平类;
褐变度、蛋白质、氨基酸分别单独为一类。
图2.1白葡萄一级指标的聚类图
再把第一类的21项指标与白酒的评分(酒的质量好坏)进行相关性分析(相关系数见表2.1),具体做法为打开数据文件“白葡萄.sav”,选择Analyze→Correlate→Bivariat→把要分析的变量名导入Variables→OK。
得出结果表明果皮颜色b*与酒的质量呈极显著的正相关,酒石酸与酒的质量呈显著的正相关,由此,我们可以用果皮颜色b*来代表这一水平类的其他性状。
同样的,把第二类的6项指标与白葡萄酒的评分进行相关性分析(表2.2),得到果穗质量与酒的质量呈显著的负相关,总糖、可溶性固行物与酒的评分呈显著的正相关。
虽然氨基酸、蛋白质、褐变度分别单独为一类,但它们与酒的质量间的相关性不显著,所以,我们不采用其进行对葡萄的分级。
综上,我们就得到了5项影响葡萄质量的理化指标,分别为果穗质量、可溶性固行物、总糖、果皮颜色b*、酒石酸,用这5项指标来对葡萄进行分级。
表2.1第一类指标的相关系数
DPPH自由基1/IC50(g/l)
酒石酸
果皮颜色b*
·
白酒分数
PearsonCorrelation
1
-.150
.364
.294
Sig.(2-tailed)
.
.447
.057
.129
N
28
PH值
-.027
.414(*)
-.014
.145
.893
.029
.943
.462
果梗比
-.229
.411(*)
.093
.117
.240
.030
.639
.552
单宁
.395(*)
.001
.065
.171
.038
.994
.743
.383
.191
.392(*)
.331
.039
总酚
.324
-.242
-.116
-.069
.214
.555
.727
果皮颜色a*
-.453(*)
.113
-.692(**)
-.130
.015
.568
.000
.508
干物质含量g/100g
.215
.277
.358
.271
.154
.062
.523(**)
.004
果皮颜色L*
.418(*)
.049
.858(**)
.347
.027
.803
.071
多酚氧化酶活力
-.428(*)
-.022
-.282
-.235
.023
.910
.146
.229
*Correlationissignificantatthe0.05level(2-tailed).
**Correlationissignificantatthe0.01level(2-tailed).
表2.2第二类指标的相关系数
总糖
可溶性固行物g/L
还原糖
果穗质量
百粒质量
VC含量
.846(**)
.554(**)
-.540(**)
-.304
.104
.407(*)
.002
.003
.116
.599
.032
可溶性固行物
.591(**)
-.665(**)
-.425(*)
-.044
.429(*)
.024
.824
-.408(*)
-.262
.235
.031
.178
.878
.228
.712(**)
.190
-.456(*)
.333
.288
-.261
.138
.181
-.062
.753
表2.3氨基酸、蛋白质、褐变度与酒质量的相关系数
氨基酸总类
蛋白质
褐变度
.121
-.123
.263
.539
.532
.176
.460(*)
-.063
.014
.752
.483
现在,就所有白葡萄样品中的果穗质量的含量,由表2.2得果穗质量与酒质量负相关,我们可以通过对白葡萄中果穗质量的含量从小到大进行排序,把白葡萄分为优、良、中、差四个等级,同样的,分别用葡萄中的总糖、果皮颜色b*、酒石酸的含量来把白葡萄分级。
分级如表2.4所示:
表2.4白葡萄的分级
分级标准
优
22、21、2、26、28、4、17
24、9、28、26、25、23、20
24、26、25、28、20、10、9
28、21、5、4、23、14、20
3、20、9、17、19、5、22
良
5、10、9、25、14、19、27
5、10、3、27、21、12、2
12、21、2、4、5、23、19
26、17、11、2、7、9、18
28、21、6、27、23、8、10
中
23、24、20、3、7、16、1
22、4、19、14、1、6、17
17、27、6、18、3、14、1
3、6、27、10、24、1、12
11、24、25、4、26、1、16
差
8、12、13、18、6、11、15
16、11、13、18、8、7、15
16、15、11、22、7、8、13
22、25、13、15、8、19、16
15、2、13、12、7、18、14
综上,经分析可以得出这些白葡萄样品的总分级:
优:
葡萄品种28、20、26、9、2、10、5
良:
葡萄品种21、23、27、19、4、25、24
中:
葡萄品种1、3、6、22、17、14
差:
葡萄品种13、15、8、16、18、7、11
用同样的方法可以对红葡萄进行分级,首先,同样把红葡萄的30个一级指标进行R型聚类分析,得到指标的聚类谱系图(图2.2),同时根据分析将30项指标聚成5类:
第一类:
总酚、葡萄总黄酮、DPPH自由基、单宁、蛋白质、出汁率、白藜芦醇、黄酮醇、果梗比、花色苷、褐变度、果酸、多酚氧化酶活力、PH值、固酸比
第二类:
总糖、可溶性固行物、干物质含量、还原糖、氨基酸总类、可滴定酸
第三类:
果皮颜色a*、果皮颜色b*、酒石酸、柠檬酸
第四类:
白粒质量、