数学建模之葡萄酒的评价.docx
《数学建模之葡萄酒的评价.docx》由会员分享,可在线阅读,更多相关《数学建模之葡萄酒的评价.docx(13页珍藏版)》请在冰豆网上搜索。
数学建模之葡萄酒的评价
葡萄酒的评价
摘要
葡萄拥有很高的营养价值,含有多种氨基酸、蛋白质和维生素,而以葡萄为原料的葡萄酒也蕴藏了多种营养物质,而且这些物质都是人体必须补充和吸收的营养品。
目前,已知的葡萄酒中含有的对人体有益的成分大约就有600种。
葡萄酒的营养价值由此也得到了广泛的认可,可以说葡萄酒是一个良好的滋补品。
本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。
对于本题,我们主要采用SPSS和MATLAB软件对模型进行求解。
针对问题一,首先我们将附件1中数据在Excel中进行处理;其次,我们在SPSS中,采用T检验,分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。
最后,我们通过T检验,在SPSS中可其相应的标准差,通过比较标准差来确定哪个组更可靠。
针对问题二,首先利用主成分分析法对酿酒葡萄的指标进行简化,将问题转化成一个多元函数的求解问题,然后分别对酿酒葡萄中的指标和葡萄酒理化指标进行相关性分析,得出指标间的相关性关系,将问题转化为求解超定方程组的解,最后利用最小二乘法建立了酿酒葡萄与葡萄酒理化指标间的关系式。
一、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:
1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
二、问题分析
2.1针对问题一,我们将它分成两个问题去解决
1、针对问题一中的两组评酒员的评价结果有无显著性差异,我们在SPSS中利用T检验去判断。
在这之前,我们对附录1中数据进行处理,利用excel分别求出两组评酒员分别对红葡萄酒和白葡萄酒的评价结果的平均值。
2、针对问题一中选择哪组结果更加可靠,我们利用SPSS求出两组葡萄酒评价结果的平均值的标准差,通过对比两组相应葡萄酒评价结果的平均值的标准差,从而确定出第几组的结果更可靠。
2.2针对问题二,首先利用主成分分析法对酿酒葡萄的指标进行简化,将问题转化成一个多元函数的求解问题,然后分别对酿酒葡萄中的指标和葡萄酒理化指标进行相关性分析,得出指标间的相关性关系,将问题转化为求解超定方程组的解,最后利用最小二乘法建立了酿酒葡萄与葡萄酒理化指标间的关系式。
三、基本假设
1、假设制作葡萄酒的工艺是一样且稳定的;
2、假设两组评酒员是随机分配的;
3、假设评酒员对每种葡萄酒的评价结果是大致符合正态分布的;
4、假设酿造葡萄酒的环境是相同的;
5、假设不考虑多种葡萄可制成一种酒,只考虑一种葡萄制成一种酒;
6、假设只考虑红葡萄制成红葡萄酒,白葡萄制成白葡萄酒,忽略去皮红葡萄可酿制白葡萄酒;
7、假设酿酒葡萄中存在的而葡萄酒中不存在的理化指标也会影响葡萄酒的质量;
8、假设质量高的葡萄酒一定由质量好的酿酒葡萄制成,但是质量好的酿酒葡萄不一定能酿制成质量高的葡萄酒;
9、假设本文所引用的数据、资料均真实可靠。
四、符号说明
红葡萄酒的理化指标
红葡萄的指标
白葡萄酒的理化指标
白葡萄的指标
5、模型建立与求解
5.1两组评酒员的评价结果有无显著性差异,选择哪一组更可靠
5.1.1两组评酒员的评价结果有无显著性差异——配对样本的T检验
1.1配对样本T检验的概念若实验设计是将条件、性质相同或相近的两个供试单元配成一对,并设有多个配对,然后对每一个配对的两个供试单元分别随机的基于不同处理,这样的实验叫做配对实验。
它的特点是配成对子的两个试验单元的非处理条件尽量4 一致,不同对子的试验单元之间的非处理条件允许有差异,每一个对子就是试验处理的一个重复。
SPSS配对样本的T检验主要解决来自配对样本数据的两个总体均值有否显著差异的问题。
所谓配对样本,通常是指对同一观察对象在使用某种新方法的有效性。
配对样本的检验对数据的要求:
(1)是抽取样本数据的两个总体必须服从正态分布。
(2)两个样本的样本容量相同。
1.2建立模型:
1.
基本数学原理:
成对样本的均值比较t检验,假设这两个样本之间的均值差异为零,用于检验的统计量为:
(式中,n-1为自由度,n为数据对数)
2.建立检验假设:
(其中d为均值差异)其假设的意义为,当差异为零时,可以认为某种试验方法无效;反之,当差异不为零,可以认为某种试验方法在发生作用或有效。
1.3模型求解:
(1)葡萄酒得分的平均值如下表:
(2)在SPSS中对两组红葡萄酒得分的平均值运行配对样本的T检验,得到下图:
图中表明:
两个样本平均数为73.056、70.515,相关系数为0.700,T检验的临界值为2.458。
则可得到结论:
两组评酒员对红葡萄酒的评价结果有显著性差异。
(3)在SPSS中对两组白葡萄酒得分的平均值运行配对样本的T检验,得到下图:
图中表明:
两个样本平均数为73.85、76.481,相关系数为0.195,T检验的临界值为-2.512。
则可得到结论:
两组评酒员对白葡萄酒的评价结果有显著性差异。
综上,两组评酒员的评价结果有显著差异。
5.1.2结果可靠性的选择
通过以上两个图可以看出,对红葡萄酒的评分第一组、第二组的平均值的标准差分别为7.3426、3.9780;对白葡萄酒的评分第一组、第二组的平均值的标准差分别为5.059、3.2198。
通过比较可得第二组评酒员的评价结果更可信。
5.2分析酿酒葡萄与葡萄酒的理化指标之间的联系
基本原理:
主成分分析法:
是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。
主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。
双变量相关性分析:
相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。
相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。
相关性不等于因果性,也不是简单的个性化,相关性所涵盖的范围和领域几乎覆盖了我们所见到的方方面面,相关性在不同的学科里面的定义也有很大的差异。
双变量相关分析中有三种数据分析:
Pearson系数,Spearman系数和Kendall系数。
5.2.1选取红、白葡萄的指标及红、白葡萄酒的理化指标
红葡萄酒有8个理化指标,白葡萄酒有7个理化指标,如下表:
红葡萄酒
花色苷
单宁
总酚
酒总黄酮
白藜芦醇
DPPH半抑制体积
色泽
芳香
白葡萄酒
单宁
总酚
酒总黄酮
白藜芦醇
DPPH半抑制体积
色泽
芳香
利用主成分分析法,我们选取红、白葡萄的指标如下表:
红葡萄
VC含量
多酚氧化酶活力
蛋白质
氨基酸
果皮质量
褐变度
果穗质量
白藜芦醇
白葡萄
果皮质量
百粒质量
酒石酸
VC含量
颜色指标
褐变度
果梗比
出汁率
DPPH自由基
果穗质量
5.2.2相关性分析
相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的关系紧密程度的一种统计方法。
1红葡萄指标与红葡萄酒的理化指标相关性分析
用SPSS软件分别对红葡萄的8个指标与红葡萄酒的8个理化指标进行双变量相关分析,由结果的数据可得下表(其中0表示无相关关系,1表示有相关关系):
相关性
花色苷
单宁
总酚
酒总黄酮
白藜芦醇
DPPH半抑制体积
颜色指数
芳香物质
VC含量
0
0
0
0
0
0
0
0
多酚氧化酶活力
1
0
0
0
0
0
0
0
蛋白质
0
1
1
1
0
1
0
0
氨基酸
0
1
0
0
0
1
0
0
果皮质量
0
0
0
0
0
0
0
0
褐变度
1
1
1
1
0
0
1
0
果穗质量
0
0
0
0
0
0
0
0
白藜芦醇
0
0
0
0
0
0
0
1
从表中可以得到以下结论:
(1)VC含量与红葡萄酒理化指标无相关性;
(2)多酚氧化酶活力与花色苷之间有相关性;
(3)蛋白质与单宁、总酚、酒总黄酮、DPPH半抑制体积之间有相关性;
(4)氨基酸与单宁、DPPH半抑制体积之间有相关性;
(5)果皮质量与红葡萄酒理化指标无相关性;
(6)褐变度与花色苷、单宁、总酚、酒总黄酮、芳香物质之间有相关性;
(7)果穗质量与红葡萄酒理化指标无相关性;
(8)白藜芦醇与芳香物质有相关性;
2白葡萄指标与红葡萄酒的理化指标相关性分析
用SPSS软件分别对白葡萄的10个指标与白葡萄酒的7个理化指标进行双变量相关分析,由结果的数据可得下表(其中0表示无相关关系,1表示有相关关系):
相关性
单宁
总酚
酒总黄酮
白藜芦醇
DPPH半抑制体积
颜色指数
芳香物质
果皮质量
0
1
0
0
0
0
0
百粒质量
0
0
0
0
0
0
0
酒石酸
0
0
0
0
0
0
1
VC含量
0
0
0
0
0
0
0
颜色
0
0
0
0
0
1
0
褐变度
0
0
0
0
0
0
0
果梗比
0
1
1
0
0
0
0
出汁率
0
0
0
0
0
1
0
DPPH自由基
1
1
0
0
1
0
0
果穗质量
0
0
0
0
0
0
0
从表中数据可以看出:
(9)果皮质量与总酚之间有相关性;
(10)百粒质量与白葡萄酒理化指标无相关性;
(11)酒石酸与芳香物质之间有相关性;
(12)VC含量与白葡萄酒理化指标无相关性;
(13)颜色指标与色泽之间有相关性;
(14)褐变度与白葡萄酒理化指标无相关性;
(15)果梗比与总酚和酒总黄酮之间有相关性;
(16)出汁率与色泽之间有相关性;
(17)DPPH自由基与单宁、总酚、DPPH半抑制体积之间有相关性;
(18)果穗质量与白葡萄酒理化指标无相关性。
5.2.3建立模型
假设酿酒葡萄的指标(
)与葡萄酒理化指标(
)之间有这么一种关系:
......
则可以将问题转化为用线性最小二乘拟合求解超定方程组的问题。
令:
,a=
,
则超定方程组化为:
y=Ra。
如果有向量a使得
达到最小,则称a为上述超定方程的最小二乘解。
5.2.4模型求解
对此超定方程组,我们可以用a=R\y得最小二乘意义下的解。
用MATLAB软件进行数据处理得:
红葡萄指标
与红葡萄酒的理化指标
之间的关系为:
其中
分别表示:
多酚氧化酶活力、蛋白质、氨基酸、褐变度、白藜芦醇;
分别表示:
花色苷、单宁、总酚、酒总黄酮、白藜芦醇、DPPH半抑制体积、颜色指数、芳香物质。
白葡萄指标
与白葡萄酒的理化指标
之间的关系为:
其中
分别表示:
果皮质量、酒石酸、颜色指标、果梗比、出汁率、DPPH自由基、果穗质量;
分别表示:
单宁、总酚、酒总黄酮、白藜芦醇、DPPH半抑制体积、颜色指数、芳香物质。
六、模型的评价和推广
1.模型的优点
1.1运用SPSS进行处理,得到相关系数,可以代表整组变量中的整体曲线趋势,而单纯的相关性分析没有这个效果。
主成分分析得出的变量贡献模型,可以很好地反映原来数据的性质,又可以简化变量。
1.2主成份分析、相关性分析可以使多个指标简化成几个主要的指标,可以简化检测程序,提高检测效率。
2.模型的缺点与改进
以通过主成份分析筛选出的指标作为研究分析的基础,存在一定的误差。
3.模型的推广
由对问题二的分析可知,酿酒葡萄的某些理化指标和葡萄酒的某些理化指标之间具有较大的相关性,而葡萄酒的理化指标会在一定程度上反映葡萄酒的质量。
所以,我们在把酿酒葡萄加工成葡萄酒的工艺过程中,应特别注意酿酒葡萄和葡萄酒之间具有较大相关性的物质的保护,例如花色苷、单宁、总酚等,并不断改进加工工艺,提高葡萄酒的品质;另外还要注意葡萄的种植条件。
七、参考文献
1.聂继云,李明强,张桂芳,等。
白梨品质评价指标的聚类分析[J].中国果树,2000,
(2):
16-17
2.李运,李记明,姜忠军,等。
统计分析在葡萄酒质量评价中的应用[J].酿酒科技,2009,(4):
81-82
梁学军, 诸葛宏庆,杨华峰,等。
葡萄质量是决定葡萄酒质量的关键因素[J]. 中外葡萄与葡萄酒,2000,
(1):
48
4.谢辉,樊丁宇,张雯,等。
统计方法在葡萄理化指标简化中的应用[J].新疆农业科学,2011,(48):
1435-1436
5.鹿述云,张霞,吴翠凤,等。
红葡萄酒酿造工艺[J].山东林业科技,2003,
(2):
26
6.赵建萍,张军翔,刘谱,等。
不同发酵温度和浸渍时间对红葡萄酒理化指标的影响[J].中外葡萄与葡萄酒,2006,(6):
13-14