1、随着葡萄酒产业逐渐升温,为了获得质量更好的葡萄酒,对酿酒葡萄及葡萄酒的研究也越加深入。现在流行的做法是通过聘请一批有资质的评酒员进行品评,但是这种感官评价的主观性总是带给我们模糊的印象。正如我们所知的,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。如何充分利用这些理化指标定量研究葡萄酒的质量成了炙手可热的研究问题。二、问题分析题目为我们提供了感官评价指标,葡萄和葡萄酒的各种理化指标和芳香物质的信息。本文的关键就是通过分析处理已给的数据,建立数学模型来研究葡萄酒质量的确立。为此,我们要依次达到题目给出的以下几个目标:2.1 两组
2、评价结果差异性和可信性研究问题一给出了两组评酒员对同一批葡萄酒的评价分数,本文采用假设检验中的t检验法建立评估两组数据差异的模型,研究两组评价员的评价结果是否存在差异,判断是否能接受它们有显著性差异的假设。若判断的结果是这两组数据存在差异,我们就进入第二步,可靠性研究。我们分别对两组数据求方差,方差小的那组说明波动比较小,评酒员的评定比较稳定,数据比较可靠。2.2酿酒葡萄的分级 首先,我们我们利用第一题的结果,用置信区间法对可信组的原始数据进行处理,降低评酒员之间的差异,提高酒样品之间的差异【1】;利用处理后的数据(总分)对葡萄酒进行分级;然后,用初步处理后的酿酒葡萄的理化指标对葡萄进行聚类分
3、析,将葡萄分成了若干类;分析每类葡萄对应的葡萄酒大都属于哪一级别,从而得出葡萄的级别;最后,分析每一级葡萄理化指标的特点,建立起葡萄指标识别葡萄级别的模型帮助果农更好地利用好葡萄酿好酒。2.3酿酒葡萄与葡萄酒理化指标的联系 问题三要求研究葡萄与葡萄酒理化指标之间的联系,我们先对于葡萄的30个理化指标进行主成分分析法,得到葡萄一些具有代表性的理化指标。然后我们建立葡萄的理化指标与葡萄酒的7个理化指标之间的多元线性回归方程,得到了酿酒葡萄与葡萄酒理化指标之间的定量联系。2.4 理化指标对葡萄酒质量的影响及论证问题四要求研究酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响,以及是否能完全用酿酒葡萄和葡萄
4、酒的理化指标评价葡萄酒的质量。我们将提取葡萄及葡萄酒的理化指标与芳香物质中的主成分,利用逐步回归的方法考察理化指标与芳香物质对葡萄酒质量的影响程度,通过对芳香物质对葡萄酒质量影响比重得到芳香物质对葡萄酒的质量有30%以上的影响比重(白葡萄的芳香物质对白葡萄酒的质量影响相对更大),故而不能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。三、问题假设1、同种葡萄酒在一组评酒员下的得分成正态分布。2、一种葡萄对应酿制一种葡萄酒。3、葡萄的成分充分转换成葡萄酒里的成分,不存在意外的浪费和挥发。4、假设葡萄和葡萄酒芳香物质中没有检测到的成分不存在于该样本中,数据处理前将其置为零。四、符号说明这里只列出
5、主要模型的全局参数,其他局部参数见文中。第i个红葡萄酒样品第i个白葡萄酒样品第一组评酒员全体酿酒红葡萄样本酿酒白葡萄样本五、建模的建立与求解5.1模型一:基于t检验建立差异评估模型我们采用假设性检验验证是否能接受两组评酒员评价结果无差异的假设。然后用方差分析两组评酒员组内数据的波动,认为较平稳的一组数据比较可靠。5.1.1数据预处理我们在整理数据的时候发现几个比较显著的异常数据:1)第一组红酒数据样品20色调品酒员4号 数据缺失;2)第一组白酒数据样品3持久性品酒员7号 数据明显有问题,怀疑是多敲了一个7;3)第一组白酒数据样品8口感分析浓度品酒员2号 数据明显异常。因为随机样本在均值附近振荡
6、,所以我们选用均值来代替异常数据以求误差最小。5.1.2基于成对数据的t检验【2】1)模型的建立:将两组评酒员分别看作两个整体、,对每个红葡萄酒样品(白葡萄酒样品)进行感官评价,对每个红葡萄酒样品的评价结果通过组内每一位品酒员的评分的均值来刻画,同样对每个红葡萄酒样品的评价结果用均值来刻画,从而得到两组评酒员对每种样品酒的评价结果,建立两组评酒员对红葡萄酒的评价结果见表1。表1 红葡萄酒的评价结果表中的数据是成对的,即对同一酒样品得到一对数据。可知一对与另一对数据之间差异是由各种因素,如葡萄酒的外观、香气、口感、材料成分等因素引起的。由于各酒样品的特性有广泛的差异,就不能将第一组评酒员对种红葡
7、萄酒的评价结果看成是同分布随机变量的观测值。因而表中第一行不能看成是一个样本的样本值,同样第二组的数据也不能看成是同一个样本的样本值,而同一对中两个数据是同分布随机变量的观测值,他们的差异是由于两组品酒员的水平引起的。为鉴定他们的评价结果有无显著性差异,可使用基于成对数据的逐对比较法。以红葡萄样品为例,有27对相互独立的评价结果:,令,则相互独立。由于是由同一因素所引起的,可认为它们服从同一分布。现假设,。就是说构成正态总体的一个样本,其中未知。基于这一样本检验假设: (1)分别记的样本均值和样本方差的观测值为,。对进行单个均值的t检验,检验问题的拒绝域为(显著水平为):. (2)当的值不落在
8、拒绝域内,接受,认为两组品酒员的评价结果没有显著差异,否则两组品酒员的评价结果有显著性差异。对白葡萄酒的处理同红葡萄。2)模型的求解: 现以红葡萄酒为例求解,首先,作出同一酒样品分别由两组品酒员、得到的评价结果之差,列于表1的第三行。根据建立的模型需检验假设.我们取=0.02,则,通过查表即知拒绝域为由观测值得,.现的值落在拒绝域内,故接受;同样对白葡萄酒进行成对数据的t检验,得白葡萄酒观测值之差的均值,故认为两组品酒员的评价结果有显著性差异。5.1.3可信度定量分析记第一组10位品酒员对红葡萄酒样品的评分为, , (3)其中,表示第一组品酒员对红葡萄酒样品的评分均值,表示的评分方差;同样,第
9、二组对红葡萄酒样品的评分均值和方差分别为, (4)从而对每一组品酒员得到一个评分方差向量同理可求得白葡萄酒的,。再对和中的元素分别求和得到方差和,用方差和对比得到对于同一批红葡萄两组不同的评价水平。方差和小的稳定性好,相对来说比另一组的评价结果是更可信的。运用excel软件进行求解,容易得到,具体附录一对红葡萄酒而言:元素的和为1409.3,元素的和为821.1。对白葡萄而言:元素的和为3183.1,元素的和为1388.5。不管是红葡萄酒还是白葡萄酒,第一组的方差和总是远远大于第一组。为了更直观的看到这个结果,下图即为两组评酒员对两种葡萄酒的方差图像,可以直观的看到第二组的波动程度比第一组的小
10、,第二组更可信。图1 两组品酒员对红、白葡萄酒的评分方差图5.2模型二:基于聚类分析建立酿酒葡萄分级模型我们根据可信组评酒员给每种酒样品的打分来确定葡萄酒的质量;再用聚类分析对酿酒葡萄进行分类,对每类的葡萄酿造的葡萄酒进行统计,对应地得到这类葡萄所对应的级别。5.2.1葡萄酒的分级1)置信区间法 置信区间法【2】能有效的降低评酒员之间的差异,提高酒样品之间的差异【1】,虽然我们在第一问中分辨出第二组评酒员评判出的数据更可靠,但是我们不能排除第一组评酒员的专业性,为了最可靠的样本,我们应该综合两组评价的分数。所以本文先采用置信区间法分别处理第一,二组数据,处理之后对同种葡萄酒的分数做一个平均。以
11、红葡萄酒为例用置信区间处理第一组数据,计算评酒员对酒样品评价的置信区间为其中为酒样的平均值;,为酒样的标准差。如果评酒员对酒样的评价在其置信区间范围内就可以直接使用; 如果其评价不在置信区间范围内, 则做如下变换:若,则若变换之后的仍不在置信区间范围内,再重复上面的变换,这样逐步调整,直至不同评酒员对同一酒样的评价值都处于范围内。对第二组数据做同样处理,再对同种酒样两组数据做平均。同样方法得到红白葡萄置信区间法处理后的数据见附录2。2)葡萄酒分级现在国际上对葡萄酒的分类流行用罗伯特帕克的分类方法【3】,即:96-100分 顶级葡萄酒90-95 分 具有高级品味特征和口感的葡萄酒80-89 分
12、品质优良,口感纯正70-79分 一般,略有瑕疵60-69分 低于一般50-59分次品,可以认为是一款不合格的葡萄酒 通过分析所有葡萄酒样品的最高分和最低分,我们发现处于运用罗伯特分级标准分级的此次过于宽泛,所以我们借鉴罗伯特的分级标准制定本文的对葡萄酒的分级标准,以更好的体现酒样之间的差异。葡萄酒样品的分级标准:8085分:高级葡萄酒7580分:中上级葡萄酒7075分:中级葡萄酒6570分:中下级葡萄酒6065分:下级葡萄酒 以下是根据1)的数据求得的葡萄酒总分的平均分 表2:红葡萄酒的评价结果(从高分到低分)根据分级标准很容易看出:高级红葡萄酒:无中上级红葡萄酒:9、23、20中级红葡萄酒:3、17、2、26、14、19、5、21、4、24、27、22中下级红葡萄酒:16、10、13、1、12、25、6、15、7、8下级红葡萄酒:18、11表3:白葡萄酒的评价结果(从高分到低分)白葡萄酒样品的分级:高级白葡萄酒:9、5、25中上级白葡萄酒:21、10、28、22、17、15、23、1、4、19、14、27、26、18、24、6、20、2、3中级白葡萄
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1