葡萄酒的评价.docx

上传人:b****5 文档编号:3790550 上传时间:2022-11-25 格式:DOCX 页数:23 大小:205.90KB
下载 相关 举报
葡萄酒的评价.docx_第1页
第1页 / 共23页
葡萄酒的评价.docx_第2页
第2页 / 共23页
葡萄酒的评价.docx_第3页
第3页 / 共23页
葡萄酒的评价.docx_第4页
第4页 / 共23页
葡萄酒的评价.docx_第5页
第5页 / 共23页
点击查看更多>>
下载资源
资源描述

葡萄酒的评价.docx

《葡萄酒的评价.docx》由会员分享,可在线阅读,更多相关《葡萄酒的评价.docx(23页珍藏版)》请在冰豆网上搜索。

葡萄酒的评价.docx

葡萄酒的评价

葡萄酒的评价

葡萄酒的评价

摘要

葡萄酒的评价问题是制酒行业需面对的重要问题,合理的解决评酒员对葡萄酒进行品质鉴定时出现的问题对其至关重要。

本文分别建立了方差模型、主成分分析模型、多元线性回归模型,解决了组间差异性、葡萄的分级、葡萄与酒的指标间的联系和理化指标对酒质量的影响四个问题,为葡萄酒的评价提出了一套科学的葡萄酒评价体系。

针对问题一,先对给定数据进行分析,剔除评分不完整或出错的数据。

然后对剩余数据进行加和取平均处理,得到各个评酒员对于酒样的总评分与每组平均分。

接着,建立单因素方差分析模型,用Matlab软件处理,求得红白葡萄酒样品的返回值,得出两组评酒员在红葡萄酒的打分上无显著性差异,在白葡萄酒的打分上有显著差异。

最后建立方差分析模型,对每一组评酒员的评分方差用Matlab软件求和,得出第二组方差较小,结果更可信。

针对问题二,由于给定的葡萄理化指标太多,我们采用主成分分析法来确定主成分,降低维度。

然后用min-max标准化方法对原始数据进行处理,得到标准总分值。

通过计算可以得到红葡萄的综合得分Y1红和红葡萄酒质量指标值Y2红,将二者按7∶3的比重计算加权可以得到总分Y。

最后按照分数段对葡萄进行分级。

针对问题三,我们以葡萄的理化指标的主因子为因变量,以葡萄酒理化指标的主因子自变量,建立多元线性回归方程模型。

然后由回归系数表中的系数大小得出酿酒葡萄中的各物质与葡萄酒中的各物质呈线性相关。

针对问题四,我们将问题合理转化为酒的理化指标对酒的得分的影响。

为了看二者的关系,我们对理化分数与葡萄酒的理化指标进行了相关性分析,建立了以酒的理化指标为自变量,酒的理化得分为因变量的多元线性回归方程。

回带理化指标后,将得到的分数除以其比重0.6,得到新的总分,将其与原总分做拟合,二者趋势相同,但拟合度很低,说明理化指标对酒质量有影响,但不能只用理化指标来评价葡萄酒的质量

本文所用模型先对错误数据进行了剔除,使结果更可信,并运用了主成分分析法,降低了维度,使模型的求解变得简单。

 

关键字:

单因素方差分析;方差分析;min-max标准化;多元线性回归

 

1.问题重述

葡萄酒的质量通过一些有资质的评酒员品评来确定的。

每个评酒员要先对样品葡萄酒进行品尝,再对各类指标打分,然后求和得总分,最后确定葡萄酒的质量。

葡萄酒的质量与酿酒葡萄的好坏有直接关系,酒和葡萄检测的理化指标在一定程度上反映酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

建立数学模型讨论下列问题:

1.分析附件1中两组评酒员的评价结果有无显著性差异,哪组结果更可信?

2.根据葡萄的理化指标和酒的质量对葡萄进行分级。

3.分析葡萄与酒的理化指标之间的联系。

4.分析葡萄和酒的理化指标对酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量.

2.基本假设

1.假设呈给评酒员的酒样品没有出错,品酒过程中无突发事件发生;

2.假设酿酒工艺和贮存条件等对葡萄酒质量及理化指标无影响;

3.假设酿酒葡萄和葡萄酒的理化指标和芳香物质在一定时间内不发生改变;

3.通用符号说明

序号

符号

符号的意义

1

anova1命令的返回值

2

第一组10位评委对红酒样品的总评分

3

第二组10位评委对红酒样品的总评分

4

第一组每位评酒员的评分方差

5

第二组每位评酒员的评分方差

6

红葡萄的综合得分

7

红葡萄酒质量指标值

4.问题一的模型建立与求解

4.1问题分析

由于所给数据存在错误,我们需要剔除出给定数据中明显错误的数据,以真实地反映出两组评酒员的差异及可信度问题。

由于数据量较大,我们需要通过求各组评酒员对于酒样品的总评对数据进行整合、简化。

对于两组评酒员的评价结果有无显著性差异的问题,因为影响因素只有组数,我们拟建立单因素方差分析[1]模型,打算用Matlab软件中的anova1命令来处理此均衡数据,得到返回值p,来评价两组评酒员的评分有无显著性差异。

对于哪组结果更可信问题,要通过组内成员的打分在均值周围的波动情况判断,所以我们拟建立方差分析[1]模型,通过编写Matlab程序来解决。

通过计算一、二组对红、白葡萄酒样品评分的方差和,比较得出方差和小的那一组结果更可信。

4.2数据处理

首先,附件1的第一组红葡萄酒品尝评分表中,4号评酒员对20号酒样品的色调未作评价,所以我们将此20号酒样品的色调数据剔除出去。

附件1的第一组白葡萄酒品尝评分表中,6号评酒员对3号酒样持久性打分超过满分,9号评酒员对8号酒样持久性打分超过满分,所以剔除数据。

然后求出第一组中每个评酒员对每个红葡萄酒样品的评分总和,将每个评酒员的评分总和相加,再取平均值,这样就得到了评酒员对每个红葡萄酒样品的平均分。

同理求得第二组中评酒员对每个红葡萄酒样品的平均分。

将红酒样品按序号排列,整理得到一二组红葡萄酒平均分表格,见附录1表1。

用同样的方法处理白酒样品的评分表,得到一二组白葡萄酒平均分表格,见附录1表2。

4.3模型的建立与求解

4.3.1单因素方差分析模型

对于两组评酒员的评价结果有无显著性差异的问题,由于只考虑一个因素A(不同组)对红、白葡萄酒质量评价的影响,可以建立两个单因素方差分析模型分别得出。

先看红葡萄酒,单因素A取两个水平A1,A2(即第一组和第二组),在水平Ai下总体xi服从正态分布N(μi,σ2),i=1,2,μi,σ2未知,μi可以不同,但假定xi有相同的方差。

又设在每个水平Ai下作了27次独立试验(即27个红葡萄酒样品),试验过程中除A外其他影响指标的因素都保持不变。

将这些数据列成下表形式。

表1.单因素分析表

A1

A2

x11x12…x127

x21x22…x227

xij为第i组第j次独立试验。

判断A的两个水平对评分有无显著影响,相当于要作以下假设检验:

不全相等

由于xij的取值受Ai与随机因素

的影响,所以需要将其分解:

(1)

其中

且相互独立。

为红葡萄酒样品得分的总均值,

为水平

对评分的效应,则:

(2)

(1)

(2)可将模型表示为

原假设为

,拒绝

,称因素A的影响非常显著;取

,不拒绝

,但取

,拒绝

,称因素A的影响显著;取

,不拒绝

,称因素A无显著影响。

此模型我们用Matlab统计工具箱中的单因素方差分析的anova1命令来求解。

本题的数据为均衡数据,处理方法为:

返回值p是一个概率,当

时接受

x为矩阵,第一列为第一组评酒员对每个红葡萄酒样品的平均分,第二列对应为第二组评酒员对这个红葡萄酒样品的平均分。

Matlab程序见附录1,运行结果见附录1。

由运行结果得返回值p=0.1159>α=0.05,说明说明第一组与第二组评酒员对红葡萄酒的打分无显著差异。

接着,我们将两组中的评酒员用单因素方差分析在组内进行比较,用Matlab软件中的anova1命令求解,程序同上。

由运行结果得出第一组的返回值为0.0006,第二组的返回值为0,说明第一组与第二组中的10位评酒员的评分间均有显著差异,他们在各项打分上都与平均值相差较大。

我们对白葡萄数据用同样方法处理,得到返回值为0.0226,说明第一组与第二组对白葡萄酒的打分有显著差异。

综上,我们由单因素方差分析模型得出:

两组在红葡萄酒的评分上无显著差异;两组在白葡萄酒的评分上存在显著差异。

4.3.2方差分析模型

为了解决哪组结果更可信的问题,我们建立方差分析模型如下:

记第一组10位评委对红酒样品的总评分为:

a1i(i=1,2,3…27);每一位评酒员的评分方差为S1i(i=1,2,3…27)。

第二组10位评委对红酒样品的评分为:

a2i(i=1,2,3…27);每一位评酒员的评分方差为S2i(i=1,2,3…27)。

再对S1i和S2i中的元素分别求和,得到两组品鉴红葡萄酒的方差和。

同理得出两组品鉴白葡萄酒的方差和。

结果如下:

表2一、二组对红、白葡萄酒样品评分的方差和表

方差和

第一组

第二组

红葡萄酒样品

1410.7

821.11

白葡萄酒样品

2970.5

1411.7

由上表得:

第二组对红白葡萄酒的方差和均比较小,说明第二组的结果更可信。

5.问题二的模型建立与求解

5.1问题分析

酿酒葡萄的分级与酿酒葡萄的理化指标和葡萄酒的质量有关。

对于酿酒葡萄的理化指标,由于给定指标很多,我们拟采用主成分分析法[1]来进行降维处理,通过计算主成分的贡献率,并累计贡献率,去除对分级影响小的指标。

接着,对各主成分得分排序。

对于葡萄酒的质量,由于问题一的结果得到第二组的评分更可信,我们选取第二组的数据。

将第二组10个评酒员的评分加和再取平均值,以平均值标准化后作为葡萄酒质量这一指标的值Y2红。

然后可以用min-max标准化方法对原始数据进行处理,得到标准总分值。

通过计算可以得到红葡萄的综合得分Y1红和红葡萄酒质量指标值Y2红,将二者按7∶3的比重计算加权可以得到总分Y红。

最后按照分数段对葡萄进行分级。

5.2模型的建立

主成分分析法模型建立过程如下[1]:

以红葡萄为例,我们有27个样本,每个样本有30个变量,将原始数据写成一个

阶的数据矩阵,

为第i个样本第j个变量的数据。

第一步,将矩阵用min-max方法标准化。

第二步,计算相关系数阵。

其公式为:

为第i个样本第j个变量的数据。

得到这样一个相关系数阵:

式中rij(i,j=1,2,…,30)为原始变量的xi与xj之间的相关系数。

第三步,计算R的特征值与特征向量。

解特征方程的特征值之后将其按从大到小排序。

然后分别求对应特征值的特征向量。

第四步计算主成分贡献率bi(i=1,2,3,…,10)及累计贡献率。

为红葡萄的公因子;

为红葡萄因子得分系数矩阵;

表示每个样品的30个指标;

第五步,得到各主成分的得分。

通过累计方差贡献率加权,求得每个红葡萄样品的综合得分Y1红。

yi为主成分。

5.3模型的求解

数据无量纲化及主成分分析的Matlab程序见附录2。

由运行结果,我们得到前10个标准化样本的累计贡献率达到了89%,所以我们取前10个为主成分。

表3.主成分贡献率表

主成分

1

2

3

4

5

贡献率

0.450798

0.291162

0.216053

0.165769

0.133675

主成分

6

7

8

9

10

贡献率

0.098459

0.093197

0.06944

0.051791

0.044838

由这十个主成分的贡献率大小,我们通过累计方差贡献率加权,求得每个红葡萄样品的综合得分Y1红。

然后按照7:

3的权重求得红葡萄与红葡萄酒样品的综合得分Y红。

红葡萄与红葡萄酒样品的综合得分Y红见附录2,我们将综合得分从大到小排序,等区间划分分数,得到葡萄的四个等级如下:

表4.红葡萄样品等级分配表

等级

等级分数段

红葡萄样品号

1

(1.11,1.30)

1,2,3,8

2

(0.81,1.11)

9,12,14,16,17,22,23

3

(0.51,0.80)

4,5,6,7,11,15,18,19,20,21,24,27

4

(0.20,0.50)

10,13,25,26

表5.白葡萄样品等级分配表

等级

等级分数段

白葡萄样品号

1

(0.501,0.75)

5,20,21,23,24,27,28

2

(0.251,0.500)

1,2,4,6,7,10,12,14,17,18,22,26

3

(0.001,0.250)

3,9,11,13,15,25

4

(-0.250,0.00)

8,16,19

由表格我们看出:

我们将红白葡萄各分为四个等级。

对红葡萄而言,葡萄的类别呈中间多、两头少的分布,中等质量的葡萄居于多数。

对白葡萄而言,前三个等级的葡萄战略大多数,质量差的葡萄较少。

6.问题三的模型建立与求解

6.1问题分析

为了分析酿酒葡萄与葡萄酒的理化指标之间的联系,我们打算建立线性回归方程,看二者是否相关。

因二者理化指标太多,我们需要利用问题二中得到的红葡萄与红葡萄酒理化指标的主因子来简化方程。

我们拟定方程红葡萄理化指标的主因子为因变量,红葡萄酒理化指标的主因子为自变量。

由回归系数表中的系数大小来得出酿酒葡萄中的各物质与葡萄酒中的各物质是否有密切联系。

6.2模型的建立

以红葡萄和红葡萄酒为例,多元回归模型建立方法如下:

设红葡萄理化指标的主因子花色苷、总酚、单宁和可溶性固形物为因变量Yi(i=1,2,3,4),红葡萄酒理化指标的主因子花色苷、单宁、总酚和酒总黄酮为自变量Xi(i=1,2,3,4)。

建立方程如下:

Lij为第i行j列的回归系数。

6.3模型的求解

对模型使用Matlab求解后分别得出以下4个回归方程

并且求出以上四个方程的相关系数R2,分别对应为

R2越接近1,则回归方程回归性越好。

由此得出这四个方程的回归性良好,回归模型成立。

可以由回归方程的系数大小比较得出红葡萄的主要影响指标与葡萄酒的主要理化指标之间的联系如下:

1.从整体看红葡萄的主要指标与红葡萄酒的主要指标成正相关。

2.红葡萄的花色苷指标与红葡萄酒的单宁指标正相关关系相对密切,与其他指标关系不明显;

3.红葡萄的总酚指标与红葡萄酒正相关关系密切,与其他指标关系不明显;

4.红葡萄的单宁指标与红葡萄酒酒总黄酮指标正相关关系密切,与其他指标关系不明显;

5.红葡萄的可溶性固形物指标与红葡萄酒总酚指标负相关关系密切,与其他指标管关系不明显。

使用同样的做法可以得出白葡萄与白葡萄酒理化指标之间的联系:

回归方程为:

R2分别为0.8379、0.8009、0.7447、0.8145;回归性良好,回归模型可以使用。

同样由回归方程的系数大小比较得出红葡萄的主要影响指标与葡萄酒的主要理化指标之间的联系如下:

1.从整体看红葡萄的主要指标与红葡萄酒的主要指标成正相关。

2.白葡萄的黄酮醇指标与白葡萄酒总酚指标正相关关系密切;

3.白葡萄的总糖指标与白葡萄酒的单宁指标正相关关系密切;

4.白葡萄的可滴定酸指标与白葡萄酒的总酚和酒总黄酮正相关关系密切;

5.白葡萄的干物质含量指标与白葡萄酒单宁指标及色泽b有明显正相关关系,与酒总黄酮有明显负相关关系。

7.问题四的模型建立与求解

7.1问题分析

由于在第三问得到了酿酒葡萄与葡萄酒的理化指标之间存在一定线性关系的结论[2],又由于酒的质量由评酒员的打分决定,酒有理化指标和芳香指标的区别,所以我们可以将问题转化为酒的理化指标对酒的得分的影响。

为了看二者的关系,需要对理化分数与葡萄酒的理化指标进行相关性分析,我们拟通过多元线性回归的方法,以酒的理化指标为自变量,酒的理化得分为因变量建立多元线性回归方程。

我们需要保留相关系数大的自变量,忽略系数小的自变量来简化方程。

然后将剩余自变量再做多元线性回归,得到新方程。

得到回归方程后用原理化指标计算新理化得分,之后我们再对这个得分M进行等比例放大得到整体分数。

我们打算将整体分数与原分数采用拟合的方法作比较。

若拟合度不高则不能只用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,反之则可以。

7.2模型的建立

我们以酒的理化指标为自变量,酒的理化得分为因变量,建立多元线性回归方程。

cij为第i行j列的回归系数。

Xi为自变量酒的理化指标,Yj为因变量。

我们需要保留相关系数大的自变量,忽略系数小的自变量。

然后将剩余自变量再做多元线性回归,得到新方程。

为第i行第m列相关系数,m为保留下来的自变量个数。

得到回归方程后用原理化指标计算新理化得分,我们打算称其为理化得分M.之后我们再对这个得分M进行等比例放大:

作为整体分数;之所以选择比例系数0.6,是因为在百分制中理化总分为60分。

接下来,我们定义得分差值率:

B为第一问中求得的葡萄酒样的总得分。

7.3模型的求解

用Matlab处理多元线性回归方程,程序见附录4。

去掉相关系数小的自变量后,再次建立方程,对得到的方程与数据做线性拟合,拟合程序及结果图见附录4。

由线性拟合图我们可以得到二者存在线性趋势,说明酿酒葡萄和葡萄酒的理化指标对葡萄酒质量有影响,但二者契合度不高,说明只用酿酒葡萄和葡萄酒的理化指标评价葡萄酒质量不合适。

我们再对得到的方程与数据做对数拟合,程序及拟合图见附录4。

我们可以看出二者整体上同增同减,但契合度依旧不高。

由上述过程,我们得出结论:

酿酒葡萄和葡萄酒的理化指标对葡萄酒质量有影响,但不能酿酒葡萄和葡萄酒的理化指标对葡萄酒质量有影响。

8.模型的评价

8.1模型的优点

1.问题一建立的方差分析模型,将可信度的比较转化为方差大小的比较,当评酒员组数增多时,此模型同样适用;

2.问题二建立的主成分分析法模型,提供了适应市场需求的葡萄分级方法,,此方法适用于大量物品的分类,在分级问题上应用广泛;

3.问题三与问题四建立的多元线性回归模型,分别以方程的形式表示出了酿酒葡萄与葡萄酒的理化指标之间的关系、葡萄酒的理化指标与葡萄酒质量之间的关系,将抽象的问题具体化,根据结果可以直观地看出要酿造满足某些理化指标的葡萄酒需要什么样的葡萄,很好的解决了酒商如何选葡萄的问题。

8.2模型的缺点及改进

1.针对问题一,可以再对第二组内的每个评酒员的评分做方差分析,看方差大小,进一步得出第二组内哪些评酒员更可靠。

2.针对问题四,可以通过加入葡萄酒的芳香指标,再做一次多元线性回归,用葡萄和葡萄酒的理化指标与芳香指标一起来评价葡萄酒的质量。

方法与问题四相同,最后看拟合度是否高,若拟合度很高,就可以说明可以用葡萄和葡萄酒的理化指标与芳香指标一起来评价葡萄酒的质量。

参考文献

[1]隋树林,数学建模教程[M],北京:

化学工业出版社,213-220页,2015.2

[2]吴启凡、贾楠、殷鸣,多模型评价体系的应用研究—以葡萄酒为例[J],数学的实践与认识,第45卷第13期:

9-17页,2015.7

 

附录

附录1.

表1.红葡萄样品酒的平均分

样品酒代号

1

2

3

4

5

6

7

第一组红

62.7

80.3

80.4

68.6

73.3

72.2

71.5

第二组红

68.1

74

74.6

71.2

72.1

66.3

65.3

样品酒代号

8

9

10

11

12

13

14

第一组红

72.3

81.5

74.2

70.1

53.9

74.6

73

第二组红

66

78.2

68.8

61.6

68.3

68.8

72.6

样品酒代号

15

16

17

18

19

20

21

第一组红

58.7

74.9

79.3

60.1

78.6

79.222

77.1

第二组红

65.7

69.9

74.5

65.4

72.6

75.8

72.2

样品酒代号

22

23

24

25

26

27

第一组红

77.2

85.6

78

69.2

73.8

73

第二组红

71.6

77.1

71.5

68.2

72

71.5

表2.白葡萄酒的平均分

样品酒代号

1

2

3

4

5

6

7

第一组白

82

74.2

85.3

79.4

71

68.4

77.5

第二组白

77.9

75.8

75.6

76.9

81.5

75.5

74.2

样品酒代号

8

9

10

11

12

13

14

第一组白

71.4

72.9

74.3

72.3

63.3

65.9

72

第二组白

72.3

80.4

79.8

71.4

72.4

73.9

77.1

样品酒代号

15

16

17

18

19

20

21

第一组白

72.4

74

78.8

73.1

72.2

77.8

76.4

第二组白

78.4

67.3

80.3

76.7

76.4

76.6

79.2

样品酒代号

22

23

24

25

26

27

28

第一组白

71

75.9

73.3

77.1

81.3

64.8

81.3

第二组白

79.4

77.4

76.1

79.5

74.3

77

79.6

3.Matlab程序:

B=S2;

A=B';

forj=1:

10

fori=1:

27

m=10*i-9;

n=10*i;

K(j,i)=sum(A(j,m:

n));

end

end

G=K';

fori=1:

27

S(i)=var(G(i,:

),1);

end

SS1=S';

SS=sum(S);

p=anova1(G);

C=[GSS1];

A=G;

fori=1:

26

H(i)=var(A(i,:

),1);

end

k=sum(H);

附录2.

1.数据无量纲化的代码

A=S1;

fori=1:

9;

forj=1:

27

a=min(A(:

i));b=max(A(:

i));c=A(j,i);

K(j,i)=(c-a)/(b-a);

end

end

2.主成成分分析代码

a=S2;

[coeff,score,latent]=princomp(a)

b=corrcoef(zscore(a))

D=tril(b)

[d,v]=eig(b)

y1=zscore(a)*d(:

7)

[f1,i1]=sort(y1);

[f2,i2]=sort(i1);

[flipud(i1),flipud(f1),f2]

y2=zscore(a)*d(:

6)

[f1,i1]=sort(y2);

[f2,i2]=sort(i1);

[flipud(i1),flipud(f1),f2]

y3=zscore(a)*d(:

5)

[f1,i1]=sort(y3);

[f2,i2]=sort(i1);

[flipud(i1),flipud(f1),f2]

y4=zscore(a)*d(:

4)

[f1,i1]=sort(y4);

[f2,i2]=sort(i1);

[flipud(i1),flipud(f1),f2]

y5=zscore(a)*d(:

3)

[f1,i1]=sort(y1);

[f2,i2]=sort(i1);

[flipud(i1),flipud(f1),f2]

y=y5*0.1058+y4*0.1388+y3*0.1719+y2*0.1934+y1*0.3901

[f1,i1]=sort(y);

[f2,i2]=sort(i1);

[flipud(i1),flipud(f1),f2]

xxx=sum(latent);

%fori=1:

30

%G(i)=100*latent(i)/xxx;

%end

3.

表3红葡萄与红葡萄酒样品的综合得分Y红表

红葡

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1