ImageVerifierCode 换一换
格式:DOCX , 页数:23 ,大小:205.90KB ,
资源ID:3790550      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/3790550.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(葡萄酒的评价.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

葡萄酒的评价.docx

1、葡萄酒的评价葡萄酒的评价葡萄酒的评价摘 要葡萄酒的评价问题是制酒行业需面对的重要问题,合理的解决评酒员对葡萄酒进行品质鉴定时出现的问题对其至关重要。本文分别建立了方差模型、主成分分析模型、多元线性回归模型,解决了组间差异性、葡萄的分级、葡萄与酒的指标间的联系和理化指标对酒质量的影响四个问题,为葡萄酒的评价提出了一套科学的葡萄酒评价体系。针对问题一,先对给定数据进行分析,剔除评分不完整或出错的数据。然后对剩余数据进行加和取平均处理,得到各个评酒员对于酒样的总评分与每组平均分。接着,建立单因素方差分析模型,用Matlab软件处理,求得红白葡萄酒样品的返回值,得出两组评酒员在红葡萄酒的打分上无显著性

2、差异,在白葡萄酒的打分上有显著差异。最后建立方差分析模型,对每一组评酒员的评分方差用Matlab软件求和,得出第二组方差较小,结果更可信。针对问题二,由于给定的葡萄理化指标太多,我们采用主成分分析法来确定主成分,降低维度。然后用 min-max 标准化方法对原始数据进行处理,得到标准总分值。通过计算可以得到红葡萄的综合得分 Y1红和红葡萄酒质量指标值Y2红,将二者按73的比重计算加权可以得到总分Y。最后按照分数段对葡萄进行分级。针对问题三,我们以葡萄的理化指标的主因子为因变量,以葡萄酒理化指标的主因子自变量,建立多元线性回归方程模型。然后由回归系数表中的系数大小得出酿酒葡萄中的各物质与葡萄酒中

3、的各物质呈线性相关。针对问题四,我们将问题合理转化为酒的理化指标对酒的得分的影响。为了看二者的关系,我们对理化分数与葡萄酒的理化指标进行了相关性分析,建立了以酒的理化指标为自变量,酒的理化得分为因变量的多元线性回归方程。回带理化指标后,将得到的分数除以其比重0.6,得到新的总分,将其与原总分做拟合,二者趋势相同,但拟合度很低,说明理化指标对酒质量有影响,但不能只用理化指标来评价葡萄酒的质量本文所用模型先对错误数据进行了剔除,使结果更可信,并运用了主成分分析法,降低了维度,使模型的求解变得简单。关键字:单因素方差分析;方差分析;min-max 标准化;多元线性回归1.问题重述葡萄酒的质量通过一些

4、有资质的评酒员品评来确定的。每个评酒员要先对样品葡萄酒进行品尝,再对各类指标打分,然后求和得总分,最后确定葡萄酒的质量。葡萄酒的质量与酿酒葡萄的好坏有直接关系,酒和葡萄检测的理化指标在一定程度上反映酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪组结果更可信?2. 根据葡萄的理化指标和酒的质量对葡萄进行分级。3. 分析葡萄与酒的理化指标之间的联系。4分析葡萄和酒的理化指标对酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量.

5、2.基本假设1.假设呈给评酒员的酒样品没有出错,品酒过程中无突发事件发生;2.假设酿酒工艺和贮存条件等对葡萄酒质量及理化指标无影响;3.假设酿酒葡萄和葡萄酒的理化指标和芳香物质在一定时间内不发生改变; 3.通用符号说明序号符号符号的意义1anova1命令的返回值2第一组10位评委对红酒样品的总评分3第二组10位评委对红酒样品的总评分4第一组每位评酒员的评分方差5第二组每位评酒员的评分方差6红葡萄的综合得分7红葡萄酒质量指标值4.问题一的模型建立与求解4.1问题分析由于所给数据存在错误,我们需要剔除出给定数据中明显错误的数据,以真实地反映出两组评酒员的差异及可信度问题。由于数据量较大,我们需要通

6、过求各组评酒员对于酒样品的总评对数据进行整合、简化。对于两组评酒员的评价结果有无显著性差异的问题,因为影响因素只有组数,我们拟建立单因素方差分析1模型,打算用Matlab软件中的anova1命令来处理此均衡数据,得到返回值p,来评价两组评酒员的评分有无显著性差异。对于哪组结果更可信问题,要通过组内成员的打分在均值周围的波动情况判断,所以我们拟建立方差分析1模型,通过编写Matlab程序来解决。通过计算一、二组对红、白葡萄酒样品评分的方差和,比较得出方差和小的那一组结果更可信。 4.2数据处理首先,附件1的第一组红葡萄酒品尝评分表中,4号评酒员对20号酒样品的色调未作评价,所以我们将此20号酒样

7、品的色调数据剔除出去。附件1的第一组白葡萄酒品尝评分表中,6号评酒员对3号酒样持久性打分超过满分,9号评酒员对8号酒样持久性打分超过满分,所以剔除数据。然后求出第一组中每个评酒员对每个红葡萄酒样品的评分总和,将每个评酒员的评分总和相加,再取平均值,这样就得到了评酒员对每个红葡萄酒样品的平均分。同理求得第二组中评酒员对每个红葡萄酒样品的平均分。将红酒样品按序号排列,整理得到一二组红葡萄酒平均分表格,见附录1表1。用同样的方法处理白酒样品的评分表,得到一二组白葡萄酒平均分表格,见附录1表2。4.3模型的建立与求解4.3.1单因素方差分析模型对于两组评酒员的评价结果有无显著性差异的问题,由于只考虑一

8、个因素A(不同组)对红、白葡萄酒质量评价的影响,可以建立两个单因素方差分析模型分别得出。先看红葡萄酒,单因素A取两个水平A1,A2(即第一组和第二组),在水平Ai下总体xi服从正态分布N(i,2),i=1,2, i,2未知,i可以不同,但假定xi有相同的方差。又设在每个水平Ai下作了27次独立试验(即27个红葡萄酒样品),试验过程中除A外其他影响指标的因素都保持不变。将这些数据列成下表形式。表1. 单因素分析表A1A2x11 x12 x127x21 x22 x227xij为第i组第j次独立试验。判断A的两个水平对评分有无显著影响,相当于要作以下假设检验:不全相等由于xij的取值受Ai与随机因素

9、的影响,所以需要将其分解: (1)其中,且相互独立。记为红葡萄酒样品得分的总均值,为水平对评分的效应,则: (2)由(1)(2)可将模型表示为原假设为 取,拒绝,称因素A的影响非常显著;取,不拒绝,但取,拒绝,称因素A的影响显著;取,不拒绝,称因素A无显著影响。此模型我们用Matlab统计工具箱中的单因素方差分析的anova1命令来求解。本题的数据为均衡数据,处理方法为: 返回值p是一个概率,当时接受。x为矩阵,第一列为第一组评酒员对每个红葡萄酒样品的平均分,第二列对应为第二组评酒员对这个红葡萄酒样品的平均分。Matlab程序见附录1,运行结果见附录1。由运行结果得返回值p=0.1159=0.

10、05,说明说明第一组与第二组评酒员对红葡萄酒的打分无显著差异。接着,我们将两组中的评酒员用单因素方差分析在组内进行比较,用Matlab软件中的anova1命令求解,程序同上。由运行结果得出第一组的返回值为0.0006,第二组的返回值为0,说明第一组与第二组中的10位评酒员的评分间均有显著差异,他们在各项打分上都与平均值相差较大。我们对白葡萄数据用同样方法处理,得到返回值为0.0226,说明第一组与第二组对白葡萄酒的打分有显著差异。综上,我们由单因素方差分析模型得出:两组在红葡萄酒的评分上无显著差异;两组在白葡萄酒的评分上存在显著差异。 4.3.2方差分析模型为了解决哪组结果更可信的问题,我们建

11、立方差分析模型如下:记第一组10位评委对红酒样品的总评分为:a1i(i=1,2,327);每一位评酒员的评分方差为S1i(i=1,2,327)。第二组10位评委对红酒样品的评分为:a2i(i=1,2,327); 每一位评酒员的评分方差为S2i(i=1,2,327)。再对S1i和S2i中的元素分别求和,得到两组品鉴红葡萄酒的方差和。同理得出两组品鉴白葡萄酒的方差和。结果如下:表2 一、二组对红、白葡萄酒样品评分的方差和表方差和第一组第二组红葡萄酒样品1410.7821.11白葡萄酒样品2970.51411.7由上表得:第二组对红白葡萄酒的方差和均比较小,说明第二组的结果更可信。5.问题二的模型建

12、立与求解5.1问题分析酿酒葡萄的分级与酿酒葡萄的理化指标和葡萄酒的质量有关。对于酿酒葡萄的理化指标,由于给定指标很多,我们拟采用主成分分析法1来进行降维处理,通过计算主成分的贡献率,并累计贡献率,去除对分级影响小的指标。接着,对各主成分得分排序。对于葡萄酒的质量,由于问题一的结果得到第二组的评分更可信,我们选取第二组的数据。将第二组10个评酒员的评分加和再取平均值,以平均值标准化后作为葡萄酒质量这一指标的值Y2红。然后可以用 min-max 标准化方法对原始数据进行处理,得到标准总分值。通过计算可以得到红葡萄的综合得分 Y1红和红葡萄酒质量指标值Y2红,将二者按73的比重计算加权可以得到总分Y

13、红。最后按照分数段对葡萄进行分级。5.2模型的建立主成分分析法模型建立过程如下1:以红葡萄为例,我们有27个样本,每个样本有30个变量,将原始数据写成一个阶的数据矩阵,为第i个样本第j个变量的数据。第一步,将矩阵用min-max方法标准化。第二步,计算相关系数阵。其公式为:为为第i个样本第j个变量的数据。得到这样一个相关系数阵:式中rij(i,j=1,2,30)为原始变量的xi与xj之间的相关系数。第三步,计算R的特征值与特征向量。解特征方程的特征值之后将其按从大到小排序。然后分别求对应特征值的特征向量。第四步计算主成分贡献率bi(i=1,2,3,10)及累计贡献率。为红葡萄的公因子; 为红葡

14、萄因子得分系数矩阵;表示每个样品的30个指标;第五步,得到各主成分的得分。通过累计方差贡献率加权,求得每个红葡萄样品的综合得分Y1红。yi为主成分。5.3模型的求解数据无量纲化及主成分分析的Matlab程序见附录2。由运行结果,我们得到前10个标准化样本的累计贡献率达到了89%,所以我们取前10个为主成分。表3.主成分贡献率表主成分12345贡献率0.4507980.2911620.2160530.1657690.133675主成分678910贡献率0.0984590.0931970.069440.0517910.044838由这十个主成分的贡献率大小,我们通过累计方差贡献率加权,求得每个红葡

15、萄样品的综合得分Y1红。然后按照7:3的权重求得红葡萄与红葡萄酒样品的综合得分Y红。红葡萄与红葡萄酒样品的综合得分Y红见附录2 ,我们将综合得分从大到小排序,等区间划分分数,得到葡萄的四个等级如下: 表4.红葡萄样品等级分配表等级等级分数段红葡萄样品号1(1.11,1.30)1,2,3,82(0.81,1.11)9,12,14,16,17,22,233(0.51,0.80)4,5,6,7,11,15,18,19,20,21,24,274(0.20,0.50)10,13,25,26表5.白葡萄样品等级分配表等级等级分数段白葡萄样品号1(0.501,0.75)5,20,21,23,24,27,28

16、2(0.251,0.500)1,2,4,6,7,10,12,14,17,18,22,263(0.001,0.250)3,9,11,13,15,254(-0.250,0.00)8,16,19 由表格我们看出:我们将红白葡萄各分为四个等级。对红葡萄而言,葡萄的类别呈中间多、两头少的分布,中等质量的葡萄居于多数。对白葡萄而言,前三个等级的葡萄战略大多数,质量差的葡萄较少。6.问题三的模型建立与求解6.1问题分析为了分析酿酒葡萄与葡萄酒的理化指标之间的联系,我们打算建立线性回归方程,看二者是否相关。因二者理化指标太多,我们需要利用问题二中得到的红葡萄与红葡萄酒理化指标的主因子来简化方程。我们拟定方程红

17、葡萄理化指标的主因子为因变量,红葡萄酒理化指标的主因子为自变量。由回归系数表中的系数大小来得出酿酒葡萄中的各物质与葡萄酒中的各物质是否有密切联系。6.2模型的建立以红葡萄和红葡萄酒为例,多元回归模型建立方法如下:设红葡萄理化指标的主因子花色苷、总酚、单宁和可溶性固形物为因变量Yi(i=1,2,3,4),红葡萄酒理化指标的主因子花色苷、单宁、总酚和酒总黄酮为自变量Xi(i=1,2,3,4)。建立方程如下:Lij为第i行j列的回归系数。6.3模型的求解对模型使用Matlab求解后分别得出以下4个回归方程 并且求出以上四个方程的相关系数R2,分别对应为R2越接近1,则回归方程回归性越好。由此得出这四

18、个方程的回归性良好,回归模型成立。可以由回归方程的系数大小比较得出红葡萄的主要影响指标与葡萄酒的主要理化指标之间的联系如下:1.从整体看红葡萄的主要指标与红葡萄酒的主要指标成正相关。2.红葡萄的花色苷指标与红葡萄酒的单宁指标正相关关系相对密切,与其他指标关系不明显;3.红葡萄的总酚指标与红葡萄酒正相关关系密切,与其他指标关系不明显;4.红葡萄的单宁指标与红葡萄酒酒总黄酮指标正相关关系密切,与其他指标关系不明显;5.红葡萄的可溶性固形物指标与红葡萄酒总酚指标负相关关系密切,与其他指标管关系不明显。使用同样的做法可以得出白葡萄与白葡萄酒理化指标之间的联系:回归方程为:R2分别为0.8379、0.8

19、009、0.7447、0.8145;回归性良好,回归模型可以使用。同样由回归方程的系数大小比较得出红葡萄的主要影响指标与葡萄酒的主要理化指标之间的联系如下:1.从整体看红葡萄的主要指标与红葡萄酒的主要指标成正相关。2.白葡萄的黄酮醇指标与白葡萄酒总酚指标正相关关系密切;3.白葡萄的总糖指标与白葡萄酒的单宁指标正相关关系密切;4.白葡萄的可滴定酸指标与白葡萄酒的总酚和酒总黄酮正相关关系密切;5.白葡萄的干物质含量指标与白葡萄酒单宁指标及色泽b有明显正相关关系,与酒总黄酮有明显负相关关系。7.问题四的模型建立与求解7.1问题分析 由于在第三问得到了酿酒葡萄与葡萄酒的理化指标之间存在一定线性关系的结

20、论 2,又由于酒的质量由评酒员的打分决定,酒有理化指标和芳香指标的区别,所以我们可以将问题转化为酒的理化指标对酒的得分的影响。为了看二者的关系,需要对理化分数与葡萄酒的理化指标进行相关性分析,我们拟通过多元线性回归的方法,以酒的理化指标为自变量,酒的理化得分为因变量建立多元线性回归方程。我们需要保留相关系数大的自变量,忽略系数小的自变量来简化方程。然后将剩余自变量再做多元线性回归,得到新方程。得到回归方程后用原理化指标计算新理化得分,之后我们再对这个得分M进行等比例放大得到整体分数。我们打算将整体分数与原分数采用拟合的方法作比较。若拟合度不高则不能只用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,

21、反之则可以。7.2模型的建立我们以酒的理化指标为自变量,酒的理化得分为因变量,建立多元线性回归方程。cij为第i行j列的回归系数。Xi为自变量酒的理化指标,Yj为因变量。我们需要保留相关系数大的自变量,忽略系数小的自变量。然后将剩余自变量再做多元线性回归,得到新方程。为第i行第m列相关系数,m为保留下来的自变量个数。得到回归方程后用原理化指标计算新理化得分,我们打算称其为理化得分M之后我们再对这个得分M进行等比例放大: 作为整体分数;之所以选择比例系数0.6,是因为在百分制中理化总分为60分。接下来,我们定义得分差值率:B为第一问中求得的葡萄酒样的总得分。7.3模型的求解用Matlab处理多元

22、线性回归方程,程序见附录4。去掉相关系数小的自变量后,再次建立方程,对得到的方程与数据做线性拟合,拟合程序及结果图见附录4。由线性拟合图我们可以得到二者存在线性趋势,说明酿酒葡萄和葡萄酒的理化指标对葡萄酒质量有影响,但二者契合度不高,说明只用酿酒葡萄和葡萄酒的理化指标评价葡萄酒质量不合适。我们再对得到的方程与数据做对数拟合,程序及拟合图见附录4。我们可以看出二者整体上同增同减,但契合度依旧不高。由上述过程,我们得出结论:酿酒葡萄和葡萄酒的理化指标对葡萄酒质量有影响,但不能酿酒葡萄和葡萄酒的理化指标对葡萄酒质量有影响。8.模型的评价8.1模型的优点1问题一建立的方差分析模型,将可信度的比较转化为

23、方差大小的比较,当评酒员组数增多时,此模型同样适用;2问题二建立的主成分分析法模型,提供了适应市场需求的葡萄分级方法,此方法适用于大量物品的分类,在分级问题上应用广泛;3问题三与问题四建立的多元线性回归模型,分别以方程的形式表示出了酿酒葡萄与葡萄酒的理化指标之间的关系、葡萄酒的理化指标与葡萄酒质量之间的关系,将抽象的问题具体化,根据结果可以直观地看出要酿造满足某些理化指标的葡萄酒需要什么样的葡萄,很好的解决了酒商如何选葡萄的问题。8.2模型的缺点及改进1.针对问题一,可以再对第二组内的每个评酒员的评分做方差分析,看方差大小,进一步得出第二组内哪些评酒员更可靠。2.针对问题四,可以通过加入葡萄酒

24、的芳香指标,再做一次多元线性回归,用葡萄和葡萄酒的理化指标与芳香指标一起来评价葡萄酒的质量。方法与问题四相同,最后看拟合度是否高,若拟合度很高,就可以说明可以用葡萄和葡萄酒的理化指标与芳香指标一起来评价葡萄酒的质量。参考文献1隋树林,数学建模教程M,北京:化学工业出版社,213-220页,2015.22 吴启凡、贾楠、殷鸣,多模型评价体系的应用研究以葡萄酒为例J,数学的实践与认识,第45卷第13期:9-17页,2015.7附录附录1.表1.红葡萄样品酒的平均分样品酒代号1234567第一组红62.780.380.468.673.372.271.5第二组红68.17474.671.272.166

25、.365.3样品酒代号891011121314第一组红72.381.574.270.153.974.673第二组红6678.268.861.668.368.872.6样品酒代号15161718192021第一组红58.774.979.360.178.679.22277.1第二组红65.769.974.565.472.675.872.2样品酒代号222324252627第一组红77.285.67869.273.873第二组红71.677.171.568.27271.5表2.白葡萄酒的平均分样品酒代号1234567第一组白8274.285.379.47168.477.5第二组白77.975.875

26、.676.981.575.574.2样品酒代号891011121314第一组白71.472.974.372.363.365.972第二组白72.380.479.871.472.473.977.1样品酒代号15161718192021第一组白72.47478.873.172.277.876.4第二组白78.467.380.376.776.476.679.2样品酒代号22232425262728第一组白7175.973.377.181.364.881.3第二组白79.477.476.179.574.37779.63.Matlab程序:B=S2;A=B;for j=1:10 for i=1:27 m

27、=10*i-9; n=10*i; K(j,i)=sum(A(j,m:n); endendG=K;for i=1:27 S(i)=var(G(i,:),1);endSS1=S;SS=sum(S);p=anova1(G);C=G SS1;A=G;for i=1:26 H(i)=var(A(i,:),1);endk=sum(H);附录2.1.数据无量纲化的代码A=S1;for i=1:9; for j=1:27 a=min(A(:,i);b=max(A(:,i);c=A(j,i); K(j,i)=(c-a)/(b-a); endend2.主成成分分析代码a=S2;coeff,score,latent

28、=princomp(a)b=corrcoef(zscore(a)D=tril(b)d,v=eig(b)y1=zscore(a)*d(:,7)f1,i1=sort(y1);f2,i2=sort(i1);flipud(i1),flipud(f1),f2y2=zscore(a)*d(:,6)f1,i1=sort(y2);f2,i2=sort(i1);flipud(i1),flipud(f1),f2y3=zscore(a)*d(:,5)f1,i1=sort(y3);f2,i2=sort(i1);flipud(i1),flipud(f1),f2y4=zscore(a)*d(:,4)f1,i1=sort(

29、y4);f2,i2=sort(i1);flipud(i1),flipud(f1),f2y5=zscore(a)*d(:,3)f1,i1=sort(y1);f2,i2=sort(i1);flipud(i1),flipud(f1),f2y=y5*0.1058+y4*0.1388+y3*0.1719+y2*0.1934+y1*0.3901f1,i1=sort(y);f2,i2=sort(i1);flipud(i1),flipud(f1),f2xxx=sum(latent);%for i=1:30 %G(i)=100*latent(i)/xxx;%end3.表3 红葡萄与红葡萄酒样品的综合得分Y红表红葡

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1