ImageVerifierCode 换一换
格式:DOCX , 页数:29 ,大小:110.30KB ,
资源ID:7155012      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7155012.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(葡萄酒评价模型.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

葡萄酒评价模型.docx

1、葡萄酒评价模型葡萄酒评价模型摘 要本文运用统计学方法利用题目中所给的样本数据,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,建立模型解决葡萄酒质量评价问题,从而确定酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标在一定程度上反应了葡萄和葡萄酒的质量。问题一,首先根据附件一中的两组评酒员对葡萄酒分类指标的分数并借助Excel软件得到每组评酒员对同一葡萄酒样品所给出的分数平均值,利用SPSS软件对所得数据进行t检验,证明两组评价结果有显著差异。要评价哪一组评价结果更可信,采用平均值方差分析方法,用Excel计算每组中评酒员所给出样品成绩与平均值间的偏差,分析其变化趋势

2、与大小,判定第二组的评价结果更可信。问题二,通过主成分分析法根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄综合指标打分,综合第一问结果采用层次聚类法对酿酒葡萄进行分级,划分出酿酒葡萄的等级都为四级。问题三,运用双变量分析法,分别将红,白酿酒葡萄的等级和葡萄酒的理化指标进行双变量分析,求出酿酒葡萄等级与葡萄酒每一个理化指标的sig值来判断酿酒葡萄等级与葡萄酒的显著相关性。得出如下结论: 1红葡萄酒理化指标中花色苷、总酚、酒总黄酮、DPPH半抑制体积、L*(D与红酿酒葡萄有显著性相关。2白葡萄酒理化指标中L*、b*与白酿酒葡萄有显著性相关。问题四,利用逐步线性回归法和进步线性回归法,将葡萄酒的每一

3、个指标和对应的酿酒葡萄等级作为自变量,将第二组评酒员对葡萄酒的评分作为因变量,进行线性回归运算。判断因变量与自变量的显著相关性,来判别哪几个自变量对因变量有影响,即判断葡萄酒质量受哪些因素影响。其中红葡萄酒:回归平方和=202.370 残差平方和=209.064 总计平方和=411.434 F值为24.200 sig值小于0.05,所以线性回归方程Z=-0.139X1+0.176X2+0.208X3+0.241X4-0.133X5+2.910Y有效。白葡萄酒:回归平方和=124.312 残差平方和=147.169 总计平方和=2771.481 F值=21.962 sig值小于0、05,所以线性

4、回归方程Z=0.130X1-0.145X2+1.862Y有效。红酿酒葡萄和白酿酒葡萄的显著性相关的解释率分别为49.2%和45.8%。结论:分析出无论是白葡萄酒还是红葡萄酒,葡萄酒的质量都与酿酒葡萄的指标等级有显著性相关,并且红葡萄酒除了用红酿酒葡萄指标等级来评价,其次也可以用红葡萄酒的理化指标来评价红葡萄酒的质量。关键词:SPSS统计 t检验 主成分分析 聚类分析 多元线性回归 一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评,每个评酒员在对葡萄酒进行品尝后客观地对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄

5、酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量二、问题分析第一个问题属于显著性差异分析的数学问题,即比较两组中十位评酒员给出的平均成绩有无显著性差异。两组

6、评酒员的评分是成对的,即对同一酒样品测出一对数据,这样局限于各对中两个数据来比较,只考虑单独由两组评酒员所产生的影响从而比较这两组评酒员的评价结果有无显著性差异,要解决这个问题采用配对样品t检验分析的方法。评价哪一组的结果更可信,采用分析偏方差和的方法,得出结论。第二个问题,通过对酿酒葡萄的分级,我们能选择不同等级的葡萄去酿葡萄酒,这样保证我们酿出的酒的品质大致相同。这属于数据分类方面的数学问题,我们采用主成分分析法和聚类分析法解决这个问题。第三个问题,我们认为基于实际作用,应该是酿酒葡萄的等级与葡萄酒理化指标的关系。所以我们认为这是一个双变量相关性问题。一个变量为第二题的数据结果分析出来的等

7、级,另一个变量为葡萄酒的一级指标。第四个问题,我们将第四个问题理解为:酿酒葡萄等级和葡萄酒的理化指标对葡萄酒质量的影响,利用线性回归处理该问题。三、模型假设1.题中红葡萄酒与白葡萄酒没有显著的性质差别,可以用同样的方法分析。2.假设所有样本发酵条件相同。3.假设所有瓶酒师的味觉分析能力正常。4.不考虑工艺因素对结果的影响。四、符号表示:t检验显著性水平H0:接受假设H1:拒绝假设五、模型建立与求解5-1葡萄酒质量评价结果分析模型5-1-1显著性差异分析1分析显著性差异是一种有量度的或然性评价,如果我们判定两组数据在0.05水平上具备显著性差异,这是说这两组数据具备念珠性差异的可能性为95%,这

8、两组数据所代表的样本还有5%的可能性是没有显著性差异的,这5%的差异的由于随机误差造成的。通常情况下,实验结果达到0.05水平或者0.01水平,才可以说数据之间具有显著性差异而在做出结论时,应确定描述方向性。2比较均值由附件1根据评酒员给出的各项指标成绩,用Excel将各项成绩相加得出每种酒样品的得分均值白葡萄酒评分中有异常数据,处理后得到结果如下表:表1:第一组和第二组评酒师对红葡萄酒的评分均值第一组62.780.380.468.673.372.271.572.381.5第二组68.17474.671.272.166.365.36678.2第一组74.270.153.974.67358.77

9、4.979.360.1第二组68.861.668.368.872.665.769.974.565.4第一组78.679.277.177.285.67869.273.873第二组72.675.872.271.677.171.568.27271.5表2:第一组和第二组评酒师对白葡萄酒的评分均值第一组8274.285.379.47168.477.571.4第二组77.975.875.676.981.575.574.272.3第一组72.974.372.363.565.97272.474第二组80.479.871.472.473.977.178.467.3第一组78.873.172.277.876.4

10、7175.973.3第二组80.376.776.476.679.279.477.476.1第一组77.181.364.881.3第二组79.574.37779.6由表中数据进行MATLAB编程(程序见附录),做出均值分布图,如下:图1通过图像观察可知,两组评酒员对红葡萄酒和白葡萄酒的评价结果在某点处相差很大,初步判定两组评价结果有明显差异。 3配对样本t检验t检验模型:注:d为样本均值;SD为样本方差建立假设,确定显著性水平,两组评分差异没有特定的方向,所以用双边假设检验 Ho:=0,H1:0 在显著性水平=0.05下,检验初步判定结果。红葡萄酒检验:n=27, t/2(n-1)=1.7033

11、,即拒绝域为|t|1.7033根据公式得到|t|的值落在拒绝域内,即两组对红葡萄酒的评价结果有显著性差异。白葡萄酒检验:n=28, t/2(n-1)=1.7011,即拒绝域为|t|1.7011根据公式得到|t|的值落在拒绝域内,即两组对白葡萄酒的评价结果有显著性差异。5-1-2可信度分析有附件1数据,利用Excel计算的两组数据的偏方差和,得到第二组红葡萄的偏方差和为8211,第二组白葡萄的偏方差和14244小于第一组红葡萄的偏方差和14244和第一组白葡萄的偏方差和32555,即第二组评分更加稳定。5-2该问题属于聚类分析对变量分级,首先,我们认为葡萄酒质量可以根据第一题分析结果,采取第二组

12、对葡萄酒的评分为葡萄酒质量的分级标准。对于多次测量的指标我们选择其多次测量的平均值,针对不同等级的指标,我们选择运用主成分分析法,对酿酒葡萄的理化指标进行分析,然后对主成份分析结果与标准化后的第二组对葡萄酒评分数据进行聚类分析。最后将酿酒葡萄的理化指标分类,把每一类酿酒葡萄的对应与第二组评分的平均值进行比较,完成对酿酒葡萄的分级。聚类分析:我们所研究的样品(网点)或指标(变量)之间存在程度不同的相似性(亲疏关系以样品间距离衡量)。于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据。把一些相似程度较大的样品(或指标)聚合为一类,把另外

13、一些彼此之间相似程度较大的样品(或指标)又聚合为另一类,直到把所有的样品(或指标)聚合完毕,这就是分类的基本思想。主成分分析:是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的

14、信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,第P个主成分。 主成份分析数学模型:F0=a11ZX1+a21ZX2+ap1ZXp其中a11, a21, , ap1( i=1,m)为X的协方差阵的特征值所对应的特征向量,ZX1, ZX2 , ZXp是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计

15、算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响注:本文指的数据标准化是指Z标准化。 A=(aij)pm=(a1,a2,am,),Rai=iai,R为相关系数矩阵,i、ai是相应的特征值和单位特征向量,12p0 。 进行主成分分析主要步骤如下: 1. 指标数据标准化(SPSS软件自动执行); 2. 指标之间的相关性判定; 3. 确定主成分个数m; 4. 主成分Fi表达式; 5. 主成分Fi命名; 首先将所给红酿酒葡萄的一级指标筛选出来并整理,然后将数据直接导入SPSS软件中进行因子分析,方法采用主成份分析法,得到数据,表3、表4为所得数据的主要部分。解释的总方差成份

16、初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %16.99424.97724.9776.99424.97724.97724.66916.67441.6514.66916.67441.65133.07010.96652.6173.07010.96652.61742.83610.13062.7472.83610.13062.74751.9787.06469.8111.9787.06469.81161.6285.81575.6271.6285.81575.62771.2184.35079.9771.2184.35079.97781.1093.96183.9381.1093.961

17、83.9389.8853.15987.09710.7182.56489.66111.6342.26591.92612.5011.78893.71313.3851.37595.08914.3181.13696.22515.235.83897.06216.226.80797.87017.192.68598.55518.173.61799.17119.075.26699.43820.064.22899.66521.043.15299.81722.022.08099.89723.016.05699.95324.010.03699.98925.002.00999.99826.001.002100.000

18、271.977E-157.059E-15100.000281.944E-166.941E-16100.000提取方法:主成份分析。成份矩阵a成份12345678总酚.859-.073.301-.118-.030.009.014-.329花色苷.838-.026.098.360.067-.145.043-.069DPPH.792-.391.194-.131-.025.190-.004-.203单宁.748-.063.348.193-.198.093-.240-.022葡萄总黄酮.737-.214.397-.155-.004.001-.122-.309果皮颜色.659-.163.431-.026-

19、.123-.368-.060.362蛋白质.658-.464-.046-.268.229.180-.033.037果梗比.598-.123-.284.159-.338.372.161.070出汁率.591-.148.483-.053-.078-.439-.086.361干物质含量.294.898.151-.067.090-.019-.051.118可溶性固体.168.824.285-.079.119-.005.169-.058总糖.200.822.181-.235.091-.103.197.059还原糖.015.773.070-.135.119-.060.108.205氨基酸总量.320.58

20、7-.011-.475-.186.329.022.094果皮质量-.271-.184.604.301.323.393.035.203白藜芦醇.160-.177-.576-.238-.256-.028-.004.150可滴定酸-.374.467.554.151-.364.135-.287-.016百粒质量-.527-.365.551.081.237.123.099-.020PH.320-.266.028-.710.147-.120.360.090褐变度.592-.013-.230.681-.014-.030.128.061多分氧化酶.277.185-.008.622.279.193.257.07

21、5苹果酸.372.304-.246.614.017-.371-.011-.081vc-.088-.431-.032-.008-.577-.101.143.456果穗质量-.299-.479.343.031.565.047-.008.291固酸比.424-.055-.389-.101.544-.233.316-.022黄酮醇.541.111-.095.071-.088.685.209.251柠檬酸.300.164-.484.246.363.076-.535.252酒石酸.386.081-.276-.470.347.141-.517.109提取方法 :主成份。a. 已提取了 8 个成份。对一级指标

22、主成份分析后所得变量和第二组评分标准化后的变量采用SPSS聚类分析的系统聚类,聚类方法为WORD法,主要数据结果如下:图2根据第一题算得第二组在白葡萄酒和红葡萄酒的偏方差和较第一组小,可靠性更高,所以我们认为应该将第二组对每个酒样品的评分作为葡萄酒质量的评判标准。于是我们将红葡萄酒的4类酒样品中的每个酒样品一一对应第二组对红葡萄酒的评分,然后将每一类酒样品的平均评分求出,然后将每一类酒样品的评分按照升序排列,从而得到每一类酒样品等级的升序排列。最后结果为:第一等级为红葡萄酒(26,27,10,25,13,12,18,7,11)第二等级为红葡萄酒(6,15,5,17,4,24,22,16,20)

23、第三等级为红葡萄酒(2,23,9) 第四等级为红葡萄酒(14,21,3,8,19,1,2,23,9)(等级越高说明酒的评分越高,即品质越高)对白酿酒葡萄的分级同红酿酒葡萄的原理相同,我们对白酿酒葡萄的一级指标筛选出来用SPSS进行主成份分析,得到表5,表6,图3:解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %15.83019.43519.4355.83019.43519.43524.92916.43035.8644.92916.43035.86433.62812.09347.9573.62812.09347.95742.0806.93454.8912.08

24、06.93454.89151.8896.29861.1891.8896.29861.18961.6545.51466.7031.6545.51466.70371.5255.08471.7871.5255.08471.78781.2784.26176.0481.2784.26176.04891.2384.12680.1741.2384.12680.174101.0003.33283.50611.9673.22386.72912.8622.87389.60213.6402.13391.73614.6012.00393.73915.3981.32695.06516.3451.15296.21617.

25、3031.01097.22618.280.93298.15819.175.58598.74220.117.39199.13321.096.32199.45422.064.21499.66823.051.17199.83924.023.07699.91625.014.04799.96326.008.02699.98927.003.011100.000287.685E-162.562E-15100.00029-2.457E-16-8.189E-16100.00030-3.612E-16-1.204E-15100.000提取方法:主成份分析。成份矩阵a成份123456789干物质含量.835-.17

26、4.106.155-.064-.092.114.222-.137可溶性固体.802-.298-.027-.042-.273.297.067-.034.162总糖.756-.187-.097.017-.346.037.082-.035.170还原糖.722-.072.005.163-.276-.200.275.243-.027b.646.152-.613.006.275-.085.045-.188-.079氨基酸总量.591.112.182.533.061.127-.059-.158.069出汁率-.578.204-.232.218.212-.055.173-.297-.012果穗质量-.577.478.277.226-.014-.166-.047-.138

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1