1、数学建模A题目关于葡萄酒质量的评价2012高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形
2、式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 数模组 日期: 2012 年 09 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号)
3、:全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要本文对葡萄酒的评价结果、葡萄的分级、葡萄和葡萄酒的理化指标之间的关系等,进行定量分析并确定合理的评价指标体系。 针对问题一,利用SPSS13.0对两组评酒员的评价结果进行配对比较分析,结果说明有显著性差异,再根据变异系数,得出第二组的结果更可信。针对问题二, 采用第二组评酒员对葡萄酒的评价结果作为根据,以组距(组距=(最大值-最小值)组数)为标准对葡萄酒划分为3或4个等级,然后以葡萄的理化指标为辅,综合两者的结果来对酿酒葡萄进行分级。通过主成分分析和聚类分析将酿酒葡萄的理化指标进行分类,根据各主成份在葡萄样品中的理化指标的标准化值与
4、贡献率的乘积之和:来确定各酿酒葡萄品质的高低,最后将红葡萄分为3级,白葡萄分为4级。针对问题三,先根据酿酒葡萄和葡萄酒所共有的理化指标之间的关系强度大小进行相关性分析,进而得到各个理化指标之间的相关关系及关系的强弱程度,再采用线性回归分析法求出共有的理化指标的回归方程,从而进一步阐述了这些理化指标之间的关系,最后较全面地分析出了葡萄和葡萄酒的理化指标之间的联系。针对问题四,先通过主成分分析和聚类分析将酿酒葡萄的理化指标进行简化,求出各主成分中的各个理化指标的贡献率,再以这些贡献率作为自变量,以第二组品酒员的品酒得分作为因变量,进行非线性曲线拟和的相关性分析,最后得出相关系数R1。随后,对酿酒葡
5、萄的芳香物质采用同样的分析方法,将酿酒葡萄的芳香物质与理化指标的贡献率综合成一组新的贡献率,并以此新贡献率为自变量,以第二组品酒员的品酒得分为因变量,再次进行同样的相关性分析,得出新的相关系数R2,最后把R1和R2进行对比,依此类推,用相同的方法求出葡萄酒的两个相关系数,进行对比,发现无论是酿酒葡萄还是葡萄酒,综合芳香物质后的相关系数都比单独用理化指标的相关系数大,因此,最终得出结论:不能单独用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,必须综合芳香物质才能较准确、合理地评价葡萄酒的质量。最后,对全文做出总结,并对模型进行了评价和推广。关键词:配对比较 相关性分析 主成分分析 聚类分析 线性
6、回归分析问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。本文将研究以下问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?问题分析葡萄酒中
7、含有丰富的营养物质,至今多达600种以上的物质被测定出来。葡萄具有的营养和医疗作用很早就被认识,如本草纲目中有“葡萄酒益气调中,耐饥强志”和葡萄酒驻颜、耐寒的记载1。之所以葡萄酒有如此的保健和营养价值,不仅由于葡萄赋予葡萄酒以丰富的糖分和较丰富的矿质元素, 尤其是大量元素钾,锌、硒等微量元素对调节人体生理平衡,增强免疫系统都有很好的作用。葡萄酒中维生素、氨基酸、丰富的有机酸与多酚类物质、单宁等物质使得葡萄酒具有其它类酒中没有的保健作用。葡萄酒因其特殊的营养价值和较好的保健效果,越来越受到广大消费者的欢迎。在此形势下,葡萄酒认证和质量评价得到关注。葡萄酒的质量,即葡萄酒优秀的程度, 它是产品的一
8、种特性,且决定购买者的可接受性。因此, 葡萄酒能够满足人类需求的各种特性的总和即构成了它的质量。葡萄酒认证保证了市场中酒的质量,同时保护了消费者的利益。葡萄酒的认证包括理化性质分析、感官评价、物理化学指标、卫生指标等手段。质量评价是认证中的重要阶段,它有益于提高葡萄酒的酿造工艺,同时为市场定位提供决策信息2。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系。葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒的质量。葡萄酒的每一项理化指标是其质量的单一体现, 而感官指标则是葡萄酒质量的综合概括, 换句话说, 一个理化指标、卫生指标都合格的葡萄酒未必是高质量的葡萄酒。在今后的一个时期,我们需要做的
9、是从葡萄酒的特点出发,围绕葡萄和葡萄酒理化指标、感官指标等众多因素对葡萄酒质量的联系进行研究,尽可能确定较为合理的葡萄酒质量评价标准,从而实现既保证市场中酒的质量,保护消费者利益,又能为市场定位提供决策信息,达到经济效益的目的,实现双赢。模型假设1假设红葡萄与白葡萄样品酒的生产工艺都相同。2假设评酒员的评酒水平基本是稳定的。符号说明评酒员的评分结果的标准差评酒员的评价结果的均值评酒员的评价结果的变异系数 第主成份的各个指标的标准化测量值之和第主成分的贡献率红葡萄样品的理化指标得分红葡萄样品的第主成分的各个指标的标准化测量值之和红葡萄酒对应的理化指标红葡萄对应的理化指标模型的建立和求解问题一1.
10、问题分析针对问题1,我们把第一组的红葡萄酒的品尝得分的平均值归为一个样本组,把第二组对应编号的红葡萄酒的品尝得分的平均值归为一个样本组,再把第一组的白葡萄酒的品尝得分的平均值归为一个样本组,把第二组对应编号的白葡萄酒的品尝得分的平均值归为一个样本组,并采用SPSS13.0进行两次配对比较分析。2.模型一的建立与求解接着通过运用SPSS13.0软件运算可得,检验值P=0.020,由于Pa,(a=0.05),所以可以认为两组评酒员的评价结果有显著性差异。如图1Paired Samples Test Paired DifferencestdfSig. (2-tailed) MeanStd. Devi
11、ationStd. Error Mean95% Confidence Interval of the Difference LowerUpper Pair 1Ft - Sd2.562965.374241.03427.436994.688942.47826.020Pair 2f2 - s2-2.521435.359341.01282-4.59956-.44329-2.49027.019图1 两组评酒员的品尝评分的检验结果因为两组的评价结果有显著性差异,所以利用变异系数来确定哪一组的评价结果更可信。同样利用SPSS13.0软件运算可得,第一组评价结果的标准差=7.36093,第二组评价结果的标准差
12、=3.97799。第一组评价结果的均值=73.0778,第二组评价结果的均值=70.5148。变异系数,第一组评价结果的变异系数=1.41661,第二组评价结果的变异系数为=0.76556,由于,,所以可以认为第二组的结果更可信,如图2。 Paired Samples Statistics MeanNStd. DeviationStd. Error MeanPair 1First73.0778277.360931.41661Second70.5148273.97799.76556Pair 2f274.0107284.80404.90788s276.5321283.17094.59925图2 两
13、组评酒员的品尝评分的变异系数分析问题二1.数据分析主成分分析法首先对红葡萄的理化指标数据进行分析,考虑到理化指标较多,因此,采用主成份分析法对指标进行重新筛选和组合。按照主成份分析的理论,若前R个主成份的累计贡献率达到了85%原则,则这R个主成份能反映足够的信息3。利用SPSS13.0对红葡萄的28个理化指标进行主成份分析得出前9个主成份的累计贡献率已达到86.278%,故选取前9个特征值作为相互独立的新的综合性指标。如表1表1评价因子的特征根和累计贡献率Tabal1 The latent root and variance contribution rate of evaluation fa
14、ctor 主成分特征根初始特征值贡献率(%)累计方差贡献率(%)Principal Componentlatent rootContribution rateCunulative contribution rate16.96323.21123.21124.98416.61239.82433.69212.30552.12942.8429.47261.60151.9946.64768.24861.7385.79574.04271.4284.76178.80381.2744.24583.04890.9693.23086.278可以分析出以下结果,第1主成分与蛋白质、单宁、DPPH自由基、葡萄总黄铜、
15、花色苷、总酚有较大正相关;第2主成分与总糖、干物质含量、还原糖、可溶性固形物有较大正相关;第3主成分与白藜芦醇、果皮颜色A、果皮颜色B有较大正相关,但与可滴定酸、果皮质量有较大负相关;第4主成分与PH值有较大正相关,但与苹果酸、褐变度、多酚氧化酶有较大负相关;第5主成分与果穗质量、固酸比有较大正相关,但与VC含量有较大负相关;第6主成分与黄铜醇有较大负相关;第7主成分与黄铜醇、果皮质量有较大正相关;第8主成分与柠檬酸、酒石酸有较大负相关;第9主成分与有VC含量有较大正相关。如表2表2红葡萄主成分矩阵Table2 Principal component matrix变量因子Factor Vari
16、able123456789氨基酸0.3820.5320.0210.463-0.256-0.280.1720.0010.092蛋白质0.608-0.5020.1980.2540.207-0.1340.112-0.160.024VC含量-0.147-0.3980.107-0.022-0.5320.151-0.0150.1410.626花色苷0.845-0.115-0.107-0.2990.0990.187-0.1110.0760.012酒石酸0.3780.1020.3640.3830.304-0.140.225-0.50.053苹果酸0.3920.3240.146-0.6540.0890.353-
17、0.1520.151-0.026柠檬酸0.2970.2980.317-0.3740.351-0.0450.333-0.4270.221多酚氧化酶0.3180.093-0.221-0.5980.243-0.3590.0190.106-0.013褐变度0.595-0.0880.042-0.707-0.02-0.066-0.090.1080.101DPPH自由基0.751-0.4730.0060.205-0.0120.1150.2060.123-0.21总酚0.862-0.191-0.1630.228-0.0190.184-0.030.109-0.236单宁0.757-0.161-0.272-0.0
18、7-0.1540.260.249-0.0520.092葡萄总黄酮0.717-0.302-0.180.2830.040.2980.110.078-0.276白藜芦醇0.06-0.050.8280.048-0.1910.1660.290.2890.043黄酮醇0.5570.0140.026-0.065-0.193-0.490.4660.2450.077总糖0.2680.776-0.1480.2710.101-0.05-0.0770.2740.069还原糖0.0850.759-0.1280.1550.086-0.111-0.0860.1190.063可溶性固形物0.2580.75-0.3190.16
19、20.114-0.056-0.0340.2550.011PH值0.264-0.2930.2020.6920.126-0.123-0.2910.2180.205可滴定酸-0.2910.454-0.5980.01-0.330.2450.296-0.115-0.026固酸比0.391-0.0510.43-0.0080.534-0.138-0.3280.2040.095干物质含量0.3860.849-0.1970.1110.085-0.0250.0470.0410.103果穗质量-0.347-0.453-0.2230.0650.6020.0290.2250.0970.229百粒质量-0.536-0.3
20、57-0.4740.090.2620.1460.1930.234-0.044果梗比0.578-0.2190.174-0.217-0.426-0.3920.0850.055-0.067出汁率0.547-0.192-0.2550.1620.0360.397-0.133-0.0140.384果皮质量-0.257-0.248-0.621-0.0990.314-0.080.4590.2540.126果皮颜色L-0.571-0.3210.302-0.0460.045-0.3140.070.336-0.12果皮颜色A-0.3320.2920.7370.0340.0020.2890.2450.221-0.07
21、1果皮颜色B-0.1360.5020.594-0.0340.2130.4460.2770.115-0.0242.数据验证聚类分析法下面的工作我们进一步采用聚类分析法对结果进行验证。聚类分析是研究分类问题的多元统计方法之一,就是根据研究对象的特征把性质相近的个体归为一类,使得同一类中的个体具有高度的同质性,不同类之间的个体具有高度的异质性的多元分析技术的总称4。对红葡萄的理化指标进行R型因子聚类分析,得到理化指标的聚类谱系图,同时依据主成分分析的结果将28项指标聚成9类,从聚类图谱的聚类距离和聚类的先后步骤可以看出,果穗质量、百粒质量、果皮质量聚成一类,说明这3个指标间的相关性很高,也就是说这3
22、个性状为相似水平类;依次类推,PH值与固酸比聚成一类,即这2个性状为相似水平类;花色苷、苹果酸、多酚氧化酶活力、黄酮醇、褐变度、果梗比聚为一类,即这6个性状为相似水平类;蛋白质、DPPH自由基、总酚、单宁、葡萄总黄酮、出汁率聚为一类,即这6个性状为相似水平类;白藜芦醇、果皮颜色A、果皮颜色B聚为一类,即这3个性状为相似水平类;酒石酸与柠檬酸聚为一类,即这2个性状为相似水平类;氨基酸总量、还原糖、可溶性固形物、干物质含量、可滴定酸、总糖聚成一类,即这6个性状为相似水平类;果皮颜色L、VC含量无相似项单独为一类。这表明,同为一相似类别的果实品质理化指标之间具有较高的相关性,可选用一个理化指标代表同
23、一水平类其它理化指标,将28个酿酒红葡萄理化指标予以简化,其中无相似项的果实理化指标具有相对独立性,结果表明,聚类分析验证了主成分分析结果的正确性。如图3图3 红葡萄不同理化指标聚类分析结果(n=30)3.模型二的建立和求解然后,通过上述的主成分分析和聚类分析,我们得到了红葡萄理化指标中具有代表性的9个主成分以及每个主成分所包含的指标,如表3。表3 红葡萄理化指标的主成分分析结果(n=30)主成分包含成分名称贡献率(%)第一主成分果皮颜色L23.211第二主成分果穗质量,百粒质量,果皮质量16.612第三主成分VC含量12.305第四主成分PH值,固酸比 9.472第五主成分花色苷,苹果酸,多
24、酚氧化酶活力,黄酮醇,褐变度,果梗比 6.647第六主成分蛋白质,DPPH自由基,总酚,单宁,葡萄总黄酮,出汁率5.795第七主成分白藜芦醇,果皮颜色A,果皮颜色B4.761第八主成分酒石酸,柠檬酸4.245第九主成分氨基酸总量,还原糖,可溶性固形物,干物质含量,可滴定酸,总糖3.230在主成份分析法理论中,贡献率达到85%以上便具有统计学上的意义,因此,基于这一理论,我们不妨用各个指标的测量值与各自对应的贡献率的乘积的和来作为葡萄的理化指标得分,而为了使指标的测量值具有计算意义,我们把各个指标的测量值进行量纲统一,即把各个指标的测量值的均值标准化,以此新数据作为葡萄的各个指标的新的测量值,再
25、以主成份为顺序进行排序。(详见附录。)设第主成份的各个指标的标准化测量值之和为,第主成分的贡献率为,红葡萄样品的理化指标得分为,红葡萄样品的第主成分的各个指标的标准化测量值之和为,则可建立如下模型:表4红葡萄的理化指标得分和评酒师对红葡萄的评分红葡萄样品理化指标得分评酒师得分葡萄样品0118.99734681葡萄样品0246.41101740葡萄样品0351.67698746葡萄样品04-99.604712葡萄样品0572.28346721葡萄样品06-60.9712663葡萄样品07-93.878653葡萄样品08109.0392660葡萄样品0925.43808782葡萄样品1035.64
26、95688葡萄样品1111.19592616葡萄样品12-22.6788683葡萄样品13-21.1032688葡萄样品1428.3185726葡萄样品15-65.9898657葡萄样品16-63.2904699葡萄样品1752.23925745葡萄样品18-79.9643654葡萄样品191.075881726葡萄样品2030.78321758葡萄样品21-46.9646722葡萄样品22-56.9601716葡萄样品2380.72203771葡萄样品2432.27933715葡萄样品25-48.8541682葡萄样品2678.52161720葡萄样品27-14.37287154.模型二的检
27、验与分析通过以上的计算,我们得到了红葡萄的理化指标得分,又因为酿酒葡萄的质量与所酿葡萄酒的质量有直接的关系,即葡萄酒的质量的高低应与酿酒葡萄的理化指标得分的高低相一致,因此,可以利用评酒师对葡萄酒的感官得分来验证以上理化指标计算的合理性和正确性,如图4。图4红葡萄的理化指标得分和评酒师对红葡萄的评分比较 显然可见,所计算出的红葡萄的理化指标得分与评酒师的感官得分在图表上具有高度的一致性,说明了指标模型的正确性和可行性。所以,一般而言,葡萄酒的质量越高,可以推断酿酒葡萄的质量也越高,这是因为虽然能有许多工艺措施对葡萄的缺点进行补救,但想用先天不足的葡萄酿出香气馥郁、结构丰满协调、典型性独特的葡萄
28、酒几乎是不可能的,所以葡萄酒的质量高,酿酒葡萄的质量也会高;反过来,虽然酿酒葡萄的质量是决定葡萄酒的关键因素,但却不一定能推断出葡萄酒的质量也越高。这是因为酿酒工艺及关键步骤对葡萄酒的风格和质量都有重要影响,所以葡萄的理化指标只能在一定程度上反映葡萄酒的质量5。因此,我们要以葡萄酒的质量得分为主,葡萄的理化指标为辅对红葡萄进行分级,根据这个思路,我们以将酿酒红葡萄按评酒员的评分高低划分为3个等级,以组距为划分标准,组距=(最大值-最小值)组数=(782-616)3=56,以56组距划分,可得到第一组得分是782740,第二组得分是726681,第三组得分是663616,即对应为一级,二级,三级,如表5。表5红葡萄的分级级
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1