数学建模葡萄酒评价.docx

资源描述

数学建模葡萄酒评价.docx

《数学建模葡萄酒评价.docx》由会员分享，可在线阅读，更多相关《数学建模葡萄酒评价.docx（42页珍藏版）》请在冰豆网上搜索。

数学建模葡萄酒评价.docx

数学建模葡萄酒评价

2012高教社杯全国大学生数学建模竞赛

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。

我们知道，抄袭别人的成果是违反竞赛规则的，如果引用别人的成果或其他公开的资料（包括网上査到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺，严格遵守竞赛规则，以保证竞赛的公正、公平性。

如有违反竞赛规则的行为，我们将受到严肃处理。

我们参赛选择的题号是（从A/B/C/D中选择一项填写）：

我们的参赛报名号为（如果赛区设置报名号的话）：

所属学校（请填写完整的全名）：

参赛队员（打印并签名）：

指导教师或指导教师组负责人（打印并签名）：

日期：

年月

日

赛区评阅编号（由赛区组委会评阅前进行编号）：

2012高教社杯全国大学生数学建模竞赛

编号专用页

赛区评阅编号（由赛区组委会评阅前进行编号）：

赛区评阅记录（可供赛区评阅时便用）：

评阅人

评分

备注

全国统一编号（由赛区组委会送交全国前编号）：

全国评阅编号（由全国组委会评阅前进行编号）：

基于统计分析的葡萄酒评价

摘要

本文旨在对评酒员葡萄酒品尝评分的基础上，通过对酿酒葡萄以与葡萄酒一些指标间的关系，做出对葡萄酒合理评价。

主要进行了4个方面的研究：

问题一，在确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评，但是评酒员之间存在评价尺度、标准的差异，导致对酒质量评分存在差异。

运用非参数检验模型，对两组评酒员的评价结果做Wilcoxon符号平均秩检验。

求得P=.0011<0.05,两组评酒员的评价结果存在显著差异。

通过构造标准参考

数据组，做出标准差，通过判断两组评分偏离参考标准数据值的程度，以与利用SPSS软件进行可靠性分析，得出信度a.=0.894

说明第二组评酒员对葡萄酒的评价更具有可信度。

问题二，为了对酿酒葡萄进行分级，本文建立考虑权重的聚类分析，对传统聚类分析进行改进。

基于指标过多，建立单因子方差分析模型，筛选出在聚类分析中发挥显著作用的m个指标，通过聚类模型得到对酿酒葡萄的五级划分。

问题三，酿酒葡萄与葡萄酒的理化指标关系，是研究两组变量之间的相关性。

通过建立典型相关分析模型，将两组变量分别作为一个整体进行分析。

通过数据分析，得出相关表达式，得到酿酒葡萄与葡萄酒的理化指标之间存在重要的相关关系。

问题四，为论证葡萄与葡萄酒的理化指标能否评价葡萄酒的质量，本文运用前14个指标建立综合评价模型，运用主成分分析法分3个成分，经过成分重要性计算和相关性确定正负值对标准化后的样本数据加权计算评价得分。

最后得出11号样品酒的质量最差，23号样品酒的质量最好，与评酒员的评分相近。

故认为葡萄与葡萄酒的理化指标能在一定程度上评价葡萄酒的质量，部分误差是因为芳香物质等感官指标的影响。

关键字：

综合评价模型信度分析聚类分析典型相关分析主成分分析

1间题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分，然后求和得到其总分，从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系，葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果，附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

请尝试建立数学模型讨论下列问题：

1）分析附件1中两组评酒员的评价结果有无显著性差异，哪一组结果更可信？

2）根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3）分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4）分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响，并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量？

2问题的分析

2.1问题一

由于两组评酒员品尝评分样本属于同一样本，在对同一研究对象进行不同评判标准时，视为对两配对样本的检验，且数据处理之前总体分布情况未知，可建立非参数检验模型进行显著性差异评价，本文采用Wilcoxon符号平均秩检验。

在可信度分析上，可通过建立标准参考数据组，两组评酒员评分分别与其进行标准差比较，判断离散程度。

或者采用SPSS对两组数据进行可靠性分析处理。

利用最终求得的信度系数评判两组评酒员评价结果的可靠性。

2.2问题二

将酿酒葡萄理化指标进行单因子方差分析，选取出在聚类分析中发挥明显作用的m个指标。

根据酿酒葡萄的好坏与所酿葡萄酒的质量关系有直接关系，把对葡萄酒质量的评分当做特殊的第m+1个指标。

由于各指标的对酿酒葡萄分级所发挥作用的效果不同，而传统聚类分析把各指标放在了等同的地位。

基于这点,本文提出了考虑权重的聚类分析方法。

通过网络査阅资料，对各指标在分级中所起的重要性进行评分。

最后对赋权的指标进行聚类分析，对所分类样品数据加权求平均分来分级。

2.3问题三

由于葡萄和葡萄酒理化指标之间联系为多对多联系，研究两组变量之间的相关关系，可以通过典型相关分析模型，得到典型相关系数。

对数据进行分析，判断两组变量之间关系。

2.4问题四

根据对酿酒葡萄与葡萄酒的理化指标大量数据的统计分析，本文选择了四个统计量来分析理化指标对葡萄酒质量的影响。

以相关性和P值来初步分析与葡萄酒的质量有显著相关的指标。

以通径分析解释指标变量与葡萄酒质量是否为直接作用。

以变异系数的大小反映该指标在总体理化指标中的稳定性，变异系数越小,越稳定，就越具有代表性。

在四个统计分析中，能总体把握酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。

3模型的假设和符号说明

3.1模型假设：

1）评酒师所评的分数具有客观可信度。

2）所有样品的酿酒工艺一致。

3.2符号说明：

%：

信度系数

J：

观测矩阵

忌：

复相关系数

X：

变异系数

X=（旺，尤2,…，耳）：

随机变量y=（$1*2,…，儿）：

随机变量x：

总体协方差阵

p：