葡萄酒评价数学模型研究数学建模A题Word文档下载推荐.docx

上传人:b****6 文档编号:20643535 上传时间:2023-01-24 格式:DOCX 页数:43 大小:54.25KB
下载 相关 举报
葡萄酒评价数学模型研究数学建模A题Word文档下载推荐.docx_第1页
第1页 / 共43页
葡萄酒评价数学模型研究数学建模A题Word文档下载推荐.docx_第2页
第2页 / 共43页
葡萄酒评价数学模型研究数学建模A题Word文档下载推荐.docx_第3页
第3页 / 共43页
葡萄酒评价数学模型研究数学建模A题Word文档下载推荐.docx_第4页
第4页 / 共43页
葡萄酒评价数学模型研究数学建模A题Word文档下载推荐.docx_第5页
第5页 / 共43页
点击查看更多>>
下载资源
资源描述

葡萄酒评价数学模型研究数学建模A题Word文档下载推荐.docx

《葡萄酒评价数学模型研究数学建模A题Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《葡萄酒评价数学模型研究数学建模A题Word文档下载推荐.docx(43页珍藏版)》请在冰豆网上搜索。

葡萄酒评价数学模型研究数学建模A题Word文档下载推荐.docx

判断因变量与自变量的显著相关性,来判别哪几个自变量对因变量有影响,即判断葡萄酒质量受哪些因素影响。

其中红葡萄酒:

回归平方和=残差平方和=总计平方和=F值为sig值小于,所以线性回归方程Z=+++有效。

白葡萄酒:

回归平方和=残差平方和=总计平方和=F值=sig值小于0、05,所以线性回归方程Z=有效。

红酿酒葡萄和白酿酒葡萄的显著性相关的解释率分别为%和%。

结论:

分析出无论是白葡萄酒还是红葡萄酒,葡萄酒的质量都与酿酒葡萄的指标等级有显著性相关,并且红葡萄酒除了用红酿酒葡萄指标等级来评价,其次也可以用红葡萄酒的理化指标来评价红葡萄酒的质量。

关键词

主成分分析聚类分析多元线性回归质量评价理化指标显著性相关

一,问题的提出

葡萄酒作为体现时尚品味的元素,同雪茄,咖啡,名茶一样备受追捧.确定葡萄酒质量是由一批有资质的评酒师进行品评,每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到总分,从而确定葡萄酒的质量.酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量.附件一中给出了某一年份一些葡萄酒样本的评价结果,附件二和三分别给出了该年份这些葡萄酒和酿酒葡萄的理化指标与成分数据.尝试建立数学模型讨论如下问题:

1分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级.

3分析酿酒葡萄和葡萄酒理化指标之间的联系

4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

二,问题的分析

2—1第一个问题属于显著性差异分析的数学问题,要解决这个问题,我么用配对样品T检验分析,因为t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。

通过计算出变异性系数(cv)判断这两组那组更合理。

附件1分别给出了两组的10位品酒员对27个酒样的各项进行打分,我们先每个品酒员对每个指标打分求和再求每组是个品酒员打分求平均值。

为了检测两组是否有显著性差异我们建立了配对样品T检验的数学模型

2-2.第二个题目中通过对酿酒葡萄的分级我们能选择不同等级的葡萄去酿葡萄酒,这样保证我们酿出的酒的品质大致相同。

这属于数据分类方面的数学问题,我们采用主成分分析法和聚类分析法解决这个问题。

2-3我们认为基于实际作用,问题三应该是酿酒葡萄的等级与葡萄酒理化指标的关系。

所以我们认为这是一个双变量相关性问题。

一个变量为第二题的数据结果分析出来的等级,另一个变量为葡萄酒的一级指标。

2-4我们将第四个问题理解为:

酿酒葡萄等级和葡萄酒的理化指标对葡萄酒质量的影响。

我们利用线性回归处理该问题。

三,模型的假设

1假设所有样本发酵条件相同

2假设所有品酒师的味觉分析能力正常

四,模型的建立与求解

4-1问题一属于显著性差异分析的数学问题,要解决这个问题,我们用配对样品T检验分析。

因为t检验是用t分布理论来推论差异发生的概率,从而利用配对T检验比较两个平均数的差异是否显著。

通过计算出每组评分的变异性系数(cv)判断这两组中哪组更合理。

显著性差异是一种有量度的或然性评价,比如我们说A、B两数据在水平上具备显著性差异,这是说两组数据具备显著性差异的可能性为95%。

两个数据所代表的样本还有5%的可能性是没有差异的。

这5%的差异是由于随机误差造成的。

  通常情况下,实验结果达到水平或水平,才可以说数据之间具备了差异显著或是极显著。

在作结论时,应确实描述方向性(例如显著大于或显著小于)。

sig值通常用P>

表示差异性不显著;

<

P<

表示差异性显著;

表示差异性极显著。

建立模型:

附件1分别给出了两组的10位品酒员对27个红酒样的各项的评分,这里规定附件1中第M位品酒员对第N个酒品中的第K个指标分数为X(MNK),以此,先将每个品酒员对酒样品的各个指标打分求和,比如第一位品酒员对酒样品2的每个指标求和的计算公式为Y(12)=X(121)+X(122)+………+X(1210),其中Y(12)表示第一位品酒员对酒样品2的总评分,再求每组中每一个酒品关于该组所有品酒员评分的平均值,所得结果即为该组品酒员对某一样品的综合评分,如某组对酒样品2的综合评分即为Z

(2)=(Y(12)+Y(22)+Y(32)+…….Y(102))/10。

利用用EXCEL将数据整理好(详图见目录),然后用spss软件分别将两组对红葡萄酒样品和白葡萄酒样品的综合评分进行处理,具体步骤为:

分析——比较均值——配对样本T检验。

T检验的数学公式如下:

其中

注:

式中:

Sd为d的标准差;

n为配对的对子数,即试验的重复数,

d为两样本各对数据之差,

为差异标准误。

我们先来对红葡萄酒的显著性进行分析

表1-1是第一组品酒师和第二组品酒师对红葡萄酒的打分数据.

表1-1第一组和第二组品酒师对红葡萄酒的打分

第一组

第二组

74

66

73

78

72

接着将这些打分数据输入到SPSS软件中进行配对样本T检验,得到表1-2-1、表1-2-2、表1-2-3:

表1-2-1成对样本统计量

均值

N

标准差

均值的标准误

对1

VAR00006

27

VAR00007

.76556

(1hong)=

(2hong)=

表1-2-2成对样本相关系数

相关系数

Sig.

VAR00006&

VAR00007

.702

.000

表1-2-3成对样本检验

成对差分

t

df

Sig.(双侧)

差分的95%置信区间

下限

上限

VAR00006-VAR00007

.44902

26

.019

结果分析:

N=27,t=,P=小于显著性水平,即俩组对红葡萄酒的评价存在显著性差异。

因为第二组品酒师对红葡萄酒评分的变异性系数(2hong)=小于第一组品酒师对红葡萄酒评分的变异性系数(1hong)=,所以我们认为第二组的评分更加稳定,也就是说第二组的评分更可靠。

(为我们自行计算数值,非SPSS数据结果)

用同样方法对第一组和第二组对白葡萄酒的评分进行分析时,我们发现了一个问题,在附件一中,第一组白葡萄酒品尝评分表格中,J233数据为77,明显异常,我们按照该异常数据

对未修正的白葡萄酒进行配对样品T检验得到表1-3-1、1-3-2:

表1-3-1成对样本相关系数

VAR00003&

VAR00004

28

.207

.291

表1-3-2成对样本检验

VAR00003-VAR00004

.038

P=小于显著性水平,存在显著性差异。

(我们将该异常数据取同一指标下,其他品酒员评分的平均值。

对修正后的白葡萄酒进行配对样品T检验得到表1-4-1、1-4-2、1-4-3:

表1-4-1

VAR00004

.90726

VAR00005

.59925

第一组品酒师对白葡萄酒评分的变异系数(1bai)=

第二组品酒师对白葡萄酒评分的变异系数(2bai)=

表1-4-2

成对样本相关系数

VAR00004&

VAR00005

.240

.219

表1-4-3成对样本检验

VAR00004-VAR00005

.95985

.014

P=小于显著性水平,两组对白葡萄酒评分存在显著性差异。

因为第二组的(2bai)=小于第一组的(1bai)=,所以我们认为第二组对白葡萄酒的评分更加稳定,也就是说结果更加可靠。

4-2

该问题属于聚类分析对变量分级,首先,我们认为葡萄酒质量可以根据第一题分析结果,采取第二组对葡萄酒的评分为葡萄酒质量的分级标准。

附录2中所给酿酒葡萄的指标数据分为一级指标和二级指标,对于多次测量的指标我们选择其多次测量的平均值,针对不同等级的指标,我们选择运用主成分分析法,对酿酒葡萄的理化指标进行分析,然后对主成份分析结果与标准化后的第二组对葡萄酒评分数据进行聚类分析。

最后将酿酒葡萄的理化指标分类,把每一类酿酒葡萄的对应与第二组评分的平均值进行比较,完成对酿酒葡萄的分级。

主成分分析:

是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。

主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。

最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。

因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。

如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。

主成份分析数学模型:

Fp=a1iZX1+a2iZX2+……+apiZXp

  其中a1i,a2i,……,api(i=1,……,m)为X的协方差阵Σ的特征值所对应的特征向量,ZX1,ZX2,……,ZXp是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响[注:

本文指的数据标准化是指Z标准化]。

  A=(aij)p×

m=(a1,a2,…am,),Rai=λiai,R为相关系数矩阵,λi、ai是相应的特征值和单位特征向量,λ1≥λ2≥…≥λp≥0。

  进行主成分分析主要步骤如下:

  1.指标数据标准化(SPSS软件自动执行);

  2.指标之间的相关性判定;

  3.确定主成分个数m;

  4.主成分Fi表达式;

  5.主成分Fi命名;

聚类分析:

我们所研究的样品(网点)或指标(变量)之间存在程度不同的相似性(亲疏关系——以样品间距离衡量)。

于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据。

把一些相似程度较大的样品(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样品(或指标)又聚合为另一类,直到把所有的样品(或指标)聚合完毕,这就是分类的基本思想。

常见聚类分析有:

Euclideandistance平方欧式距离:

2.Euclideandistance欧式距离:

3.Cosine夹角余弦(R型)

4.Pearsoncorrelation皮尔逊相关系数(R型)

5.Chebychev切比雪夫距离:

首先将所给红酿酒葡萄的一级指标筛选出来并整理,然后将数据直接导入SPSS软件中进行因子分析,方法采用主成份分析法,得到数据,表2-1、表2-2为所得数据的主要部分。

表2-1

解释的总方差

成份

初始特征值

提取平方和载入

合计

方差的%

累积%

1

2

3

4

5

6

7

8

9

.913

10

.657

11

.553

12

.438

13

.338

14

.279

15

.260

.962

16

.169

.624

17

.144

.534

18

.101

.373

19

.074

.275

20

.054

.201

21

.033

.123

22

.020

23

.009

24

.002

.007

25

.001

.006

提取方法:

主成份分析。

表2-2

成份矩阵a

总酚(mmol/kg)

.789

.361

.004

.224

.048

花色苷mg/100g鲜重

.787

.358

.340

.022

.165

.146

葡萄总黄酮(mmol/kg)

.743

.204

.191

单宁(mmol/kg)

.698

.363

.044

.303

.243

.695

.161

.202

DPPH自由基1/IC50(g/L)

.667

.452

.274

.206

.208

百粒质量/g

.455

.205

.183

.271

果梗比(%)

.600

.120

.143

.069

.273

果皮颜色

.456

.182

蛋白质mg/100g

.557

.375

.474

.066

氨基酸总量

.528

.010

.141

.193

出汁率(%)

.468

.426

.461

b*(+黄;

-蓝)1

.238

.252

.215

.485

.116

.130

a*(+红;

-绿)1

.450

.118

.325

.156

.089

果皮质量(g)

.539

.305

.049

.469

.176

可滴定酸(g/l)

.276

.179

白藜芦醇(mg/kg)

.672

.021

.227

.316

.071

干物质含量g/100g

.447

.041

.077

.139

固酸比

.398

.517

.134

.383

.384

苹果酸(g/L)

.385

.786

.220

褐变度

.544

.245

.059

.678

.063

.081

PH值

.281

.138

.440

.085

.018

.266

多酚氧化酶活力

.264

.547

.131

.133

柠檬酸(g/L)

.354

.414

VC含量(mg/L)

.167

.198

.168

果穗质量/g

.184

.495

.108

.277

.196

酒石酸(g/L)

.449

.256

.488

.135

提取方法:

主成份。

a.已提取了8个成份。

对所得结果进行分析:

分析结果一共有8个主成份,但根据上表中的成分矩阵将每一列各指标的R值取大概在以上,所以选择累积贡献率达到77%的前6个主成份。

然后每个主成份所对应的指标名称列表为表2-3:

表2-3

主成份一

主成份二

主成份三

主成份四

主成份五

主成份六

以下是对红酿酒葡萄主成份分类的名词解释

第一主成分主要是酚类物质

第二主成份主要是色素

第三主成分主要是酸

第四主成分主要是酸

第五主成份主要是矿物质

第六主成分主要是酸

对一级指标主成份分析后所得变量和第二组评分标准化后的变量采用SPSS聚类分析的系统聚类,聚类方法为WORD法,主要数据结果如下:

图2-4(红酿酒葡萄与红葡萄酒质量聚类)

我们组根据该数据结果将红葡萄酒分为4类,

根据第一题算得第二组在白葡萄酒和红葡萄酒的变异性系数较第一组小,可靠性更高,所以我们认为应该将第二组对每个酒样品的评分作为葡萄酒质量的评判标准。

于是我们将红葡萄酒的4类酒样品中的每个酒样品一一对应第二组对红葡萄酒的评分,然后将每一类酒样品的平均评分求出,然后将每一类酒样品的评分按照升序排列,从而得到每一类酒样品等级的升序排列。

最后结果为:

第一等级为红葡萄酒(20、26、17、24、5、23、2、9、1)

第二等级为红葡萄酒(3、21)

第三等级为红葡萄酒(12、18、6、7、15、14、27、13、19、25、4、22、16、10、8)

第四等级为红葡萄酒(11)

(等级越高说明酒的评分越高,即品质越高)

下面对白酿酒葡萄的分级同红酿酒葡萄的原理相同,我们对白酿酒葡萄的一级指标筛选出来用SPSS进行主成份分析,得到表2-5:

表2-5成份矩阵

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工作范文 > 行政公文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1