国赛A题优秀论文Word文档下载推荐.docx

上传人:b****5 文档编号:20987728 上传时间:2023-01-26 格式:DOCX 页数:40 大小:106.35KB
下载 相关 举报
国赛A题优秀论文Word文档下载推荐.docx_第1页
第1页 / 共40页
国赛A题优秀论文Word文档下载推荐.docx_第2页
第2页 / 共40页
国赛A题优秀论文Word文档下载推荐.docx_第3页
第3页 / 共40页
国赛A题优秀论文Word文档下载推荐.docx_第4页
第4页 / 共40页
国赛A题优秀论文Word文档下载推荐.docx_第5页
第5页 / 共40页
点击查看更多>>
下载资源
资源描述

国赛A题优秀论文Word文档下载推荐.docx

《国赛A题优秀论文Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《国赛A题优秀论文Word文档下载推荐.docx(40页珍藏版)》请在冰豆网上搜索。

国赛A题优秀论文Word文档下载推荐.docx

酿酒葡萄的第j种理化指标与葡萄酒质量间的相关系数;

第i种与第j种酿酒葡萄的样本距离;

原指标的个数;

原指标的观测值(k=1,2,3…,m);

标准化后的数(k=1,2,3…,m);

的标准差(k=1,2,3…,m)。

模型建立及求解

4.1问题一

4.1.1问题分析

对于两组评价结果的显着性差异问题,因为每个评酒员对葡萄酒的质量的评价是由其对该葡萄酒各项指标所评总分决定的,为将问题简化,我们首先计算出各评酒员给出的每一个葡萄酒样品各项指标的总分并进行比较,并由此判定两组评价结果的差异性及可信程度。

易知两组评酒员对葡萄酒样品的评分都服从正态分布且是相互独立的,由于均是对相同的葡萄酒进行评价,我们认为两正态总体的方差相等,问题转化为对两个独立正态总体下样本均值的比较,本文采用t检验法检验具有相同方差的两正态分布均值差的假设。

要确定哪一组的评价结果更可信,我们将复杂问题简单化,考虑通过比较两组分数样本的方差,方差大小反应数据的集中程度,方差越小,样本数据分布越集中越稳定,各数据更接近均值,代表结果的可信度更高。

同时,可分别算出两组平均分的置信区间,比较各组落在区间内分数的个数,从而对分析结果进行检验。

4.1.2模型建立

(一)显着性差异分析[1]

为零假设,

为备择假设,显着性水平为

检验统计量为:

其中

(二)可信度比较

因为各组均有10为评酒员进行评分,故n=10。

定义变量R:

4.1.3模型求解

(一)t检验结果:

首先,根据所给数据算出每位评酒员对各红葡萄酒样品的总评分,见表4-1(详见附件1):

表4-1:

各红葡萄酒样品所得各项指标总分

1

2

3

4

5

6

7

8

9

10

平均值

第一组

51

66

49

54

77

61

72

74

62

62.7

第二组

68

71

80

52

53

76

73

70

67

68.1

81

86

91

83

79

85

80.3

75

89

69

84

80.4

82

78

63

74.6

64

65

58

68.6

60

71.2

73.3

57

59

63.2

...

26

73.8

27

71.5

由此得出两个正态总体的样本,比如,对红葡萄酒样品1,两组样本分别为:

第一组:

51664954776172617462

第二组:

68718052537671737067

下面用MATLAB的统计工具箱在

水平上进行两个样本的t检验(程序见附录一)。

的值反映结果的差异性,其中

表示不能拒绝零假设,即两组评价结果无显着差异;

,表示评价结果有显着差异。

所得结果见下表:

表4-2:

对红葡萄酒评价的显着性差异分析结果

酒样品

显着性水平

均值差的95%置信区间

0.2128

[-14.1832,3.3832]

\

0.0504

[-0.0121,11.6121]

0.5096

[-10.7187,5.5187]

0.0526

[-0.0740,11.8740]

0.1458

[-2.3673,14.7673]

0.0726

[-0.6401,13.2401]

0.1899

[-1.7892,8.3892]

0.948

[-14.2677,13.3949]

11

12

13

14

0.8712

[-4.7098,5.5098]

15

0.065

[-14.4844,0.4844]

16

17

0.141

[1.7493,11.3493]

18

0.0951

[-12.0594,1.0594]

19

20

0.287

[-2.5609,8.1609]

21

0.2243

[-3.2804,13.0804]

22

0.0556

[-0.1493,11.3493]

23

24

25

0.7648

[-5.9157,7.9157]

0.5133

[-3.8703,7.4703]

0.5785

[-4.0695,7.0695]

对于样品1,

,表示两组评价结果没有显着差异;

=0.2128,表示在100次试验中,约有21次t统计量大于或等于均值差;

均值差的95%置信区间为[-14.1832,3.3832]。

由表可知,对于编号2、5、11、12、13、16、19、23、24这9个红葡萄酒样品,

,也就是说,在27个红葡萄酒样品中,两组评酒员对其中9个样品的评价结果都有显着差异,所以对红葡萄酒两组评酒员的评价结果有显着性差异。

同理,对于白葡萄酒,首先根据所给数据算出个评酒员对每个葡萄酒样品的总评分,见表4-3(详见附件1):

表4-3:

各白葡萄酒样品所得各项指标总分

88

93

95

77.9

47

74.2

75.8

90

87

45

75.6

79.4

76.9

81.5

40

55

64.8

28

81.3

79.6

用MATLAB的统计工具箱在

水平上进行两个样本的t检验,结果见下表:

表4-4:

对白葡萄酒评价的显着性差异分析结果

0.2483

[-3.1200,11.3200]

0.7527

[-12.1074,8.9074]

0.3004

[-4.5602,13.9602]

0.4073

[-3.6901,8.6901]

0.0151

[-18.7103,-2.2897]

0.0714

[-17.6122,0.8122]

0.2624

[-2.6920,9.2920]

0.8482

[-10.6353,8.8353]

0.11

[-16.8729,1.8729]

0.3149

[-16.6780,5.6780]

0.8631

[-9.9140,11.7140]

0.0888

[-19.7265,1.5265]

0.1744

[-12.6779,2.4779]

0.1807

[-15.0521,3.0521]

0.4158

[-12.6797,5.4797]

0.1361

[-9.8547,1.4547]

0.7269

[-5.9073,8.3073]

0.5724

[-13.0302,7.4302]

0.5314

[-6.4385,3.4385]

0.4785

[-10.9278,5.3278]

0.5299

[-10.2715,5.4715]

0.1123

[-15.8089,1.8089]

0.1076

[-1.4675,13.6675]

由表可知,对于编号13、17、27这3个红葡萄酒样品,

,也就是说,在28个白葡萄酒样品中,其中有3个样品的评价结果存在显着差异,所以对白葡萄酒两组评酒员的评价结果有显着性差异。

综合红葡萄酒与白葡萄酒的检验结果可知,两组评酒员对葡萄酒质量的评价结果存在显着性差异,其中对红葡萄酒的评价结果差异更明显。

(二)可信度比较:

运用EXCEL对每一个葡萄酒样品的两组得分进行计算,求得其得分的样本方差与平均分置信区间(见附件1),作出两组数据方差对比图,如下:

(1)红葡萄酒:

图4-1:

红葡萄酒两组得分样本方差对比图

由上图可知,第一组评价结果的方差普遍较第二组大,比如对样品17,第一组分数的方差达到了88.01,说明各评酒员对17号酒样品的打分差异很大,分数较分散;

而第二组评分结果的方差仅为9.16,第二组评酒员对该样品的评价较为一致,所给分数分布更集中。

通过统计,对于红葡萄酒有

即对27个葡萄酒样品中有20个样品的得分方差第一组大于第二组,同时经比较,第二组评酒员所打分数落在平均分置信区间的个数更多,这表明对于红葡萄酒的评分第二组的结果更可信。

(2)白葡萄酒:

图4-2:

白葡萄酒两组得分样本方差对比图

由图可知,第一组评分的方差与第二组相比,仍明显偏大,统计得到,对白葡萄酒

即对28个白葡萄酒样品中有22个样品的得分方差第一组大于第二组。

同样,第二组评酒员所打分数落在平均分置信区间的个数更多,这表明对于白葡萄酒的评分第二组的结果仍比一组可信。

综上所述,两组评酒员对两种葡萄酒质量的评价结果都存在显着性差异,且对红葡萄酒的评价结果差异更明显。

其中第二组评酒员对两组葡萄酒的评分更集中更稳定,其评价结果较第一组也更可信。

4.2问题二

4.2.1问题分析

葡萄酒的质量与酿酒葡萄各理化指标存在着严格的依存关系,要对酿酒葡萄进行分级,首先就要确定两者间的关系,根据各理化指标对葡萄酒质量的影响以及不同酿酒葡萄成分的差异对葡萄划分等级。

根据第一问的结论,葡萄酒的质量由可信度更高的第二组评酒员所给的分数确定。

而理化指标与葡萄酒质量间是呈线性相关的,可以采用统计学中的相关性分析,将二者的关系通过它们之间的相关系数反映出来。

对酿酒葡萄进行分级的问题,也就是根据相似程度对样品进行分类,统计学中常采用的是聚类分析的方法,它将定性和定量的分析结合起来,通过选取元素的许多共同指标,然后分析元素的指标值来分辨元素间的差距,从而达到分类的目的。

对酿酒葡萄分类后,可以根据每一类葡萄所得质量分数的平均值对其进行等级的划分。

这里针对酿酒葡萄的理化指标,可以只选取与葡萄酒质量的相关系数较大的一部分,以简化模型。

聚类分析方法直观,结论简明,可以很好地解决酿酒葡萄分级的问题。

4.2.2模型建立

名词说明:

相关系数:

在直线相关条件下,说明两个变量之间相关程度以及相关方向的统计分析指标;

样品距离:

将每个样品看成是m个变量对应的m维空间中的一个点,然后在该空间中所定义的,距离越近,则亲密程度越高。

(一)相关性分析[2]:

采用相关性分析确定葡萄酒的质量与酿酒葡萄各理化指标的线性关系,本文最常用的Pearson相关系数,它适用于线性相关的情形,其计算公式为:

根据r所具有的符号来表示变量相关的方向,“+”号表示正相关,即0≤

≤1。

“﹣”表示负相关,即-1≤

≤0;

两个变量之间的相关程度用相关系数

的绝对值表示,其绝对值越接近1,表明两个变量的相关程度越高;

其绝对值越接近于0,表明两个变量相关程度越低;

如果其绝对值等于零1,则表示两个变量完全直线相关;

如果其绝对值为零,则表示两个变量完全不相关(不是直线相关)。

表4-5:

相关系数范围对应关系表

相关系数的值

两元素相关程度

完全不相关

微弱相关

低度相关

显着相关

高度相关

完全相关

由此可确定各项理化指标与葡萄酒质量的关联程度,选出相关系数绝对值大者,并据此进行酿酒葡萄的分类。

(二)聚类分析[3]

对酿酒葡萄进行分级,就是根据各样品中理化指标的相似程度对样品划分等级,下面我们采用的是聚类分析的方法对酿酒葡萄样品进行分类。

聚类分析的思想是:

设集合G中有n个样本X1,X2,…Xn,首先每个样本独自成为一类,计算类内样本间的距离,将距离最近的两个类聚为一类。

然后再计算新类间的距离,并将最近的两个类聚为一类。

以此循环,直到所有的类聚为一类。

其中,计算第i种与第j种酿酒葡萄样本距离的公式为:

其中,

分别表示第i种与第j种酿酒葡萄的第t个理化指标含量。

常用的聚类方法有最短距离法、最长距离法、重心法等多种方法,我们选用组间平均联结法联结类,它将两个类的所有成对案例(各来自一个类)间的平均距离作为类间距离并要求该距离最小。

它能利用两个类中所有成对指标的信息,使数据得到充分利用。

针对本题,各种酿酒葡萄即为各类,用聚类分析对所给酿酒葡萄进行分类的步骤为:

(1)对附件所给的成分数据进行预处理,对经过多次测试的项目数据取平均值。

(2)计算各理化指标与葡萄酒质量的Pearson相关系数,选出

的理化指标。

(3)将酿酒葡萄样品进行分类,计算距离,将样品视为p维空间的一点,通过计算不太样品的距离,距离接近的点归为一类,距离远的点归为不同类,并由此得到距离矩阵D。

(4)将每个酿酒葡萄样本独自成类Gi={Xi}(i=1,2,…,n)。

(5)由距离矩阵D,找到当前最小的Dij,并将类Gi,Gj合为一类得到一个新类Gr={Gi,Gj}。

(6)重新计算类间的距离,得到新的矩阵D。

重复第(5)步直到全部合为一类。

对所有酿酒葡萄根据其各项理化指标分好类之后,再根据附件所给评分数据,计算出每一类葡萄质量得分的评价值,根据分数高低进行等级划分。

4.2.3模型求解

(一)相关性结果

首先,根据第一问的结果,我们选择第二组评酒员对各葡萄酒样的评分平均值代表葡萄酒的质量分数(附录二),将各样品质量得分按从高到低排列,见表4-6(部分):

表4-6:

葡萄酒样品所得质量分数

红葡萄酒

白葡萄酒

样品编号

质量得分

66.3

68.4

65.3

77.5

71.4

78.2

72.9

68.8

74.3

运用spss软件进行指标含量与葡萄酒质量得分的相关性分析,本文均采用酿酒葡萄的二级指标,保证数据利用率最大,计算出各项指标与葡萄酒质量的Pearson相关系数(见附件2),从中选出

以及接近0.2的理化指标,代表与葡萄酒质量相关性较大的指标,结果见下表:

对红葡萄酒,

表4-7:

红葡萄理化指标与葡萄酒质量相关系数(

指标

苏氨酸

谷氨酸

甘氨酸

精氨酸

蛋白质

VC含量

花色苷

顺式白藜芦醇苷

杨梅黄酮

槲皮素

异鼠李素

-0.195

0.166

0.203

0.221

0.191

0.210 

0.210

0.815

0.401

-0.222

-0.202

总糖

葡萄糖

可溶性固形物

百粒质量

果梗比

出汁率

果皮质量

L*

a*

(+红;

-绿)

H

-0.198

0.242

-0.197

-0.163

-0.256

-0.313

-0.336

0.392

0.992

0.935**

结果分析:

上表结果确定了21个与红葡萄酒质量显着相关的理化指标,比如果皮颜色a*指标,由于果皮颜色对红葡萄酒色泽、澄清度影响较大,这直接影响着葡萄酒的外观得分,所以这项指标与红葡萄酒质量的相关系数达到了0.992,表明果皮颜色对红葡萄酒质量影响很大;

而对于果梗比,它与红葡萄酒的相关系数为-0.256,代表果梗比的含量与葡萄酒质量呈负相关关系。

这21个指标在较大程度上影响了质量得分。

对白葡萄酒,

表4-8:

白葡萄理化指标与葡萄酒质量相关系数(

酒石酸

柠檬酸

多酚氧化酶活力

DPPH自由基

葡萄总黄酮

-0.235

0.290

0.307

0.294

-0.226

-0.216

0.407

0.429

可滴定酸

固酸比

干物质含量

果穗质量

C

0.342

-0.262

0.358

-0.456

-0.206

0.347

0.395

由表可知,对于白葡萄酒,共有15个与白葡萄酒质量显着相关的理化指标。

(三)分级结果:

根据上述相关性分析结果

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 销售营销

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1