数学与应用数学专业毕业论文葡萄酒等级划分体系模型的探究Word文件下载.docx
《数学与应用数学专业毕业论文葡萄酒等级划分体系模型的探究Word文件下载.docx》由会员分享,可在线阅读,更多相关《数学与应用数学专业毕业论文葡萄酒等级划分体系模型的探究Word文件下载.docx(24页珍藏版)》请在冰豆网上搜索。
需根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
问题三:
酿酒葡萄与葡萄酒的理化指标之间的联系可能影响着葡萄酒质量,所以需建立模型,酿酒葡萄与葡萄酒的理化指标之间的联系。
问题四:
分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,能否综合感官指标和理化指标,建立模型,来评价葡萄酒的质量是问题关键所在。
二、模型假设
1.品酒员打分相互之间没有影响;
2.品酒员对样品的给的总分是他对该样品所有方面评分的总和,并且该样品的最终得分可认为是10位品酒员打分的平均值;
3.题目所给的数据真实可靠;
4.酿酒方式及酿酒过程对葡萄酒的质量没有影响;
5.不同种类葡萄酒的成份数据值统一标准没有差异;
6.所有样品的酿造过程相同。
三、符号说明
n
测试数量
r
测试水平量
A
因素
SS
各类数据源的平方和
Df
各类数据相应的自由度
MS
各类的均方值
F
统计量
P
大于F的概率
各组均值对总方差的偏差平方和
各组数据对均值偏差平方和的总和
四、问题分析
问题一的分析
我们要根据附件1的数据可知:
评酒员对红酒27组样品,和白酒28组样品进行评分,每件样品都进行了两次评分,即是有两组评分数据,题目要求分析两组评酒员的评分结果有无显著性差异,以及那一组数据更加可信,对于显著性的判断,我们采用单因素方差分析法(AnalysisOfVariance)。
对于每件样品,评酒员对外观,香气,口感,及其整体评价进行打分,每一组的每件样品都有十名品酒员进行评分,故求每个品酒员对样品酒的总分,之后求出这十名品酒员给的总分的平均分,此平均分就是该样品的总分,葡萄酒分为白酒和红酒,我们对第一组的红酒和第二组的红酒进行方差分析法,运用matlab软件中的anova1函数可得出p-value,及F值,通过分析就可知道那组更加具有显著性。
方差是考察数据的波动性的,方差小就说明数据比较稳定,方差大就是波动性比较大,故通过比较两组数据的方差大小,就知道那一组数据更加可信。
问题二的分析
根据问题一可知,第二组的评酒员的评酒分数更可靠,所以选择第二组葡萄酒的数据进行处理。
从评酒员对葡萄酒评分的分数入手,用逆向思维反推葡萄的等级。
首先将第一问中第二组的白葡萄酒和红葡萄酒的每一种样品的评分进行分等级,依次分为四个等级,然后用EXCEL将每个等级的样品酒的理化指标画成曲线图,忽略异常数据点,观察各等级间的理化指标有没有相关性,如果有相关性,找出影响葡萄酒质量的相关因素,跟酿酒葡萄的理化指标数据进行对照,得出酿酒葡萄的分级依据。
问题三的分析
结合葡萄酒和酿酒葡萄的理化指标,作出每两个理化指标间的直观趋势图,观察两者之间的大体关系,根据曲线拟合的方法得出两者间的函数关系。
问题四的分析
由第三问求解可得出酿酒葡萄与葡萄酒的理化指标之间是呈线性相关的,因此我们要证明酿酒葡萄和葡萄酒的理化指标对葡萄酒质量是有影响的,只需证明酿酒葡萄的理化指标对葡萄酒质量是有影响。
在综合附录3给出的芬香物质,用MABTLE拟合出理化指标和感官指标的关系图呈相关性,所以要综合葡萄酒的理化指标和感官指标一起来评价葡萄酒的质量。
五、模型建立与求解
5.1问题一的模型建立和求解
对于两组评酒员的评价结果有无显著性差异,我们采用单因素方差分析法去解决。
单因素方差分析法:
只考虑一个因素A对所关心的指标的影响,A取几个水平,在每个水平上作若干个试验,试验过程中除A外其它影响指标的因素都保持不变(只有随机因素存在),我们的任务是从试验结果推断,因素A对指标有无显著影响,即当A取不同水平时指标有无显著差别。
A取某个水平下的指标视为随机变量,判断A取不同水平时指标有无显著差别,相当于检验若干总体的均值是否相等。
设A取n个水平,在水平下总体服从正态分步N(,),i=1,...,n,这里,未知,可以互不相同,但假定有相同的方差,又设在每个水平下作了次独立试验,即从中抽取容量为的样本,记作服从N(,),i=1,…,n,j=1,…,且且相互独立。
将这些数据列成表1(单因素试验数据表)的形式。
表5.1单因素试验数据表
分值
第一组红酒
第二组红酒
第一组白酒
第二组白酒
A1
X12
X21
A2
X22
.....
A3
X31
X32
根据上述理论,首先我们对数据进行处理,附件1里有四组数据:
红葡萄酒和白葡萄酒各有两组数据,每种酒都有两组人进行对其进行评分,每件样品酒有十名品酒员号打分,采用单因素方差分析法,我们将样品酒的总分作为唯一考虑的因素A,运用matlab软件编程求出品酒员对每组样品打的总分的平均分,见下表:
表5.2组样品红酒和白酒的总分
样品号
第一组红葡萄酒品尝综合得分评分
第一组白葡萄酒品尝综合得分评分
第二组红葡萄酒品尝综合得分评分
第二组白葡萄酒品尝综合得分评分
1
62.7
82
68.1
77.9
2
80.3
74.2
74
75.8
3
80.4
79.7
74.6
75.6
4
68.6
79.4
71.2
76.9
5
73.3
71
72.1
81.5
6
72.2
68.4
66.3
75.5
7
71.5
77.5
65.3
8
72.3
71.4
66
9
72.9
78.2
10
74.3
68.8
79.8
11
70.1
61.6
12
53.9
63.3
68.3
72.4
13
65.9
73.9
14
73
72
72.6
77.1
15
58.7
65.7
78.4
16
74.9
69.9
67.3
17
79.3
78.8
74.5
18
59.9
73.1
65.4
76.7
19
78.6
76.4
20
79.5
77.8
76.6
21
79.2
22
77.2
71.6
23
85.6
75.9
77.4
24
78
76.1
25
69.2
68.2
26
73.8
81.3
27
64.8
77
28
79.6
对这四组数据,我们将白酒和红酒分开来判断其有无显著性,即第一组红酒与第二组红酒,第一组白酒和第二组白酒比较。
运用matlab软件对数据处理编程得出以下结果,标准ANOVA表分析见下表:
表5.3白葡萄酒ANOVA表
图5.1白葡萄酒盒型(box)图
表5.4红葡萄酒ANOVA表
图5.2红葡萄酒的盒型(box)图
表5.5方差分析表:
方差来源
平方和(SS)
自由度(df)
均方(MS)
1-P分数位F
概率p
因素A
r-1
误差
n-r
总和
通常情况下,实验结果p达到0.05水平或0.01水平,才可以说数据之间具备了差异显著或是极显著。
在作结论时,应确实描述方向性(例如显著大于或显著小于)。
sig值通常用P>
0.05表示差异性不显著。
在此我们去0.05作为显著性水平标准,红酒中的ANOVA表中Prob>
F栏p值为0.0278<
0.05,故拒绝Ho,且盒型图的中心线差差别不大,对应的F也很小,故可知品酒员对白酒的评分具有显著性。
红葡萄酒酒中的ANOVA表中的P>
0.05,接受Ho,故没有显著性。
对于那组数据更加可信,我们知道方差是考察数据的波动性的,方差小就说明数据比较稳定,方差大就是波动性比较大。
故我们将红酒,白酒每组样品酒一一对应,第一组的红酒中样品一与第二组红酒中的样品一进行方差分析,以此类推,我们将所求到的方差用matlab进行画图。
图5.3白葡萄酒的方差图
图5.4红葡萄酒的方差图
从两副图中,我们很明显的看到第二组数据的方差基本小于第一组数据,因此我们认为第二组数据更加可信。
5.2酿酒葡萄的分级
5.2.1白葡萄酒的分级
通过统计第二组白葡萄酒的每个样品的分数,将白葡萄酒分为四个等级。
第一等级
(75,80]
第二等级
(70,75]
第三等级
(65,70]
第四等级
(0,65]
由分数等级标准可得到