东三省数学建模论文文档格式.docx
《东三省数学建模论文文档格式.docx》由会员分享,可在线阅读,更多相关《东三省数学建模论文文档格式.docx(12页珍藏版)》请在冰豆网上搜索。
现需要解决的问题如下:
如何评价深圳市这三年各主要食品领域微生物、重金属、添加剂含量等安全情况的变化趋势;
从这些数据中能否找出某些规律性的东西:
如食品产地与食品质量的关系;
食品销售地点(即抽检地点)与食品质量的关系;
季节因素等等;
能否改进食品抽检的办法,使之更科学更有效地反映食品质量状况且不过分增加监管成本(食品抽检是需要费用的),例如对于抽检结果稳定且抽检频次过高的食品领域该作怎样的调整?
二、模型假设
1深圳市的食品市场保持现状稳态。
2没有大规模的温情疫情。
3深圳市对食品监督管理没有出台新的政策。
三、符号说明
A代表成本费用
B代表较高的检测效果
Ijk代表不具体的某位数字
μ代表总均值
αi代表水平Ai对指标的效应
βj代表水平Bj对指标的效应
γij代表水平Ai与Bj对指标的交互效应
四、问题分析
食品的质量安全问题需要考虑到微生物、重金属、添加剂含量等安全情况的变化趋势;
同时,我们要从所给的数据中找出某些规律性的东西,来分析各因素与食品质量的关系。
为了更科学更有效地反映食品质量状况且不过分增加监管成本,我们需要改进食品抽检办法,来达到更好的抽检效果。
五、模型的建立与求解
我们运用数据的统计描述和分析、excel软件、层次分析法、差分方程、多元分析、微观经济学的供需平衡等数学方法对抽查数据进行分析研究,构建数学模型,来解决个问题。
对于问题1:
首先对数据处理按季节分为17个子样本点的抽样值进行分析,得到各子样本食品安全情况。
运用层次分析法决定食品安全单位指标在综合评价中权重
年份
2011
2012
2013
食品安全系数
0.27
0.17
0.095
等级
Ⅲ级
Ⅱ级
Ⅰ级
由于食品安全生成这一过程涉及到诸多环节,所以我们必须考虑食材的生产收获外,食品的运输、加工、包装、贮存、销售以及餐饮等每一个环节皆可能影响食品的质量与安全。
其中运用统计分析中的方差,分析各个影响因子对食品安全的影响程度。
同时我们确定出哪些因素是主要的,哪些是次要的。
通过表格可以看出,由于抽样的各种不同方法以及子样空间的不同导致的子样均差以及子样方差的不同,导致了食品安全系数的标准不同。
首先,考虑抽样方法的影响。
通过对抽样数据和合格数据的观察,我们发现在不同抽样方法以及不同子样本空间下,对食品安全系数有较大的影响。
通过对整个表格的分析我们把抽样数据分了四个数据梯度,,分别为2013年的,2012年的,以及2011年和2010年的,然后列出四组数据,再应用方差分析模型进行分析,判断出评价深圳市这三年各主要食品领域微生物、重金属、添加剂含量等安全情况的变化趋势。
其次,我们在来考虑诸多环节对食品安全系数的影响。
我们把数据分为四个组进行分析,分别为取材环节,生产环节,流通环节,餐饮环节。
然后我们同样应用方差分析模型来对数据进行处理,来判断各个环节对评价深圳市这三年各主要食品领域微生物、重金属、添加剂含量等安全情况的变化趋势。
季度
抽查食品名称
抽查食品合格率
不合格项目
2010年
第一季度
藻类干制品、腐竹
86.60%
腐竹检出甲醛及二氧化硫残留量超标
第二季度
蜂蜜
92.30%
果糖和葡萄糖含量低于标准
第三季度
预包装乳制品及含乳制品
98.70%
蛋白质含量低于产品明示值
第四季度
凉拌菜和熟肉制品
96.30%
金黄色葡萄球菌和副溶血性弧菌
平均合格率
93.46%
2011年
动物性水产干制品
98.00%
苯甲酸和铅含量超标。
油炸食品
84.00%
铝残留量超标
蛋制品
95.90%
皮蛋铅含量超标
果冻
87.70%
防腐剂色素
91.40%
2012年
98.80%
超范围使用食品添加剂着色剂
食用植物油
99.50%
酸价
预包装罐头制品
97.50%
乙酰磺胺酸钾
食果蔬
单核细胞增生李斯特氏菌
98.65%
对于问题2:
我们需要找出食品产地、销售地点、季节因素与食品质量的关系。
在评价食品质量的过程中,我们用优良中差来代表食品质量的好坏。
其中,90分代表优,80分代表良,70分代表中。
我们通过对数据的分析整合,运用excel软件,得到如下食品销售地点与食品质量的关系。
如下表:
同理,我们研究分析了季节因素与深圳食品质量的关系,运用excel软件,得出下表所示关系。
对于问题3:
对食品进行抽检需要一定人力、物力和财力(即成本费用),抽检的越多检测效果就越好,但需要的时间就越长,其成本费用也就越高.为此,我们需要找到一个最佳的抽样方法,既能保证较好的检测效果,又能节省时间和成本费用。
模型建立:
设要考虑的成本费用为A,较高的检测效果为B。
如果要考虑两个因素BA,对指标的影响,BA,各划分几个水平,对每一个水平组合作若干次试验,对所得数据进行方差分析,检验两因素是否分别对指标有显著影响,或者还要进一步检验两因素是否对指标有显著的交互影响。
设A取r个水平A1,A2,L,Ar,B取s个水平B1,B2,L,Bs,在水平组合(Ai,Bj)
下总体x服从正态分布N(μ,σ2),i=1,L,r,j=1,L,s。
又设在水平组合(A,B)
ijijij下作了t个试验,所得结果记作x,x服从N(μ,σ2),i=1,L,r,j=1,L,s,
ijkijkij
k=1,L,t,且相互独立。
将这些数据列成表1的形式。
表1双因素试验数据表
B1B2…Bs
A1x111Lx11tx121Lx12t…x1s1Lx1st
A2x211Lx21tx221Lx22t…x2s1Lx2st
Arxr11Lxr1txr21Lxr2t…xrs1Lxrst
将xijk分解为
xijk=μij+εijk,i=1,L,r,j=1,L,s,k=1,L,t
其中ε~N(0,σ2),且相互独立。
记ijk
1rs1s
μ=∑∑μij,μi•=∑μij,αi=μi•−μ
rsi=1j=1sj=1
1r
μ•j=∑μij,βj=μ•j−μ,γij=μij−μ−αi−βj
ri=1
μ是总均值,αi是水平Ai对指标的效应,βj是水平Bj对指标的效应,γij是水平Ai与Bj对指标的交互效应。
模型为
x=μ+α+β+γ+ε
ijkijijijk
rsrs
α=0,β=0,γ=γ=0
∑i∑j∑ij∑ij
i=1j=1i=1j=12
εijk~N(0,σ),i=1L,,r,j=1L,,s,k=1L,,t
原假设为
H01:
αi=0(i=1,L,r)
H02:
βj=0(j=1,L,s)
H03:
γij=0(i=1,L,r;
j=1,L,s)
无交互影响的双因素方差分析
如果根据经验或某种分析能够事先判定两因素之间没有交互影响,每组试验就不必重复,即可令t=1,过程大为简化。
假设γij=0,于是
μij=μ+αi+βj,i=1,L,r,j=1,L,s
此时,模型可写成
x=μ+α+β+ε
ijijij
rs
α=0,β=0
∑i∑j
i=1j=1
ε~N(0,σ2),i=1,L,r,j=1,L,sij
下面采用与单因素方差分析模型类似的方法导出检验统计量。
记
rss1r
x=1x,x=1x,x=x
rs∑∑iji•s∑ij•jr∑ij
i=1j=1j=1i=1
S=(x−x)2
T∑∑ij
其中ST为全部试验数据的总变差,称为总平方和,对其进行分解
=(x−x−x+x)2+s(x−x)2+r(x−x)2
∑∑iji••j∑i•∑•j
i=1s=1i=1j=1
=SE+SA+SB
可以验证,在上述平方和分解中交叉项均为0。
其中
S=(x−x−x+x)2
E∑∑iji••j
i=1s=1
S=s(x−x)2,S=r(x−x)2
A∑i•B∑•j
我们先来看看SA的统计意义。
因为xi•是水平Ai下所有观测值的平均,所以r
(x−x)2反映了x,x,L,x差异的程度。
这种差异是由于因素A的不同水平所∑i•1•2•r•
i=1
引起的,因此SA称为因素A的平方和。
类似地,SB称为因素B的平方和。
至于SE的意义不甚明显,我们可以这样来理解:
因为
SE=ST−SA−SB在我们所考虑的两因素问题中,除了因素A和B之外,剩余的再没有其它系统性因素的影响,因此从总平方和中减去SA和SB之后,剩下的数据变差只能归入随机误差,故SE反映了试验的随机误差。
有了总平方和的分解式
ST=SE+SA+SB
以及各个平方和的统计意义,我们就可以明白,假设的检验统计量应取为SA与SE的比。
和一元方差分析相类似,可以证明,当H01成立时,
SA
F=r−1~F(r−1,