食品质量安全抽检数据分析 2Word文件下载.docx
《食品质量安全抽检数据分析 2Word文件下载.docx》由会员分享,可在线阅读,更多相关《食品质量安全抽检数据分析 2Word文件下载.docx(18页珍藏版)》请在冰豆网上搜索。
而且或许是为了方便,食品监察部门总是在某个时间段只检查某一类的食品,在所给数据中能够很清晰的反应这一点,比方检查饮用水,它的数据只会在一年众多报告中的某一其中出现,这是否意味着不良商贩可以抓住这种制度上的漏洞而根据不同的时期进行“灵活”的生产食品以逃避监管部门的检查与打击。
其问题的复杂性就是在于如何从纷乱的数据中提取一些值得研究的,或者是感觉能够找到一些规律的项目进行适当的处理从而期望可以得到一些比较普适的结论。
其次,问题中给出了我们提示。
对于第一问,研究食品安全不合格的因素,从数据中也可以反映出来食品安全不过关主要是微生物的过量繁殖,重金属的残留以及食品添加剂的滥用,其次还有一些其他所占比重较轻的因素。
对于这个问题,有一份关于食品检验的资料,如下:
食品检验内容十分丰富,包括食品营养成分分析,食品中污染物质分析,食品辅助材料及食品添加剂分析,食品感官鉴定等。
狭义的食品检验通常是指食品检验机构依据《中华人民共和国食品卫生法》规定的卫生标准,对食品质量所进行的检验,包括对食品的外包装、内包装、标志、唛头和商品体外观的特性、理化指标以及其它一些卫生指标所进行的检验。
检方法主要有感官检验法和理化检验法。
科标化工分析检测中心(SCT)提供以下食品检测检验试验测试需求:
理化项目:
水分,灰分,酸价,过氧化值,挥发性盐基氮,三甲胺氮,咖啡因,脂肪酸,丙二醛,氨基酸态氮,总酸,酸度,明矾,总碱度,L-羟脯胺酸,黄曲霉毒素B1,苯并[a]芘,丙酸钙,丙酸钠,脲酶,米酵菌酸,溶剂残留量,羰基价,甲醛,次硫酸氢钠甲醛,过氧化苯甲酰,亚硝酸盐,甲醇,乙醇,总脂,酒精度,杂醇油,二氧化硫,相对密度,pH值,比旋光度,折光率,粒度,细度,折射率,熔点,净含量,新鲜度,完整率,干粒重,干燥物,可溶性固形物,总固形物,非脂乳固体,全乳固体
重金属及微量元素:
铅,砷,无机砷,汞,甲基汞,铜,镁,锌,锡,钙,铬,镉,磷,氟,碘,硒,钾,钠,铝,铁,锰等
食品添加剂:
防腐剂:
山梨酸,苯甲酸;
着色剂:
胭脂红,苋菜红,柠檬黄,日落黄,诱惑红,亮蓝
甜味剂:
糖精钠,甜蜜素
抗氧化剂:
叔丁基羟基茴香醚,二叔丁基对甲酚,植酸,TBHQ
漂白剂:
亚硫酸盐,二氧化硫
护色剂:
硝酸盐,亚硝酸盐
面粉处理剂:
过氧化苯甲酰
水分保持剂:
磷酸盐等
食品农药残留测试:
有机磷、有机氯、拟除虫菊酯类、氨基甲酸酯类等400余种测试
食品兽药残留测试:
氯霉素、土霉素、金霉素、四环素、硝基呋喃、磺胺类、盐酸克伦特罗等
微生物检测:
细菌总数、大肠菌群、霉菌和酵母菌、大肠杆菌、志贺氏菌、金黄色葡萄球菌、沙门氏菌、致病菌等
所以对第一个问题,只需要依据这些关键字找到其相关数据再分析其变化情况应该就可以。
但是还应该注意到有些食品是对于某些安全因素特别敏感,比如说小食品容易发霉发烂,就容易受到微生物这一因素的影响。
还比如说平时所见的馒头或者油条需要发酵处理,就很可能膨松剂添(主要是含铝元素)加过多而导致铝元素过量,所以我们需要根据具体的食品来讨论这些安全因素的变化趋势,而非一概而论。
对于第二个问题,题干给糊了一些思考的方向,大体上也是根据相关关键因素去寻求关于那个因素的一些变化趋势,比如按照常理来讲食物在夏天易受温度,湿度的影响,会加速腐坏,而在冬天就变得容易保存一些,而又这个表观现象所揭示的内在缘由是在夏天微生物繁殖加快由于食品上或多或少会附有微生物,在季节影响下可能会加速其繁殖,而这个时候如果食品保存不谨慎的话实际容易受到勿扰从而变得不安全的。
同样地地点因素也会影响事物的安全性,比如有些地方处在交通要道,整天车来车往,空气污染很严重,周围有有大量工厂,很可能水源也会受到污染,在这种环境下生产出来的事物就很可能“来路不正”,比如周围的工厂向附近水域中排放工业污水,里面带有大量重金属元素,而制作食品时商家或许没有考虑到这个因素,用这种水源去生产事物,这样生产出来的食物很可能就被检测出来重金属元素超标。
上面是对食品生产地点的一些分析,对于食品的销售地点也是一样的,有些零售商贩为了仓库空间的利用率,很可能把食品堆放到那种空气混浊,条件极为简陋的小房子里,这种条件很容易滋生出一些生物,那些生物携带各种传染疾病就很容易是存放的食物收到重大污染,很可能就会被检测出在微生物这个指标上超出正常所能容忍的范围。
这都是一些生活上的常识。
但我们还是要依靠数据来说话,用数据显现出潜藏的规律。
对于第三个问题呢,是为了提高食品安全监测中的效率。
或许有些数据就是冗余的,也就是说在实际的检测中都没有必要进行检测(虽然说会有风险让一些漏网之鱼逃脱掉了),但是只要我们能够制定一种更为简洁的方案使得可能安全不达标的产品未能被检测到的概率降到很低就行了。
这种优化的问题真的很难,一是作为一个极为重要的部门,必然其背后已经有相关专家为其设计了很优化的办法,我们再从如此严密的体系中去找到一种更好的方法应该是很困难的,另外是这些数据所属分类也相当繁复,需要通过很敏锐的视角找到某个因素再从这个因素出发观察是否某些数据关于这个因素是否会有堆积,从而为了减少这种堆积(也就是冗余量),我们便可以以这个寻找到的因素设计出一种可能会更好的办法(所谓可能,是因为控制住了单个因素而设计出的改良方法可能会影响其他因素,从而从整体上会降低整个抽样体系完备性上的缺失)。
这个问题,还有个难点就是,如何评估一种抽样方法,应该从哪些角度出发进行描述,由于数据是有限的,我们也不可能用假设的方法实时地进行评估模拟(因为几乎无法判断这样得出的数据真实性是否很强)。
对于抽样方法的描述,主要看其样本空间大小选取是否合适,而食品种类也是个不小的数字,这种对比使得我们很难去把控衡量样本空间的大小,这种大小的选取也直接决定了食品检测过程中的执行效率与经济成本。
而这种评估远远不是通过某个因素就能单方面决定的。
我们必须做一些让步,看是否可以提取某些因素,建立起一个大致的评估框架,从而得到比较粗略的评估,然后根据这个评估法则来优化原有的方案。
三、问题假设
1.假设食品能且分为四大类,其他没有被分类的食品对食品安全性所造成的影响忽略不计。
2.假设影响食品安全性的因素能且分为四大类,其他没有被分类的因素对食品安全性所造成的影响忽略不计。
3.假设调查样本在一定的范围内是均一的。
4.假设所有食品生产厂商的信誉度均相同。
5.假设抽检不受国家相关政策的影响。
6.假设检测不同环节、不同因素的成本和工时相同。
4、问题求解
对于第一个问题,这里给出为不合格的不同类型食物的具体统计数据:
以上四个表是针对四种不同食物和四种不安全因素来源的一个统计。
左图是按不合格食品数量做出的。
其中x轴表示时间项,y轴表示了被检测出的不合格食品数量。
可以发现其实这个走势是有点不正常的,原因是在2010年尾的时候监察部门来了一次范围非常广的食品安全抽查工作,这应该是当时在国家发生若干期食品事故之后上级部门所严厉要求的一次活动。
由于其样本大小的不确定性是的问题分析很麻烦,又在右边作出了相应的安全因素所占百分比的图。
意即在每一次的检测中,绘制出某一安全因素导致的不合格食品数量所占那一次所有被检测出不合格食品数量的百分比,这样的话就可以忽略所采样本的大小从而更真实的反映出所要研究的几个安全因素的走势图。
下面根据图形进行走势分析,首先是蔬菜水果类食品,这类食品的主要安全因素问题与的确与时间有关,在微生物滋生的季节中可以发现这是占据食物安全不合格的主要因素,而在另一些时间段里,就是其他因素了,因为对于蔬菜水果,一般是不会发生重金属残留的,而他本身也是自然型的东西,而为了保存方便,商贩们对蔬菜水果使用添加剂。
对于禽畜肉类情况与蔬菜水果类似,也是容易在细菌滋生的高发季节沾染上微生物,导致其安全不合格。
鱼类也有这样的特点,因为前三样食品都是可以未经过加工的,收到重金属与添加剂影响而变得安全不合格的情况较少(因为使用这些东西商贩们也得拿出很多钱,而这是不必要的,如果只是对这些食品做简单保存的话)。
再看第四种食品,大概说来,这一类可被称为加工后食品,容易受到各个方面安全因素的影响。
并且可以从图中看出他们所受到的影响来源还是比较均衡的。
而仔细比对四张图,发现最受季节影响的要数微生物这个因素了,因为微生物的繁殖生活是和季节条件息息相关的。
而其他几种因素所占百分比可以说都是因为微生物这个因素变化而变化的,另几个因素化学结构稳定,不容易受到外界条件的影响。
下面这个图表是2010年与2011年的各个环节食品合格率的统计,未收录2012年数据的原因是当年的数据报道方式发生改变,是每一期报道都按照各种不同的极为具体的食品进行分类抽查,统计起来十分不方便,故未考虑收用。
图中X轴前半段是根据2010年的具体时间给出的,后半段是根据2011年通报的期数来进行统计的。
从图中我们可以看出合格率的变化是相当平稳的,只有偶然的情况才会使得它的变化发生突变,图中突变点为2011年第四期通报处,再看具体数据,此次共检验696批次,检验合格501批次,产品抽样批次合格率为72.0%。
已经相当低了,这种检测数据不算是偶然,一方面,与时间有些关系,从上表中可以看出来,在春夏季的时候,食品合格率偏低,再结合每期通报上的叙述可以知道多半都是由于微生物的污染导致的,而那些合格率非常高的食品检测时间段常在秋冬季节。
有个有趣的事实,是在节假日的时候,食品的不合格率会略有增加,这个时候那些商贩更像是铤而走险,顶风作案,为了一点经济利益至人民的生命安全于不顾。
对于第二个问题,我自己采集的数据只有根据时间划分的类型,而没有将地点标记为一个因素(主要原因是有些食品来源只说了具体的厂家名称为没有加上它所在的区域),但是在具体的数据采集中,还是留意到食品的产地可以分为深圳本地与外地,而深圳本地有六个区域,根据网络资料与自己数据统计信息的一点了解,大体情况是深圳外地的视频不合格率情况高于本地产品,这可能说明了深圳市的的确确走在食品检测的前沿上,力度大,信息公开透明,而一些外地的区域似乎没有深圳市管制的这么严厉。
还有就是经济发达地区的食品不合格率要低于经济发达地区的视频不合格率,这可能也是因为经济发达地区的制度要健全一些,这种状况只能带来好的更好,坏的更坏的结果,食品检测背后可能有一些经济规律在里边,而这个结论也只是建立在这么一点点数据的基础上,很可能不值得相信。
这里详细分析一下这种猜测:
由于经济发达,食品制造商或许不用担心销量问题,也就是不用担心自己卖东西的利润,他们也许更想保住自己的牌子,因为一块好的招牌可以为他们带来良性循环,只有有持续的销售量,他们就稳赚不赔,而由于食品安全出问题而砸了这块招牌的话,第一,是再也不会有顾客进行购买;
第二,食品制造商也会因此而付出沉重的经济赔偿;
第三,他们还极有可能会因此而受到法律的制裁。
可以说,就是因为经济发达而留住了他们,而由于利益因素导致他们不得不生产安全食品,因为一方面造伪造假节约生产成本而得到的钱财有可能根本比不上多销售几件产品的成本;
另一方面是为了稳定,因为流程化的食品生产必然会增加效率从这个方面减少开支。
而对于经济欠发达地区或是地理位置不优的地区,更多的食品商都是些小商小贩,他们流动性强,制作规模小,不带考虑自身制造食品的口头影响力,这样想来,他们节约下来的生产成本就很可能是他们利润中不小的一个份额,这种情况下他们会选择铤而走险,他们流动性强,还有他们规模小,导致他们可以采取“打一枪换个地方”的移动生产模式,一方面逃避制裁,另一方面重新寻求销售途径,这就是食品安全问题背后的经济因素。
同样的,地理因素也和经济因素相勾连,因为食品制造厂的选址背后牵扯到的是一堆经济问题,要好地方就得花钱,经济发达地区的地皮当然是相当昂贵,规模小的厂商不敢选用,他们也只好跑到经济欠发达的地方(最多的就是乡镇,或者是城中村,郊区这类地方),而这类地方生活条件不好,环境可能也不好,而且这种地方周围或多或少会有一些企业工厂,若是在这些地方生产食品,就很可能在生产过程中以及保存过程还有运输过程中收到污染。
另一是经济欠发达地区会向经济发达地区运输所生产的食品,因为经济发达地区消费水平高,人口流动大,自然是理想的销售地,而如果生产食品的地方就选在经济发达地区,那么必然会少掉中间的运输过程以及节约了保存过程;
而对于经济欠发达地区的食品生产商贩,他们既要增加运输成本又要增加存放成本,从而很可能会在生产过程中大打折扣,而且在这两个过程中又极可能会增加食品安全性的下降,所以综上所述,食品不合格率是和食品生产地区有一定关系的。
这个结论也可以适量的解释为什么外来食品的不合格率会略低于深圳市本地区的食品不合格率。
对于第三个问题而言,检测部门应该平均每次检测食品的数量,而不是在某些时间段搞得很集中,就比如说,上面几个图中在某些期的数据就明显比其他时间段的数据来的更多,这种情况不应该因为节假日的原因就这样莫名其妙的增加多于平时若干倍的检测数量。
而通过深圳市食品检测的报告也可以看到这一点他们在进步,就是在2012年的数据统计中,就是采用每一期抽查大量品种的食品类型而把食品抽查的样本数适当降低,也就是一种类似于“多次少取”的办法,这样做的好处是:
第一,铺开了食品检测面,这种灵活的品种选取会非常有效果的防备那些食品生产商那种侥幸心理,对某个食品类型检测的次数多了会带个生产者一种感觉,就是自己无时无刻不是在收到控制之中,从而起到一个约束作用;
第二,由于选取的样本数量变少,可以节约食品检测所花费的成本,还有这样可以防止冗余数据,就是某一期中数据量会变得非常大那种情况,其实那时没有必要的,还不如把检测量变得更平均,这样加大了检测的密度(无论是品种上,还是时间上),换来的是检测效率的提高。
比方说,对于一家不合格的食品制造商,去检查一次他可能逃过了,这是他逃避掉的概率是和样本容量选区有关,是一次的,而若果多次抽查,虽然说看单次,他逃避掉的概率会上升,但注意到这种概率会以几何级数做下降(概率始终小于1),所以,这种“多次少取”绝对是一个极为有效的办法,从这也可以看出深圳市检测技术的提升。
从反面来看待,对于抽查频次过高的食品就应该相对减少一些,因为检测成本有限,对某类食品的检测成本花费过高必然使得对其他食品类型检测的不力,由于食品无处不在,类型丰富,我们不是为了“求精”。
而是务必“求全”,从整体效用上提高检测水平,而非在单方面的提高某类食品的监管。
毕竟人手,资金有限,可定时要根据食品类型所占多少而对检测的样本数进行均匀分配的。
这一点应该没有问题,目的就是为了更平均的检测各个品类的食品(从统计角度而言,就是使它的方差尽可能低,对于此处,就是该食品类型占所有食品类型的比重与抽查所选样本数量的关系)。
5、问题总结
这个问题最难的就是进行合理的数据分类,体重所需处理的数据所具有的属性非常的多,并且数据给出的格式也因为年度变化而发生变化,这就给问题的分析带来巨大的麻烦。
在解决问题中大量的时间都是投入到数据的手工统计中了,并且纷乱的数据量根本让我想不到有什么可以操作的模型,于是也是有想到通过图表的手段直接清晰明了的表现问题,将数据作适当的分类,把干扰要素通过适当的分类降到最低。
但是食品统计过程中抽查的视频来源十分复杂,比如说水果蔬菜类就有可能是天然的类型,也有可能是餐馆里边的水果沙拉或是凉菜;
肉类产品也一样,既有可能是来自于生产环节上的(即那些屠宰场或养殖场),也肯能是出现在流通环节上的,比如说超市出售的肉类产品,更有可能是经过加工的,有些来源于卤肉店或者就是即开即食的包装产品;
这些非常细致的分类导致问题处理起来极为不便。
一个原因是由于时间过于仓促,导致我想不出来什么好的模型能够去描述这个抽查过程;
另一个是由于技术手段的落后,大量数据都是靠人工进行筛选与统计。
所以我也只能借助图表和WPS下的小工具进行纯人工的数据分析。
希望以后能够在完善对于这个题目的处理
附件:
检测时间
生产环节
流通环节
餐饮消费环节
时间
检测样本数
合格数
合格率
20102-28
1791
1666
93%
139
100%
150
2
98.70%
20104-29
1483
1415
95.40%
302
294
97.40%
79
20105-27
112
107
95.60%
219
212
96.80%
20106-10
18
16
88.90%
84
49
48
98%
20106-28(粽子)
248
242
97.60%
20107-2(凉茶)
20107-2(冷饮)
50
20107-2(谷物)
165
20107-2(肉制品)
134
96.40%
20107-2(水产品)
34
6
82.40%
20107-7(饮料)
80
20107-7(水产品)
60
58
96.70%
20107-7(鲜榨饮料)
200
198
99%
20107-15(谷物)
20107-23(水产品)
161
160
99.40%
20107-23(罐头)
59
98.30%
20107-28(凉菜)
182
181
99.50%
20108-03(西餐菜肴)
251
244
97.20%
20108-20(饮用水)
31
29
93.50%
20108-20(餐具)
133
131
98.50%
20108-20(固体饮料)
40
38
95%
20108-20(保鲜膜)
32
30
93.70%
20108-20(洗涤剂)
88.9
20108-31(沙拉酱)
14
20109-1(啤酒)
11
20109-1(含乳饮料)
17
20109-1(酱油)
22
20
90.90%
20109-10(月饼)
128
127
99.20%
51
20109-17
195
191
97.90%
845
820
91.90%
1436
1375
95.80%
20109-17(大米)
78
77
20109-30(食材)
268
258
96.30%
201010-19(小麦粉)
201012-23(豆制品)
85
73
85.90%
20111-1
1599
1541
469
454
96.8
515
549
96.90%
20111
419
410
1262
1208
95.70%
2180
2085
20112(速冻食品)
202
20113
1556
1374
88%
20114
696
501
72%
20115
540
507