关键词雾霾主成分分析多元线性回归建议.docx
《关键词雾霾主成分分析多元线性回归建议.docx》由会员分享,可在线阅读,更多相关《关键词雾霾主成分分析多元线性回归建议.docx(25页珍藏版)》请在冰豆网上搜索。
关键词雾霾主成分分析多元线性回归建议
大学生科研创新项目研究报告
项目名称:
对于大范围持续雾霾天气成因的分析与研究
项目类型:
一般项目
项目年度:
2013年
项目负责人:
刘峰(32011120103)
负责人院(系):
统计学院
专业(方向):
统计学(数理统计)
项目组成员:
刘峰、骆弘毅、李安旭
指导教师:
常虹副教授
教务处制
二〇一四年
摘要
在雾霾天气日趋恶劣的情境下,探究大气主要污染物中导致雾霾的可吸入颗粒物产生的原因显得尤为关键和紧迫。
本文从数据分析的全新角度分析了国内外关于环境治理成功经验的客观性。
通过主成分分析以及多元线性回归等统计学方法对与环境污染相关的七种指标做分析,并得出了工业废气排放总量是引起可吸入颗粒物浓度增加的最主要原因。
本文结合国内外国际型大城市在发展过程中治理雾霾天气的经验,提出若干条建议。
最后,为相关决策部门提出了把空气质量监管的工作重点放在控制工业废气排放量与烟(粉)尘排放量控制等具体建议。
关键词:
雾霾、主成分分析、多元线性回归、建议
Abstract
AsthehazyweatherinareasofChinagettingmoreserious,exploringthemainatmosphericpollutantsinthecauseofthehazeofparticulatematterappearsparticularlycriticalandurgent.Inthispaper,fromthepointofviewofdataanalysis,anewanalysisofthedomesticandforeignsuccessfulexperienceabouttheobjectivityofenvironmentalgovernance.Throughprincipalcomponentanalysisandmultiplelinearregressionstatisticalmethods,thepollutionoftheenvironmentrelatedsevenindicatorsforanalysis,anditisconcludedthattheindustrialwastegasemissionsisthemaincauseofpm10concentrationincreased.Combiningtheexperienceofforeignerswiththesuggestionofnationalpeoples,weputforwardsuggestion.Finally,fortherelevantdecision-makingdepartmentsproposedregulatoryfocusonairqualitycontrolofindustrialemissions(powder),dustandsmokeemissionscontrolspecificSuggestions.
Keywords:
haze,principalcomponentanalysis,multiplelinearregressionstatisticalmethods,suggestions
目录
摘要1
关键词:
雾霾、主成分分析、多元线性回归、建议1
Abstract1
1雾霾的现状及影响3
1.1国内地区雾霾现状及影响3
1.2国外雾霾历史案例4
1.3国内外雾霾的对比与一些结论6
2有关空气质量指数(AQI)、计算单位及标准7
2.1有关空气质量指数(AQI)7
2.2测量与计算7
3.数据引入及分析8
3.1变量说明8
3.2原始数据
(一):
8
3.3原始数据
(一)数据分析10
3.4原始数据
(二)15
3.5原始数据
(二)数据分析16
4数据分析引出的结论20
5治理政策建议21
5.1由分析结论得出的建议21
5.2由外国历史获取的经验21
5.3结合外国经验总结的治理建议24
参考书目26
致谢27
引言:
近年来随着社会经济的发展,我国许多地区出现了严重的雾霾天气。
雾霾现象即是细粒子气溶胶粒子在高湿度条件下引发的低能见度事件,它的光学性质使得空气能见度降低,其毒性严重影响人们的日常生活与健康。
因此,雾霾指数的报告与预警也逐渐在天气预报中占有了显著位置,对雾霾的分析以及对其进行有效控制的工作也显得越发重要。
1雾霾的现状及影响
1.1国内地区雾霾现状及影响
雾霾是漂浮大气中的PM2.5等尺寸微粒、粉尘、气溶胶等粒子,在一定的湿度、温度等天气条件相对稳定状态下产生的天气现象。
随着雾霾天气逐渐恶化,雾霾这个词语也逐渐走进我们的生活之中。
由于雾霾天气导致的各种问题也逐渐深入到我们的生活之中。
由雾霾导致的高速封路,机场停摆,工地停工,学校停课,呼吸道疾病患者剧增,使得人们越来越关注雾霾这个概念。
1.1.1中国雾霾现状
1.1.1.1雾减霾增
雾霾是雾和霾的统称,但是雾和霾有着不同的意思。
雾是由大量悬浮在近地面空气中的微小水滴或冰晶组成的气溶胶系统,多出现于秋冬季节,是近地面层空气中水汽凝结的产物。
霾是悬浮在大气中的大量微小尘粒、烟粒或盐粒的集合体,使空气浑浊,水平能见度降低到10km以下的一种天气现象。
统计数据显示,我国雾霾天气成因具有明显的季节性变化。
1981年至2010年,霾天气出现频率是冬半年明显多于夏半年,冬半年中的冬季霾日数占全年的比例为42.3%。
从时间跨度来看,1961年—2012年,中国中东部地区(东经100°以东)平均年雾霾日数总体呈增加趋势。
近52年来,年雾霾日数最多的是1980年,有35.8天。
20世纪80年代以前,中国中东部地区平均雾日数基本都在霾日数的3倍以上;20世纪80年代以来,雾日数呈减少趋势,而霾日数呈增加趋势,雾霾日数比例逐渐减小,特别是2011年和2012年的霾日数均超过雾日数。
从以上统计数据中我们可以看出,雾减霾增已经成为了中国天气状况的一个重要的走向,这也就意味着我国的天气质量是在逐年的下降的。
1.1.1.2霾天连续
根据统计数据显示,连续3天以上的霾天气,2001年至2012年的检测平均值,为1961年至2000年的检测平均值得2倍以上。
其中,连续6天以上的霾天气,监测数据是对比数据的3倍以上。
连续霾天的形成主要是由于雾霾天气过于严重,雾霾天气无法消散引起的。
持续多天的雾霾天气,对我们的生活,交通,身体健康都有着非常不利的影响。
1.1.1.3东增西减
从空间分布看,雾霾日数变化呈东增西减趋势。
东北、西北和西南大部地区雾霾日数每年减少0—0.5天,除新疆北部外,西部地区年雾霾日数基本都在5天以下;华北、长江中下游和华南地区呈增加趋势,其中珠三角地区和长三角地区增加最快,广东深圳和江苏南京平均每年增加4.1天和3.9天。
中东部大部地区年雾霾日数为25天至100天,局部地区超过100天。
对比分析年霾日数变化可以看出,在20世纪70年代中期以前,大城市和小城镇年霾日数差别不大,但自20世纪70年代末期以来,大城市霾日数明显较小城镇偏多,大部分年份偏多超过50天。
1.1.2雾霾的影响及危害
1.1.2.1对人体健康的影响。
在雾霾天气条件下,大气中包含数百种大气化学颗粒物质,其中有害健康的主要是直径小于10微米的气溶胶粒子,如矿物颗粒物、海盐、硫酸盐、硝酸盐、有机气溶胶粒子、燃料和汽车废气等,它能直接进入并粘附在人体呼吸道和肺叶中。
尤其是亚微米粒子会分别沉积于上、下呼吸道和肺泡中,引起鼻炎、支气管炎等病症,长期处于这种环境还会诱发肺癌;雾霾天气还可导致近地层紫外线的减弱,易使空气中的传染性病菌的活性增强,传染病增多;雾霾天气容易让人产生悲观情绪,使人精神郁闷,遇到不顺心的事情甚至容易失控。
近50年来,广州市年灰霾日数以每10年16.4天的速率增加,每逢灰霾天气,呼吸道疾病发病率比平时增加15%左右。
[1]
1.1.2.2对交通出行的影响。
首先对于交通运输,受雾霾天气影响的地方航班延误甚至取消,高速公路封闭,海上交通等也受到不同程度的影响。
如,2013年12月7日到8日,石家庄机场手雾霾影响,两天取消航班71架次。
1013年12月9日,大连机场因雾霾遮天,48班航班延误,13班航班取消,滞留旅客4000余人。
还有火车,雾霾引起的"雾闪"导致京广铁路断电,临时停车或者延误事件时有发生。
1.2国外雾霾历史案例
1.2.1英国伦敦烟雾事件
20世纪中叶,英国伦敦工业生产和居民生活大量燃烧煤炭所产生的烟尘超量排放,导致“烟尘雾”频繁出现,随着雾情愈发严重,1952年12月5日发生了震惊世界的伦敦烟雾事件:
伦敦城连续4天被浓雾所笼罩,能见度只有几米,在接近地面的空气中,污染物浓度不断加:
烟尘浓度最多时达每立方米4.5毫克,比平时高了10倍;二氧化硫最高浓度达到5.4%,比平时高了6倍多。
[2]
受毒雾对能见度影响,大批航班被取消,水路交通几近瘫痪,毒雾也使得居民哮喘、呼吸道疾病频发,整个社会陷入混乱无序的状态。
据事后统计,在烟雾期间(12月5—8日)4天中死亡人数较常年同期约多4000人。
在事件发生的一周时间内,因支气管炎、冠病和心脏衰弱死亡者分别为事件发生前一周同类死亡人数的9.3倍、2.4倍、5.5倍和2.8倍。
肺炎、肺癌、流感及其他呼吸道病患者死亡率均有成倍增加。
2个月后又有8000多人陆续丧生。
[3]而在10年后,伦敦又发生了一次类似的烟雾事件,这次事件又造成1200人非正常死亡。
20世纪70年代,交通污染取代工业污染成为伦敦空气质量的首要威胁。
毒雾是煤炭消耗较多、工业较为发达的城市容易出现的现象。
1.2.2美国洛杉矶烟雾事件
1943年5—10月,美国洛杉矶大量汽车废气产生的光化学烟雾使得大多数居民患上眼睛红肿、喉炎、呼吸道相关等疾病。
该烟雾有着浅蓝色,浑浊的性状。
洛杉矶在上世纪40年代就拥有250万辆汽车,每天大约消耗汽油1100吨,排出1000多吨碳氢化合物以及300多吨氮氧化合物,
另有炼油厂、供油站等其余石油燃烧的排放,这些排放物在阳光作用下,特别是在5月份1月份的夏季和早秋季节的强烈阳光作用下,发生光化学反应生成淡蓝色光化学烟雾。
烟雾的成分较复杂,主要含有臭氧、醛类、酰基过硝酸酯等有机物。
加之洛杉矶三面环山的地形,光化学烟雾无法及时散开,停留在城市上空形成污染。
洛杉矶烟雾主要刺激眼、喉、鼻引起眼病、喉头炎及不同程度的头痛等。
在较为严重的情况下也会造成死亡事件。
烟雾还能造成家畜患病、妨碍农作物及植物的生长,对农业造成直接的、大量的经济损失,同时也会使使橡胶制品老化、材料与建筑物受腐蚀而损坏。
光化学烟雾还会使大气浑浊,降低大气可见度,影响汽车、飞机安全运行,易使得车祸、飞机坠落事件增多。
后来,在1952年12月的一次光化学烟雾中,洛杉矶市65岁以上的老人死亡400人。
可见光化学烟雾是工业发达,汽车拥挤的大城市的一个隐患。
[4]
1.2.3德国莱因—鲁尔工业区烟雾事件
1985年1月18日,雾霾笼罩德国鲁尔工业区,当地卫生部门首次拉响德国最高级别的雾霾三级警报,这表明了当地空气中的二氧化硫浓度超过了1800微克每立方米。
然而这已经不是鲁尔区第一次遭遇严重雾霾天气。
早在1962年12月,鲁尔区居民便已遭受了雾霾的危害,当时部分地区空气二氧化硫浓度高达5000微克每立方米,这种浓度致使不少人出现呼吸困难等症状,当地因霾致死人数超过150人。
1961年,鲁尔区共有93座发电厂和82个炼钢高炉,每年向空气中排放150万吨烟灰及400万吨二氧化硫。
当时的报道甚至称,鲁尔工业区“空气污染严重到汽车无法通行、呼吸感觉肺疼的程度,整个鲁尔地区昼同黑夜,树木都被煤灰粉尘染成黑色,栖息在树上的蝴蝶竟也将保护色变成黑色”。
鲁尔区的污染是严重性由此可见一斑。
[5]
在德国战后创造经济奇迹的年代,工业的迅速发展的确给人们带来了富裕,但很多人根本没有意识到未经过滤的工业废气会对人们的生活与健康带来多么严重的后果。
从德国鲁尔地区可以看出,重工业的发展容易给该地区带来严重的雾霾灾害。
1.3国内外雾霾的对比与一些结论
从以上来自不同国家的三个雾霾的历史案例中可以总结得出雾霾天气的主要成因为1、生活取暖等活动产生的气体2、工业生产产生的废气3、汽车行驶产生的尾气;在这个层次上,国外雾霾产生的原因与我国雾霾产生是相同的。
这三种人们的生产生活活动所产生的废气都是导致雾霾产生的主要原因,然而三种活动所产生的废气的成分及其所占有的比例又存在着差别,对其来源成分的分析可以让我们对雾霾成因的理解更加深刻与具体,这可以帮助我们在治理雾霾时抓住主要矛盾,制定更加合理、有效的政策。
就我国的雾霾成分而言,1999年和2006年专家对北京的雾水进行了两次采集了。
研究结果表明:
间隔7年后,北京雾水的酸度有所降低,但污染物浓度仍然非常大。
硫酸根离子只比7年前减少约10%,硝酸根离子减少约20%,阳离子的浓度则大大增加。
这说明,北京空气中污染物的来源原来以燃煤为主,现在仅仅是有所缓和,而工业排放、汽车尾气的增加却很厉害。
北京现在是比较严重的复合型污染。
[6]
就我国雾霾的发展趋势而言,霾的影响要大于雾,在时空上呈现东部地区雾霾趋严重,且持续时间增加的状况。
国外的雾霾呈现出三种因素交替演化的趋势,而我国雾霾主要成因仍需具体分析。
在影响方面从国外的案例中可以看出,雾霾会实在地影响到居民的生活质量,具体会在交通与居民健康、农业生产等方面造成极大的负面影响。
通过对比我们可以认识到,在积极地研究外国类似的案例的同时也要分析了解自身状况。
从国外案例中吸取治理的经验,会让我们少走弯路。
但无论如何,要根据我国的实际情况制定相应的政策,不能盲目借鉴。
因此,对我国雾霾实际情况的了解显得尤为重要。
2有关空气质量指数(AQI)、计算单位及标准
2.1有关空气质量指数(AQI)
空气质量指数(AirQualityIndex,简称AQI)是定量描述空气质量状况的无量纲指数。
针对单项污染物的规定了空气质量分指数。
参与空气质量评价的主要污染物为细颗粒物、可吸入颗粒物、二氧化硫、二氧化氮、臭氧、一氧化碳六项。
其中二氧化硫、二氧化氮、细颗粒物、可吸入颗粒物直接导致雾霾的形成,其中霾的产生与人们日常关注的细颗粒物、可吸入颗粒物直接相关,在AQI中即体现为分指数。
2.2测量与计算
2011年11月1日开始,环保部发布的《环境空气PM10和PM2.5的测定重量法》开始实施,首次对PM2.5的测量进行了规范。
在2012年初出台了空气质量新标准《环境空气质量标准》(GB3095-2012),将空气质量评价体系从“污染指数”(API)改为“质量指数”(AQI),在API的基础上增加了细颗粒物(PM2.5)、等3种污染物指标,发布频次也从每天一次变成每小时一次。
《环境空气质量标准》(GB3095-2012)规定了环境空气功能区分类、标准分级、污染物项目、平均时间及浓度限值、监测方法、数据统计的有效性规定及实施与监督等内容。
本文计算量单位主要有浓度:
微克/立方米、排放:
吨/时间
3.数据引入及分析
3.1变量说明
鉴于没有专门针对衡量雾霾强度大小的环境指标,且AQI指标的计算体系显示,其值不能直接反映雾霾强度大小,而雾霾给人们带来最大的危害是其中可吸入颗粒物的浓度,因此本文使用PM10浓度作为衡量雾霾强度的指标。
在影响北京市各环境指标中,反映生活污染物对PM10影响的指标选择汽车保有量,其原因在于每日实际运营车辆的数据较难取得,但实际运营车辆与城市汽车保有量有较大相关关系,故用汽车保有量作为代替汽车运营量的指标,进而反映汽车尾气对PM10的影响。
各指标单位如下:
PM10、二氧化硫浓度、二氧化氮浓度:
毫克每立方米
粉(烟)尘排量:
十万吨
年降水量:
毫米
汽车保有量:
万辆
工业废气排放总量:
亿立方米
3.2原始数据
(一):
年份
城市
PM10
二氧化硫浓度
二氧化氮浓度
2003
北京
0.141
0.061
0.072
2003
天津
0.133
0.074
0.052
2003
上海
0.097
0.043
0.057
2003
南京
0.12
0.03
0.049
2003
广州
0.099
0.059
0.072
2003
重庆
0.147
0.115
0.046
2004
北京
0.149
0.055
0.071
2004
天津
0.111
0.073
0.052
2004
上海
0.099
0.055
0.062
2004
南京
0.121
0.045
0.055
2004
广州
0.099
0.077
0.073
2004
重庆
0.142
0.113
0.067
2005
北京
0.141
0.05
0.066
2005
天津
0.106
0.076
0.047
2005
上海
0.088
0.061
0.061
2005
南京
0.11
0.052
0.054
2005
广州
0.088
0.053
0.068
2005
重庆
0.12
0.073
0.048
2006
北京
0.162
0.052
0.066
2006
天津
0.114
0.067
0.048
2006
上海
0.086
0.051
0.055
2006
南京
0.109
0.063
0.052
2006
广州
0.076
0.054
0.067
2006
重庆
0.111
0.074
0.047
2007
北京
0.148
0.047
0.066
2007
天津
0.094
0.062
0.043
2007
上海
0.088
0.055
0.054
2007
南京
0.107
0.058
0.051
2007
广州
0.077
0.051
0.065
2007
重庆
0.108
0.065
0.044
2008
北京
0.123
0.036
0.049
2008
天津
0.088
0.061
0.041
2008
上海
0.084
0.051
0.056
2008
南京
0.098
0.054
0.053
2008
广州
0.071
0.046
0.056
2008
重庆
0.106
0.063
0.043
2009
北京
0.121
0.034
0.053
2009
天津
0.101
0.056
0.04
2009
上海
0.081
0.035
0.053
2009
南京
0.1
0.035
0.048
2009
广州
0.07
0.039
0.056
2009
重庆
0.105
0.053
0.037
2010
北京
0.121
0.032
0.057
2010
天津
0.096
0.054
0.045
2010
上海
0.079
0.029
0.05
2010
南京
0.114
0.036
0.046
2010
广州
0.069
0.033
0.053
2010
重庆
0.102
0.048
0.039
2011
北京
0.113
0.028
0.056
2011
天津
0.093
0.042
0.038
2011
上海
0.08
0.029
0.051
2011
南京
0.097
0.034
0.049
2011
广州
0.069
0.028
0.049
2011
重庆
0.093
0.038
0.031
2012
北京
0.109
0.029
0.052
2012
天津
0.105
0.048
0.042
2012
上海
0.071
0.023
0.046
2012
南京
0.102
0.033
0.051
2012
广州
0.069
0.022
0.049
2012
重庆
0.09
0.037
0.035
3.3原始数据
(一)数据分析
3.3.1多元线性回归分析
对变量PM10、二氧化硫浓度、二氧化氮浓度两两做散点图,结果如下:
由显示结果看出PM10浓度与二氧化硫和二氧化氮均呈正相关但与二氧化硫浓度相关性远大于与二氧化氮的相关性,进一步以二氧化氮浓度为条件,得到二氧化硫与PM10浓度的关系图为
由图得出,在二氧化氮小浓度范围时,二氧化硫浓度与PM10浓度呈正相关,随二氧化氮浓度增大线性发生了变异。
分别做出PM10浓度对二氧化硫浓度和二氧化氮浓度的散点图,结果如下:
进一步说明两种化学污染物对PM10浓度的正相关性,建立回归方程,并检验,结果如下:
由检验结果可知,各项残差检验通过,并初步得到统计模型为:
其中:
—二氧化硫浓度
—二氧化氮浓度
y—PM10的浓度值
3.3.2对标准化后的数据进行线性回归分析
将各变量标准化后得到z-scale如下:
PM10二氧化硫浓度二氧化氮浓度
[1,]1.682965570.545092321.99671744[31,]0.87478290-0.79529863-0.36646444
[2,]1.323773271.24209561-0.05822332[32,]-0.696683390.54509232-1.18844074
[3,]-0.29259206-0.419989160.45551187[33,]-0.876279540.008935940.35276483
[4,]0.74008579-1.11699245-0.36646444[34,]-0.247693020.169782850.04452372
[5,]-0.202793980.437861041.99671744[35,]-1.45996702-0.259142250.35276483
[6,]1.952359793.44033675-0.67470555[36,]0.111499280.65232359-0.98294667
[7,]2.042157860.223398491.89397041[37,]0.78498483-0.902529900.04452372
[8,]0.335994461.18847997-0.05822332[38,]-0.112995910.27701413-1.29118778
[9,]-0.202793980.223398490.96924706[39,]-1.01097665-0.848914260.04452372
[10,]0.78498483-0.312757890.25001779[40,]-0.15789495-0.84891426-0.4