基于主成分分析的世界主要城市空气污染的研究.docx
《基于主成分分析的世界主要城市空气污染的研究.docx》由会员分享,可在线阅读,更多相关《基于主成分分析的世界主要城市空气污染的研究.docx(62页珍藏版)》请在冰豆网上搜索。
基于主成分分析的世界主要城市空气污染的研究
海南大学
毕业论文(设计)
题目:
基于主成分分析的世界主要城市空气污染的研究
学号:
姓名:
年级:
2009级
学院:
信息科学技术学院
系别:
数学系
专业:
信息与计算科学
指导教师:
完成日期:
2013年4月30日
摘要
随着人口的高速增长,工农业的高速发展,人类活动对大气环境的影响越来越大。
有些大气环境问题也越来越突出,如全球变暖、臭氧层遭破坏和酸雨的危害等。
有些大气污染所造成的危害已经没有了国界的限制,形成了全球性大气污染,成为与世界各国都有直接利害关系的问题。
全球性大气污染已引起了世界各国的普遍关注。
要解决这个问题,需要各国协调一致的行动,不论是发达国家还是发展中国家,都应为此进行努力,在公平合理的原则基础上,承担起各自的责任与义务。
治理空气污染已经到了刻不容缓的时刻。
本文主要运用SAS软件对《中国统计年鉴》2005年到2011年世界主要城市空气污染状况数据进行主成分分析,去除由总悬浮颗粒物、二氧化碳和二氧化硫三个污染因子衡量空气污染程度的冗余,得出主成分
,使其保留原有指标的主要信息,成为衡量城市污染状况的唯一指标,以便方便地获得一个城市的空气污染状况,并采取相应的措施治理该城市的环境污染。
关键词:
环境污染;主成分分析;贡献率;环境保护
Abstract
Withtherapidgrowthanddevelopmentofthepopulation,industryandagriculture,theinfluenceofhumanactivitiesontheatmosphericenvironmentismoreandmorebig.Someoftheatmosphericenvironmentalproblemisbecomingmoreandmoreprominent,suchasglobalwarming,ozonelayerdestructionandtheharmofacidrain,etc.Someharmhasbeencausedbyairpollutionwithoutthenationalbordersrestrictions,formedtheglobalatmosphericpollution,becomeadirectinterestwithallcountriesintheworld.Globalairpollutionhascausedwidespreadconcernaroundtheworld.Tosolvethisproblem,needconcertedactioninallcountries,bothdevelopedcountriesanddevelopingcountries,shouldmakeeffortsforthis;assumetheirrespectiveresponsibilitiesandobligations,onthebasisoftheprincipleoffairandreasonable.Soitisurgenttocontrolairpollutionhasreachedamoment.
Inthispassage,IusetheSASsoftwaretodealwiththedata,whichistheworld'smajorcitiesairpollutionofChinaStatisticalYearbookfrom2005to2011,withprincipalcomponentanalysis.Removingtheredundancy,thatusesthetotalsuspendedparticulate,carbondioxideandsulfurdioxidetojudgethedegreeofairpollution.Getthemainingredient
makeitincludethemaininformationoftheoriginalindicators,becometheonlyindicatorofurbanpollution.Soitisconvenienttoknowtheconditionsofacity'sairpollution,andtakesomeappropriatemeasurestocontrolofit.
KeyWords:
Environmentpollution;Principalcomponentanalysis;Contributionrate;theenvironmentalprotection
目录
一、绪论……………………………………………………………………
(1)
1.空气污染的概念及危害…………………………………………………
(1)
1.1空气污染的概念………………………………………………………
(1)
1.2空气污染的危害………………………………………………………
(1)
2.研究背景及意义………………………………………………………(6)
二、空气污染因子的概述………………………………………………(7)
1.二氧化碳的概念及来源……………………………………………(7)
2.二氧化硫的概念及来源……………………………………………(7)
3.悬浮颗粒的概念及来源………………………………………………(8)
三.数据的来源与描述………………………………………………(8)
1.数据的来源……………………………………………………………(8)
2.数据的描述……………………………………………………………(9)
四.研究方法与软件的介绍…………………………………………(9)
1.研究方法的介绍………………………………………………………(9)
1.1主成分分析的概念…………………………………………………(9)
1.2主成分分析的基本思想及原理……………………………………(9)
1.3主成分分析的主要作用……………………………………………(10)
1.4主成分分析的计算步骤……………………………………………(11)
2.软件的介绍……………………………………………………………(12)
2.1SAS的由来和发展…………………………………………………(12)
2.2SAS在处理数据上的优势…………………………………………(12)
五.数据的处理…………………………………………………………(13)
1.从协方差矩阵出发对所有变量进行主成分分析……………………(13)
2.从相关矩阵出发做主成分分析………………………………………(13)
六.分析与结论…………………………………………………………(17)
参考文献…………………………………………………………………(21)致谢………………………………………………………………………(21)
附件………………………………………………………………………(22)
基于主成分分析的世界主要城市空气污染的研究
一、绪论
1.空气污染的概念及危害
1.1空气污染概念
空气污染即空气中含有一种或多种污染物,其存在的量、性质及时间会伤害到人类、植物及动物的生命,损害财物、或干扰舒适的生活环境,如臭味的存在。
换言之,只要是某一种物质其存在的量,性质及时间足够对人类或其他生物、财物产生影响者,我们就可以称其为空气污染物;而其存在造成之现象,就是空气污染。
换言之,某些物质在空气中不正常的增量就产生空气污染的情形。
大气是由一定比例的氮气、氧气、二氧化碳、水蒸气和固体杂质微粒组成的混合物。
就干燥空气而言,按体积计算,在标准状态下,氮气占78.08%,氧气占20.94%,稀有气体占0.93%,二氧化碳占0.03%,而其他气体及杂质体积都大约是0.02%。
各种自然变化往往会引起大气成分的变化。
例如,火山喷发时有大量的粉尘和二氧化碳等气体喷射到大气中,造成火山喷发地区烟雾弥漫,毒气熏人;雷电等自然原因引起的森林大面积火灾也会增加二氧化碳和烟粒的含量等等。
一般来说,这种自然变化是局部的,短时间的。
随着现代工业和交通运输的发展,向大气中持续排放的物质数量越来越多,种类越来越复杂,引起大气成分发生急剧的变化。
当大气正常成分之外的物质达到对人类健康、动植物生长以及气象气候产生危害的时候,我们就说大气受了污染。
按照国际标准化组织(ISO)的定义,“空气污染(大气污染)通常系指由于人类活动或自然过程引起某些物质进入大气中,呈现出足够的浓度,达到足够的时间,并因此危害了人体的舒适、健康和福利或环境的现象”。
1.2空气污染的危害
大气污染的危害主要有以下几个方面
(1)危害人体
人需要呼吸空气以维持生命。
一个成年人每天呼吸大约2万多次,吸入空气达15~20立方米。
因此,被污染了的空气对人体健康有直接的影响。
大气污染物对人体的危害是多方面的,主要表现是呼吸道疾病与生理机能障碍,以及眼鼻等粘膜组织受到刺激而患病。
比如,1952年12月5~8日英国伦敦发生的煤烟雾事件死亡4000人。
人们把这个灾难的烟雾称为"杀人的烟雾"。
据分析,这是因为那几天伦敦无风有雾,工厂烟囱和居民取暖排出的废气烟尘弥漫在伦敦市区经久不散,烟尘最高浓度达4.46毫克/米3,二氧化硫的日平均浓度竟达到3.83毫升/米3。
二氧化硫经过某种化学反应,生成硫酸液沫附着在烟尘上或凝聚在雾滴上,随呼吸进入器官,使人发病或加速慢性病患者的死亡。
这也就是所谓的光化学污染。
由上例可知,大气中污染物的浓度很高时,会造成急性污染中毒,或使病状恶化,甚至在几天内夺去几千人的生命。
其实,即使大气中污染物浓度不高,但人体成年累月呼吸这种污染了的空气,也会引起慢性支气管炎、支气管哮喘、肺气肿及肺癌等疾病。
(2)对植物的危害
大气污染物,尤其是二氧化硫、氟化物等对植物的危害是十分严重的。
当污染物浓度很高时,会对植物产生急性危害,使植物叶表面产生伤斑,或者直接使叶枯萎脱落;当污染物浓度不高时,会对植物产生慢性危害,使植物叶片褪绿,或者表面上看不见什么危害症状,但植物的生理机能已受到了影响,造成植物产量下降,品质变坏。
(3)影响气候
大气污染物对天气和气候的影响是十分显著的,可以从以下几个方面加以说明:
①减少到达地面的太阳辐射量:
从工厂、发电站、汽车、家庭取暖设备向大气中排放的大量烟尘微粒,使空气变得非常浑浊,遮挡了阳光,使得到达地面的太阳辐射量减少。
据观测统计,在大工业城市烟雾不散的日子里,太阳光直接照射到地面的量比没有烟雾的日子减少近40%。
大气污染严重的城市,天天如此,就会导致人和动植物因缺乏阳光而生长发育不好。
②增加大气降水量:
从大工业城市排出来的微粒,其中有很多具有水气凝结核的作用。
因此,当大气中有其他一些降水条件与之配合的时候,就会出现降水天气。
在大工业城市的下风地区,降水量更多。
③下酸雨:
有时候,从天空落下的雨水中含有硫酸。
这种酸雨是大气中的污染物二氧化硫经过氧化形成硫酸,随自然界的降水下落形成的。
硫酸雨能使大片森林和农作物毁坏,能使纸品、纺织品、皮革制品等腐蚀破碎,能使金属的防锈涂料变质而降低保护作用,还会腐蚀、污染建筑物。
(4)增高大气温度
在大工业城市上空,由于有大量废热排放到空中,因此,近地面空气的温度比四周郊区要高一些。
这种现象在气象学中称做“热岛效应”。
(5)对全球气候的影响
近年来,人们逐渐注意到大气污染对全球气候变化的影响问题。
经过研究,人们认为在有可能引起气候变化的各种大气污染物质中,二氧化碳具有重大的作用。
从地球上无数烟囱和其他种种废气管道排放到大气中的大量二氧化碳,约有50%留在大气里。
二氧化碳能吸收来自地面的长波辐射,使近地面层空气温度增高,这叫做“温室效应”。
经粗略估算,如果大气中二氧化碳含量增加25%,近地面气温可以增加0.5~2℃。
如果增加100%,近地面温度可以增高1.5~6℃。
有的专家认为,如果大气中的二氧化碳含量照现在的速度增加下去,若干年后会使得南北极的冰熔化,导致全球的气候异常。
2.研究背景与意义
首要的问题是全球气候变暖。
近百年来全球地面温度平均增加了0.3~0.6℃。
20世纪80年代成为20世纪最热的10a,1988年全球平均气温比1949—1979年的平均值高0.34℃,比20世纪初高了0.59℃。
据政府间气候委员会(IPCC)对全球气候变化判断,21世纪全球气温每10a将上升0.3℃,到2050年,全球气温将上升1℃。
气候的变暖引起了海平面的上升。
当前,世界大洋温度正以每年0.1℃的速度上升,全球海平面在过去的百年里平均上升了14.4cm,中国沿海的海平面也平均上升了11.5cm。
目前海平面每年将上升为6mm,到2070年海平面将上升65cm,但不同海域相差较大。
由温室效应所产生海平面上升的速度逐年在增加,海平面的升高将严重威胁低地势岛屿和沿海地区人民的生产、生活和财产。
全球气候变暖后,世界粮食生产及其分布状况会发生变化。
加拿大北部和西伯利亚的永久性冻土带将消失,使那里有可能成为世界的大粮仓;而现在的粮食产地则由于土壤湿度的降低而可能失去。
同时气温升高使作物生长季节变暖和延长,从而使许多害虫的危害加剧。
根据现有技术情况和粮食品种,若全球气温升高2℃,而降雨量不变的话,则粮食产量可能下降3%~17%。
气候变暖使农业结构发生变化,进而使许多农产品的状况和贸易模式也发生相应变化。
温室效应引起全球气候变暖对人类环境影响还会表现在许多方面。
其次是臭氧层较少。
自1958年对臭氧层进行观察以来,发现高空臭氧层有减少的趋势。
20世纪70年代后,减少加剧,全球臭氧都呈减少趋势,冬季减少率大于夏季。
1985年英国科学家首次发现南极上空在9~10月平均臭氧含量减少50%左右,并出现了巨大的臭氧空洞。
此后观测到全球性平流层臭氧浓度下降;南纬39~60°,减少5%~10%,近赤道地区减少1.6%~2.1%,北纬40~64°减少1.2%~1.4%,并观测到中国华南地区减少3.1%,华东、华北减少1.7%,东北地区减少3%。
中国设在昆明、北京的臭氧观测站,在1980—1987年间也观测到昆明上空臭氧平均含量减少1.5%,北京减少5%。
总之,从20世纪70年代以来,全球臭氧层的损耗已是客观存在的事实。
治理空气污染已经到了刻不容缓的时刻,得出一个主成分
,使其保留所有污染指标的主要信息,成为衡量城市污染状况的唯一指标,以便方便地获得一个城市的空气污染状况,采取相应的措施治理该城市的环境污染,保护人们的身体健康。
二.空气污染因子的概述
1.二氧化碳的概念及来源
二氧化碳是一种在常温下无色无味无臭的气体。
化学式为
,式量44.01,碳氧化物之一,俗名碳酸气,也称碳酸酐或碳酐。
常温下是一种无色无味气体,密度比空气略大,微溶于水,并生成碳酸。
固态二氧化碳俗称干冰,升华时可吸收大量热,因而用作制冷剂,如人工降雨,也常在舞美中用于制造烟雾。
所有含碳元素的物质燃烧都会产生二氧化碳;动植呼吸也会产生二氧化碳;各类食质的缓慢氧化能产生二氧化碳;自然界中二氧化碳矿物的开采可获得二氧化碳。
2.二氧化硫的概念及来源
二氧化硫又称亚硫酸酐,是最常见的硫氧化物,为硫酸原料气的主要成分,是大气主要污染物之一。
无色气体,有强烈刺激性气味。
火山爆发时会喷出该气体,在许多工业过程中也会产生二氧化硫。
由于煤和石油通常都含有硫化合物,因此燃烧时会生成二氧化硫。
当二氧化硫溶于水中,会形成亚硫酸(酸雨的主要成分)。
若把二氧化硫进一步氧化,通常在催化剂如二氧化氮的存在下,便会生成硫酸。
3.悬浮颗粒的概念及来源
悬浮颗粒物是悬浮于大气中的固体、液体颗粒状物质的总称。
大气悬浮颗粒物的形状、密度、粒径大小,光、电、磁学等物理性质及化学组成,随其形成和来源的不同有很大差异,可分为一次颗粒物和二次颗粒物。
实际大气中的悬浮颗粒物往往是有许多不同化学组成、不同粒径的颗粒聚集在一起的混合体。
所以它没有恒定的化学计量的组成。
在城市大气悬浮颗粒物中发现有几十种金属、非金属元素和几百种有机化合物。
从悬浮颗粒物的来源,可分为天然来源,如土壤尘、火山灰雾、海洋浪沫,一般为粗颗粒(粒径大约1~500
);人为来源,如工业排放的粉尘、化石燃料燃烧的烟尘、汽车排气中的颗粒物以及农药喷雾、喷气式飞机的排放物等,颗粒的粒径较小,一般直径小于2
。
大气中颗粒物的粒径范围很宽,从0.001
到1000
以上。
三.数据的来源与描述
1.数据的来源
分析数据来源于中国国家统计局发行的《中国统计年鉴》中的统计数据(
《中国统计年鉴》参考世界银行发行的《世界发展指标》(WID),收集整理了世界主要城市空气污染状况统计表。
《世界发展指标》是世界银行最重要的发展指标汇编,数据来自得到正式认可的国际来源。
它提供现有的最新最准确的全球发展数据,包括国家、地区和全球数据的估计值。
包含健康、气候变化、公共部门、环境、社会发展、科学技术、城市发展能源与矿产等18个专题数据。
(
2.数据的描述
用于分析的数据集为《中国统计年鉴》中世界主要城市空气污染状况的统计数据(见附件3),包含2005-2011年世界各主要城市每年空气污染因子中最主要的三类因子进行了统计,分别是总悬浮颗粒物(微克/立方米)、二氧化碳(微克/立方米)、二氧化硫(微克/立方米)。
四.研究方法和软件的介绍
1.研究方法的介绍
1.1主成分分析的概念
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。
在统计学中,主成分分析(principalcomponentsanalysis,PCA)是一种简化数据集的技术。
它是一个线性变换。
这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。
主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。
这是通过保留低阶主成分,忽略高阶主成分做到的。
这样低阶成分往往能够保留住数据的最重要方面。
但是,这也不是一定的,要视具体应用而定。
1.2主成分分析的基本思想及原理
在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。
这些涉及的因素一般称为指标,在多元统计分析中也称为变量。
因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。
在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。
主成分分析正是适应这一要求产生的,是解决这类题的理想工具。
同样,在科普效果评估的过程中也存在着这样的问题。
科普效果是很难具体量化的。
在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。
如上所述,主成分分析法正是解决这一问题的理想工具。
因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。
根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。
这样,综合指标不仅保留了原始变量的主要信息,且彼此间不相关,又比原始变量具有某些更优越的性质,就使我们在研究复杂的科普效果评估问题时,容易抓住主要矛盾。
上述想法可进一步概述为:
设某科普效果评估要素涉及个指标,这指标构成的维随机向量为。
对作正交变换,令其中为正交阵的各分量是不相关的,使得的各分量在某个评估要素中的作用容易解释,这就使得我们有可能从主分量中选择主要成分,削除对这一要素影响微弱的部分,通过对主分量的重点分析,达到对原始变量进行分析的目的。
各分量是原始变量线性组合,不同的分量表示原始变量之间不同的影响关系。
由于这些基本关系很可能与特定的作用过程相联系,主成分分析使我们能从错综复杂的科普评估要素的众多指标中,找出一些主要成分,以便有效地利用大量统计数据,进行科普效果评估分析,使我们在研究科普效果评估问题中,可能得到深层次的一些启发,把科普效果评估研究引向深入。
主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。
1.3主成分分析的主要作用
主成分分析主要由以下几个方面的作用。
(1)主成分分析能降低所研究的数据空间的维数。
即用研究
维的
空间代替
维的
空间(
<
),而低维的
空间代替高维的
空间所损失的信息很少。
即:
使只有一个主成分
(即
=1)时,这个
仍是使用全部
变量(
个)得到的。
例如要计算
的均值也得使用全部
的均值。
在所选的前
个主成分中,如果某个
的系数全部近似于零的话,就可以把这个
删除,这也是一种删除多余变量的方法。
(2)有时可通过因子负荷
的结论,弄清
变量间的某些关系。
(3)多维数据的一种图形表示方法。
我们知道当维数大于3时便不能画出几何图形,多元统计研究的问题大都多于3个变量。
要把研究的问题用图形表示出来是不可能的。
然而,经过主成分分析后,我们可以选取前两个主成分或其中某两个主成分,根据主成分的得分,画出n个样品在二维平面上的分布况,由图形可直观地看出各样品在主分量中的地位,进而还可以对样本进行分类处理,可以由图形发现远离大多数样本点的离群点。
(4)由主成分分析法构造回归模型。
即把各主成分作为新自变量代替原来自变量
做回归分析。
(5)用主成分分析筛选回归变量。
回归变量的选择有着重的实际意义,为了使模型本身易于做结构分析、控制和预报,好从原始变量所构成的子集合中选择最佳变量,构成最佳变量集合。
用主成分分析筛选变量,可以用较少的计算量来选择量,获得选择最佳变量子集合的效果。
1.4主成分分析的计算步骤
(1)原始指标数据的标准化采集
维随机向量
n个样品
,
1,2,…,n,
构造样本阵,对样本阵元进行如下标准化变换:
,
其中
,得标准化阵
。
(2)对标准化阵
求相关系数矩阵
其中,
。
(3)解样本相关矩阵R的特征方程
得
个特征根,确定主成分,按
确定
值,使信息的利用率达85%以上,对每个
,
,解方程组
得单位特征向量
。
(4)将标准化后的指标变量转换为主成分
称为第一主成分,
称为第二主成分,…,
称为第
主成分。
(5)对
个主成分进行综合评价
对
个主成分进行加权求和,即得最