1、数学与信息科学学院 系别:数学系 专 业:信息与计算科学 年 级:2008级本科2班 学 号:08040342039完成日期2012年4月28日廊坊师范学院本科生毕业论文论文题目:论文摘要:随着科学技术的发展和人们生活水平的提高,空气污染问题已经成为当今世界各国普遍关注的问题之一.对空气污染的防治和检测成为了各主要城市的重要任务. spss的描述性分析、非参数检验、时间序列分析等分析方法为空气污染的分析提供了有效的工具.本文对河北省11个市级城市在2011年1-9月份的空气污染指数利用SPSS软件进行描述性统计分析、非参数检验,指数平滑分析,先是对全省各主要城市的空气质量进行横向比较,分析我省
2、当前空气质量的总体情况和地区差异,然后对代表性城市空气污染情况进行分析和预测,为国家环境政策的制定提供科学合理的依据.关键词:城市空气质量;描述性分析;非参数检验;时间序列分析;SPSSTitle: Analysis Of Air Quality In Major Cities In Hebei ProvinceAbstract: With the development of science and technology and peoples living standards improve, the problem of air pollution has become one of t
3、he common concern issues in the world. Prevention and detection of air pollution has become the important task of all the major cities.The descriptive analysis,non-parametric tests, time series analysis and other analytical methods in SPSS provide an effective tool for the analysis of air pollution.
4、In this article we made processing on Air Pollution Index (API) of 11 prefecture-level citys in Hebei Province in January-September 2011 with descriptive analysis, non-parametric tests and exponential smoothing analysis in SPSS. First,made horizontal comparison on air quality of the provinces major
5、cities to analyze the overall situation of the provinces air quality and regional differences,and then analysis and forecast the air pollution situation of the representative city and provide scientific and rational basis for the formulation of national environmental policy.Keywords:Urban Air Qualit
6、y;Descriptive analysis;Non-parametric tests;Time series analysis;目 录引言 11.几种分析方法的介绍 21.1描述性统计分析 21.2非参数检验 31.3时间序列分析法 42. 几种分析方法实现的基本步骤与逻辑框图 52.1描述性分析的步骤 52.2描述性分析的逻辑图 62.3时间序列分析的步骤 62.4时间序列分析的逻辑图 63. 河北省各主要城市空气质量分析在SPSS上的应用及图表分析 73.1模型构成及数据来源 73.2 spss实现 74.结论 155.建议 166.结束语 16参考文献 17随着社会经济的发展,城市工业
7、化水平的提高,在我们的日常生活环境中,尤其是在集中了大量的工厂、车辆、人口的城市地区,空气污染问题1已经成为一个日益严重的社会和科学问题,是当前世界各国普遍关注的问题之一,是21世纪人类面临的重大挑战.空气质量因为车辆、船舶、飞机的尾气、工业企业生产排放、居民生活和取暖、垃圾焚烧等原因逐渐开始恶化,温室效应,大气污染,臭氧空洞,酸雨蔓延,气候现象变化异常等现象越来越严重.空气污染威胁着人类的日常生活,危害人体健康,给人们的工作带来不便,影响并危害各种生物的生存,直接或间接地损害设备、建筑物.这不仅给经济发展和人民生活带来损失,更严重的是危害人们身体健康,并贻害子孙后代,破坏了人类赖以健康持久地
8、生存的基本条件2.为此,我们迫切需要找出一种能够有效的衡量空气质量并且以此为依据制定并实施有效对策的方法来缓解并逐渐消除当今时代的空气污染问题.而数学中的描述性分析、非参数检验、时间序列分析等分析方法为空气污染的分析和检测研究提供了有效的工具,上述分析方法我们可以借助计算机SPSS软件来得以实现3.1997年国务院决定对重点城市进行空气质量周报,空气质量周报包括对几种主要污染物的检测状况和结果,以空气污染指数的形式报告.空气污染指数4反映了一个城市的污染情况和污染的变动规律,对环保工作的开展具有重要的指导意义.本文以河北省各市级城市为研究对象,通过分析在一定时间内各城市空气质量的各项特性来掌握
9、各城市空气质量的情况,以此研究结果为有力依据为今后的改善治理工作奠定坚实的科学基础.空气污染指数(AirpollutionIndex,简称API)是评估空气质量状况的一组数字,它能告诉您今天或明天您呼吸的空气是清洁的还是受到污染的,以及您应当注意的健康问题.空气污染指数关注的是吸入受到污染的空气以后几小时或几天内人体健康可能受到的影响5.空气污染指数划分为050、51100、101150、151200、201250、251300和大于300七档,对应于空气质量的七个级别,指数越大,级别越高,说明污染越严重,对人体健康的影响也越明显. 空气污染指数为050,空气质量级别为I级,空气质量状况属于优
10、.此时不存在空气污染问题,对公众的健康没有任何危害. 空气污染指数为51100,空气质量级别为II级,空气质量状况属于良.此时空气质量被认为是可以接受的,除极少数对某种污染物特别敏感的人以外,对公众健康没有危害. 空气污染指数为101150,空气质量级别为III(1)级,空气质量状况属于轻微污染.此时,对污染物比较敏感的人群,例如儿童和老年人、呼吸道疾病或心脏病患者,以及喜爱户外活动的人,他们的健康状况会受到影响,但对健康人群基本没有影响. 空气污染指数为151200,空气质量级别为III(2)级,空气质量状况属于轻度污染.此时,几乎每个人的健康都会受到影响,对敏感人群的不利影响尤为明显. 空
11、气污染指数为201300,空气质量级别为IV(1)级和IV(2)级,空气质量状况属于中度和中度重污染.此时,每个人的健康都会受到比较严重的影响. 空气污染指数大于300,空气质量级别为V级,空气质量状况属于重度污染.此时,所有人的健康都会受到严重影响. 分析思路首先利用SPSS软件6中的描述性统计分析的方法7对各主要城市空气质量进行横向比较,然后利用非参数检验检验个城市空气污染在年内的分布状况是否具有一致性,判断在全省范围内是否存在影响空气质量的共同因素,随后利用时间序列分析中的指数平滑分析方法对其代表性城市的空气污染状况进行分析并预测未来空气质量的变化趋势.1. 几种分析方法的介绍1.1 描
12、述性统计分析 描述性分析过程主要用于对连续变量做基础性描述8,主要用于描述变量的基本特征.spss中的描述性分析过程可以生成相关的描述性统计,如:均值、方差、标准差、峰度、偏度等,可以输入多种类型的统计量,描述性分析过程还可将原始数据转换为z分值并作为变量储存,通过这些描述性计量,我们可以对变量变化的综合特征进行全面了解.1.1.1 描述性统计分析的几种常用统计量类型1.1.1.1 均值均值最常用的是算术平均数,算术平均数是集中趋势最常用、最重要的测度值.他是将总体标志总量除以总体单位总量而得到的均值9.算数平均数的基本公式是:算数平均数=总体标志总量/总体单位总量 (1) 1.1.1.2 方
13、差与标准差方差是总体各单位变量值与其算数平均数的离差平方的算数平均数,方差的平方根就是标准差,与方差不同的是,标准差是具有量纲的,与变量值的计量单位相同,其实际意义要比方差清楚.因此对社会现象进行分析时,往往更注重使用标准差.方差和标准差的计算有两种形式,简单平均式和加权平均式.在未分组资料情况下,采用简单平均式 (2) 在资料分组情况下,采用加权平均式 (3) 1.1.1.3 峰度峰度是频数分布曲线与正态分布相比较,顶端的尖峭程度.统计上常用四阶中心矩测定峰度,计算公式如下: (4) 当a4=3时,分布曲线为正态分布;当a43时,分布曲线为尖峰分布.1.1.1.4 偏度 偏度是对分布偏斜方向
14、及程度的测试.测量偏斜的程度需要计算偏态系数.这里只介绍中心矩偏态测度法.常用三阶中心矩除以标准差的三次方,表示数据分布的相对偏斜程度,计算方法如下: (5) a3为正,表示分布右偏;为负,表示左偏.1.1.1.5 其他相关统计量最大值,顾名思义,最大值即样本数据中取最大的数据.最小值,即样本数据中取值最小的数据.Z标准化值,Z标准化得分是某一数据与平均数的距离以标准差为单位的测量值10.其计算公式如下: (6) Zi即为Xi的Z标准得分.Z的标准化数据越大,说明它离平均数越远.标准化值不仅能表明各原始数据在一组数据分布中的相对位置,而且能在不同分布的各组原始数据间进行比较,同时还能接受代数方
15、法的处理.因此标准化值在统计分析中起着重要的作用.1.2 非参数检验非参数检验11是统计分析方法的重要组成部分,又称分布自由检验,是相对于参数检验而言的12,参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法.但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了.非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法13.由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验.非参数检验在统计分析和实际工作中具有广泛的应用.非参数检验是不需要对总体进行严格限定的统计推断法,这类检验方法的假设前提比参数检验要少得多并且容易满足.1.2.1 多独立样本的非参数检验由于本文研究的数据量较多,适合使用多独立样本的非参数检验进行数据分析,所以本文主要介绍一下多样本的非参数检验.多独立样本的非参数检验是通过分析多组独立样本数据,推断样本来自的多个总体的中位数或分布
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1