ImageVerifierCode 换一换
格式:DOCX , 页数:17 ,大小:68.95KB ,
资源ID:25585561      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/25585561.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(ECWMF和T639在基于LSSVM的兰州市空气质量预报ResearchGate.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

ECWMF和T639在基于LSSVM的兰州市空气质量预报ResearchGate.docx

1、ECWMF和T639在基于LSSVM的兰州市空气质量预报ResearchGateECMWF和T639数值预报产品在兰州市空气质量预报应用中的对比研究李昊,尚可政1,王式功1,2,石彦军3 ,杨旭1(1.兰州大学大气科学学院/甘肃省干旱气候变化与减灾重点实验室,兰州 730000;2. 成都信息工程大学大气科学学院/环境气象与健康研究院,成都610225;3.兰州大学信息科学与工程学院,兰州 730000)摘要:针对兰州市空气质量预报系统研发的实际需求,本文利用2013-2015年兰州市空气污染逐日监测资料,首先分析了在此期间兰州市六种主要空气污染物PM10、PM2.5、NO2、SO2、CO和O

2、3的污染特征;然后以2014年 欧洲中期天气预报中心(ECMWF)资料与T639资料的气象要素预报产品,结合同期污染物质量浓度监测数据,分别建立了基于最小二乘法支持向量机(LS-SVM)的兰州市6种主要空气污染物未来2d的日均质量浓度预报模型;进而将ECMWF和T639中2015年2月1日到10月31日的气象要素与污染监测数据分别输入各自模型进行预报检验。结果表明,以ECMWF建立的预报模型对未来2d的PM10、PM2.5、NO2、SO2和CO的日均质量浓度的预报效果好于T639,而T639对预报O3有一定优势。用ECMWF建立的预报模型对未来24h的空气质量指数等级和首要污染物的预报成功率为

3、86.14%,48h的为82.33%;T639对应的未来24h预报成功率 83.52%,48h的为74.43%。总之,两种数值产品均可应用于基于LS-SVM的空气质量预报,使用ECMWF的预报效果整体上更好。关键词:空气质量预报;LS-SVM;兰州市;T639L60预报产品;ECMWF预报产品中图分类号:X823引言兰州市是我国建国后首批重点建设的工业城市之一,兰州西固区又是我国最早建成的一个重要石油化工基地,工业污染源、生活污染源、交通污染源等综合排放量大;加之兰州市区处于河谷盆地,地形复杂,大气边界层逆温强、层结稳定,静风频率高,边界层大气扩散条件差1,因此,一直是我国大气污染最严重的城市

4、之一,倍受关注。空气污染预报作为预防城市空气污染的重要措施之一,受到国内外诸多学者的重视。尚可政等2研究了兰州冬季空气污染与地面气象要素的关系;何建军等3利用WRF(Weather Research and Forecasting)模式研究了风速、稳定能量、Froude数、边界层高度、位温递减率、输送指数和梯度理查森数与兰州大气污染物质量浓度的关系;马敏劲等4分析了2001-2011年兰州大气污染物质量浓度的季节特征与边界层结构对兰州严重污染事件的影响;杨民等5-6将潜势预报方法结合统计预报与数值预报,以箱模式为基础初步研究了兰州市的空气质量业务系统,在前期的业务中得到了应用,取得了一定的成效

5、。然而,针对兰州市空气质量的预报方法主要为统计预报和空气质量模式。传统统计预报受限于各种线性回归和非线性回归方法的局限,对空气质量预报的效果有限;而空气质量模式虽然在预报效果和预报的时空分辨率等几个方面上有很大的提升,但是其运行维护成本大,配套设施要求高,不利于普及。基于人工神经网络算法的统计预报方法通过输入各类气象要素和其它相关数据,利用其对非线性数据较好的逼近能力直接输出大气污染物质量浓度,能较好地对特定城市群或区域的空气质量进行预测,是对空气质量模式的重要补充。此方面已往的研究主要局限于各类人工神经网络等机器学习算法对于兰州市空气质量的应用,而使用不同气象资料对前者在预报效果的影响却尚未

6、见公开报道。中国气象局国家气象中心的TL639L60全球集合预报产品(下称T639)和欧洲中期天气预报中心业务用细网格资料(下称ECMWF)是我国科研和业务单位较常用的二种全球中期数值预报产品。本文从数值预报产品释用和先进的统计预报方法相结合的角度,利用了二者2014年1月至2015年10月间发布的未来0-52小时业务产品,结合同期兰州市六种污染物质量浓度资料,分别建立了基于最小二乘法支持向量机(LS-SVM)方法的兰州市6种主要空气污染物未来两天日平均质量浓度预报模型,对比研究了二者对于兰州市空气质量预报结果的影响程度,可为兰州市空气污染预报预警系统的改进与提高提供科学依据。1. 资料来源与

7、方法1.1资料来源本文空气污染资料由兰州市环保局环境检测中心提供,原始资料为兰州四个不同区域的6种主要空气污染物自动监测站采样日均数据,依据环境空气质量标准(GB3095-2012)7中城市日平均污染质量浓度的评价标准处理方法,得到兰州市二氧化硫(SO2)、二氧化氮(NO2)、可吸入颗粒物(PM10)、细颗粒物(PM2.5)和一氧化碳(CO)的日平均质量浓度,以及臭氧8和滑动平均的日平均质量浓度(下称O3)。资料序列长度为2013年1月1日至2015年10月31日,其中个别采样数据因缺失或有效性不足而弃用。气象资料分别为T639与ECMWF。其中T639资料分辨率为0.281250.28125

8、,预报要素包括常规地面要素,750和800hPa温度以及800hPa垂直速度;ECMWF资料分辨率为0.250.25,预报要素包括常规地面要素,700和800hPa的温度以及800hPa垂直速度。两种气象资料均为每日20时发布,本文选取的预报区间为0-52h,间隔为3h,资料总长度为2014年1月1日至2014年12月31日、2015年2月1日至2015年10月31日。考虑到预报模型输入量个数过多而造成预报模型泛化能力和稳定性严重下降的风险8,截取T639与ECMWF网格在兰州市四周距离最近的4个格点,并使用反距离权重插值法9-10将各格点气象要素插值到兰州市中心(103.82E,36.07N

9、)所在位置;最后将T639和ECMWF的未来0-54h产品各气象要素处理成未来24h和未来48h日均值。1.2 研究方法本文采用了基于最小二乘法的支持向量机(Least Square Support Vector Machine)作为建立预报模型的架构。LS-SVM是Suykens等11提出的基于对Vapnik12的支持向量机算法(Support Vector Machine, SVM)的改进算法,后者是以统计学习理论为基础建立的监督式学习算法。诸多研究证明,SVM能够出色满足对非线性系统的拟合,并被广泛应用于预报各类与环境有关的问题13-16。LS-SVM与SVM最大的区别在于结构风险计算中

10、损失函数的选择,前者为预测误差,后者为预测误差的二范数。LS-SVM与SVM相比具有计算效率高,对非线性函数估计的泛化性高的优点17。LS-SVM虽然不是严格意义上的人工神经网络方法,但二者都属于机器学习算法,且使用它们解决非线性回归问题时在流程和结构等方面上有诸多相通之处。已有研究对LS-SVM和SVM的原理做出过详细的说明,故本文不再赘述11-17。2. 兰州市2013-2015年空气污染特征分析 2013至2014年兰州全年日平均空气质量指数(AirQualityIndex, AQI指数)分别为111和94,2015年1月至10月 平均AQI指数为86,相比2013和2014年同期的10

11、7及91有所降低。其中2013年兰州发生了自3月9日至12日AQI连续达到500的严重污染事件,而2014年仅在4月24日出现1次AQI达到500的情况,2015年1月1日至10月31日间没有发生AQI达500的严重污染事件。这4例严重污染事件均由上游沙尘输送造成,尤其在2014年4月24日的沙尘天气过程中,PM10小时最高质量浓度超过1300g/m3。从图1可以看出,兰州市空气污染存在明显的季节特征:即AQI高峰出现在3、4月以及11月或12月, 2月和9月则为极小值。除春季外,2014和2015年各月平均AQI指数大部分低于2013年同期。 2014年4、5月AQI指数均高于2013年同期

12、和2014年3月,可能是当年兰州市春季沙尘过程影响的结果18。综合来看,2014年和2015年兰州空气质量相比2013年有较大改善;而2015年又比2014年有略微提高,但在夏季出现了反弹。图1 兰州市2013-2015年AQI月均值Fig.1 Monthly averaged AQI of Lanzhou from 2013 to 2015从空气质量等级来看,2013年和2014年全年空气质量等级为优和良的总天数分别为193和260d,占全年的52.88%和71.25%;2015年1月至10月的空气质量等级为优和良的天数为228d。同样可以说明兰州市2014和2015年的空气质量比2013年

13、有明显改善。兰州市2013年至2015年10月间的每日首要污染物明显的年际差异,其中2013年(365d)各首要污染物按累计出现频数依次为PM10 (264d) 、PM2.5 (89d) 、O3 (3d)和NO2 (2d);2014年(365d)依次为PM10 (216d) 、PM2.5 (111d) 、NO2 (21d) 和O3 (2d);2015年1月至10月期间(304d)依次为PM10 (201d) 、O3 (39d) 、PM2.5 (31d) 、NO2 (24d)和CO(1d)。2013年比重最大的PM10(72.33%)和PM2.5(24.38%)共占2013年总样本数的96.71

14、%;2014年PM10的比例下降到59.18%,但PM2.5的比例增加为30.41%,二者共占2014年总样本数天数的89.59%,同时NO2作为首要污染物的天数明显增加;2015年1月至10月间,O3作为首要污染物的天数大幅度增加,相比2014年增加了37d之多,而PM2.5的天数相比2013、2014年同期55d和76d显著减少,仅为31d。总体而言,PM10和PM2.5依然是兰州最主要的污染物,但占比逐年下降;NO2和O3有增加的趋势。特别是O3,其在2015年1月到10月间作为首要污染物时主要集中在夏季,是造成2015年夏季污染的主要原因之一。因此,对PM10、PM2.5、NO2和O3

15、这4种污染物质量浓度的预报效果将作为本文评价模型预报的重要依据。3. 预报模型的建立本文的目的是对比研究T639和ECMWF对空气质量预报的影响。为了尽量避免其它因素的干扰,本文在建立模型以及进行预报检验时对两种预报产品采用同一方法和流程,确保了不同模型之间的预报效果的差异只来自T639和ECMWF本身。为了建立合适的预报模型,选取与污染物有统计关系或参与其扩散等物理过程有关的气象要素至关重要19。已有的研究均表明20,地面常规气象要素,如温度、气压、风速、相对湿度、降水量等与兰州市主要空气污染物有显著的统计关系,是建立预报模型的重要输入参量。此外,传统空气质量神经网络预报模型中,模式的高空气

16、象资料一般不被采用。一是其获取难度较地面要素较大;二是以其计算各大气扩散参数,如通风系数、最大混合层厚度等需要相关的气象要素众多,业务上难以应用。相关研究表明,兰州市大气污染物的扩散受到高度可达1000m的稳定边界层影响21。兰州市中心海拔1520m,故本文引入800hPa、700hPa的温度差和800hPa垂直速度,前者包含了部分温度梯度的信息,后者是污染物垂直扩散的重要因素22。为了避免预报模型由于气象要素之间的存在多重共线性而产生的不必要的缺陷,本文对所有与气象要素有关的输入量进行了方差膨胀因子检验(variance inflation factor,简称VIF)。结果表明,所有与气象要

17、素有关的输入量的容忍度均不低于0.1,VIF值不高于10。这足以证明输入量之间不存在多重共线性24。将两种资料的气象要素作为模型输入量,不会明显降低预报模型的稳定性和预报效果。为了体现季节变化和周内变化,本文引入与日期有关的两个参数作为输入量。一个是将一年365d从1-365排序,任意一天对应的序数作为弧度,然后将其余弦作为一个输入量(Day of Year,下称DOY);另一个是将星期一至星期日排序为1-7,任意一天对应的序数作为一个输入量(Day of Week,下称DOW)。已有相关研究表明25,引入上述两种参数能够改进预报效果。所有输入量在输入模型前均进行归一化处理,并在输出时进行反归

18、一化处理。表1为24h模型和48h模型具体输入量、输出量和目标。表1 T639和ECMWF建立的24h和48h预报模型的输入量、输出量和目标Table 1 The inputs, outputs and goals of 24hour and predictive models involved with T639 or ECMWF项目T639ECMWF输入量未来24h/48h海平面气压,2m温度,2m相对湿度,10m经向风速,10m纬向风速,总降水量, 800hPa垂直速度,800hPa与750hPa温度差,DOY,DOW;当日某种污染物的日平均质量浓度观测值未来24h/48h海平面气压,2

19、m温度,2m相对湿度,10m经向风速,10m纬向风速,总降水量, 800hPa垂直速度,800hPa与700hPa温度差,DOY,DOW;当日某种污染物的日平均质量浓度观测值输出量未来24h/48h某种污染物的日平均质量浓度预测值未来24h/48h某种污染物的日平均质量浓度预测值目标未来24h/48h某种污染物的日平均质量浓度实际值未来24h/48h某种污染物的日平均质量浓度实际值决定LS-SVM模型处理非线性回归问题效果好坏的核心要素是核函数类型,正则化参数c和核函数参数。常用的核函数分为线性内核,多项式内核,径向基内核(Radial Basis Function, RBF)以及sigmoi

20、d核。已有研究表明,以RBF内核作为核函数建立的SVM模型在大气污染物质量浓度预测中比其它几种核函数的效果更好25。因此,本文建立的所有预报模型均采用RBF作为核函数。对于正则参数c和核函数参数的取值,目前还没有可靠的理论指导,只能靠经验给定一个范围后使用寻优方法确定。经过大量试验发现,核函数参数和正则化参数c区间分别为1-6和30-150之间时效果最好。为了尽可能使以T639和ECMWF建立的2种预报模型的学习效果最好,同时避免发生过度逆合,本文在建立六种污染物的24h和48h预报模型时进行5折交叉验证样本实验并结合网格搜索寻优方法,将5次实验得到的c和的平均值作为相应污染物预报模型的参数2

21、6。具体过程为,采用均匀分布打乱资料时序的处理方式整理2014年序列长度为324d的气象资料和污染资料等输入量和输出期望,将处理后的总样本集分为5个样本集合(其中4个集合的样本数量为65,1个为64);轮流抽取1个样本集合作为验证样本集合,剩余4个的样本集合作为学习样本集合。每次实验中6种污染物的24h和48预报模型都使用同一个学习样本和验证样本集合建立模型并验证学习效果,不同实验过程的学习样本和验证样本集合不同。表2为五次实验最终建立的24h和48h预报模型的具体参数。最终对每种污染物各自建立了以T639未来24h预报产品、EC美味发未来24h预报产品、T639未来24-48h预报产品和EC

22、MWF未来24到48h预报产品作为输入的气象因子的日均质量浓度预报模型;对于每个污染物,前二个模型的输出量为该污染物的未来24h日平均质量浓度(下称24h模型),后两个模型的输出量为该污染物的未来24到48h日平均质量浓度(下称48h模型)。表2 T639和ECMWF建立的24h和48h预报模型参数Table 2 The model parameters of 24hour and 48hour predictive models involved with T639 or ECMWF项目T639ECMWF24h48h24h48hccccSO21.4376.832.2897.281.6852.

23、451.7459.39NO22.3144.23.1764.731.9728.773.5785.59PM105.73101.35.5142.934.3984.494.8872.35PM2.54.9877.282.76107.622.17139.623.2586.33O30.9196.241.1577.382.3653.351.8967.11CO1.12114.321.3782.913.3960.842.4254.52最后,为了尽可能客观地评价不同模型的对六种污染物质量浓度和AQI指数的预报效果,本文使用了4种统计量,具体评价标准如下:平均绝对误差(Mean Absolute Error, MAE

24、): (1)平均相对误差(Mean Absolute Percent Error, MAPE): (2)均方根误差(Root-Mean-Square Error, RMSE): (3)判定系数(R2): (4)其中为预测值,为观测值,为观测平均值。MAE和MAPE反映了预报偏离观测值的情况,避免了正负抵消的问题;同时,MAPE可以横向比较不同污染物的预报效果。RMSE表示预报误差的离散程度,尤其对预报误差过大的个例更敏感。R2决定了预报值序列与对应观测值序列相关的密切程度,R2越接近1,说明预报模型的拟合优度越大,即预报效果越好。4. 结果分析本文整理了2015年2月1日至10月31日的T63

25、9、ECMWF的气象要素与同期六种污染物数据,排除输入量缺失或污染物观测值缺失的样本,总共得到267d的24h模型输入量与污染物观测值的验证样本集合,48h的验证样本集合为266d。表3为以T639,ECMWF的未来24h日均气象要素建立的24h预报模型对2015年兰州市6种污染物日均质量浓度的预报检验结果。表3 24h模型对2015年2月2日至10月31日兰州市6种污染物日均质量浓度的预报检验结果Table 3 The results of 24h models for daily average forecasting values of 6 pollutants in Lanzhou f

26、rom 2 February 2015 to 31 October 2015项目T639_24hEC_24hMAEMAPE/%RMSER2MAEMAPE/%RMSER2SO26.21722.17.930.7614.91520.16.640.791NO28.30623.69.6990.758.16622.99.3930.758PM1019.98730.529.390.62115.6228.222.1240.656PM2.513.07827.117.860.6479.69525.915.1850.663CO0.31620.50.430.7960.29619.70.4050.814O35.28718

27、.37.7720.8535.95818.77.9070.844结果表明,以T639建立的24h模型(下称T639_24h)在6种主要空气污染物的预测验证中对O3的预报结果最好,平均相对误差只有18.3%,判定系数达到0.853;其次为CO、SO2、NO2和PM2.5,其平均相对误差分别为21、22.1、23.6和27.1%;PM10的预报结果最差,平均相对误差达到30.5%,判定系数仅有0.621。以ECMWF建立的24h模型(下称EC_24h)同样对O3的预报最好,平均相对误差只有18.7%,判定系数为0.853;其次为CO、SO2、NO2和PM2.5,其平均相对误差分别为19.7、20.1

28、、22.9和25.9%;PM10的结果同样最差,平均相对误差最高,达到28.2%;判定系数最低,仅为0.656。对比T639_24h和EC_24h的结果可以发现,前者对于O3的预报效果好于后者,均方根误差更小,说明前者预测值与实际值出现过大误差的次数更少;对于其它5种污染物,EC_24h的预报效果均好于T639_24h,尤其对于PM10,前者的均方根误差比后者减少了7.266,说明后者出现预报误差过大的次数更多。表4 48h模型对2015年2月3日至10月31日兰州市6种污染物日均质量浓度的预报检验结果Table 4 The results of 48h models for daily av

29、erage forecasting values of 6 pollutants in Lanzhou from 3 February 2015 to 31 October 2015项目T639_48hEC_48hMAEMAPE/%RMSER2MAEMAPE/%RMSER2SO27.04825.58.6740.7175.81421.27.4470.775NO210.66727.514.1830.6938.95323.910.6520.743PM1024.57833.438.6850.57317.2831.824.1890.613PM2.514.87429.320.2560.6113.29528

30、.318.7360.641CO0.38721.90.4680.7690.30920.50.4240.797O35.4518.78.3410.8456.09919.28.9810.828从表4可以看出,以T639建立的48和预报模型(下称T639_48h)对于O3的预报结果依然较好,其平均相对误差在6种污染物结果中最小,只有18.3%,决定系数为0.845;其次为CO(21.9%)、SO2(25.5%)、NO2(27.5%)和PM2.5(29.3%);PM10的平均相对误差增大到33.4%,决定系数降到0.573,均方跟误差高达38.685,说明预报效果欠佳。除O3以外,以ECMWF建立的48和

31、模型(下称EC_48h)整体预报效果相比T639_48h较好,EC_48h的结果中PM10的均方根误差相对于T639_48h中出现的均方根误差激增现象,并没有大幅度增加,只有 24.189。根据国标中的空气质量指数及首要污染物确定方法27,用上述4个预报模型(EC_24h、T639_24h、EC_48h和T639_48h)中6种污染物质量浓度预测值计算空气质量分指数,从而得出它们对未来2d的空气质量日均指数的预报值,最终得出空气质量指数级别和首要污染物的预测结果。在实际预报工作中,空气质量指数级别和首要污染物均被正确预报时,可认为该次预报是成功的。表5为4个预报模型对空气质量级别和首要污染物均成功预报的天数的统计结果。从表5的结果可知,EC_24h对

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1