基于ArcGIS的气温空间插值方法.docx
《基于ArcGIS的气温空间插值方法.docx》由会员分享,可在线阅读,更多相关《基于ArcGIS的气温空间插值方法.docx(18页珍藏版)》请在冰豆网上搜索。
基于ArcGIS的气温空间插值方法
气温空间插值方法
随着空间气温信息需求的日益增加,气温的空间插值已被广泛应用而不同的插值方法因不同的地区和研究目的产生不同的效果。
作为生态、资源环境等相关学科基础数据源,气候信息在区域和全球尺度生态系统变化的模拟、生态系统管理、自然资源区划和管理中发挥着重要作用。
然而由于气象站点定位观测获取的只是局部有限的空间点数据,要想得到区域尺度的有关参数,只能利用以点代面或者空间内插和外推方法得到气象要素的空间分布数据。
将从气象站点获取的有限的、局部的、离散的空间点数据,利用空间内插和外推的方法进行气象要素的空间展布。
另外,由于各站点纬度、海陆分布以及地势地貌与下垫面性质也不同,造成测得气温在空间分布上具有明显差异,并且气象站的观测气温值只能代表气象站所在地区的气温状况,数量有限且空间分布不均,在地形复杂的山区,如何利用有限的气候资源,并根据其空间分异规律,推演无气象站点或少观测点区域的气候要素值,是研究的重点。
气温是进行区域研究的重要基础数据,通过有限的气温数据插值生成研究区的气温分布数据是一项有意义的工作,它能反映气候条件的综合影响,在一定条件下也能反映热量状况,是生态、农业、资源环境等相关学科的基础数据源,各类生态系统模型都需要气候要素。
我们需要一个廉价、可靠的插值法来适应缺乏足够的取样站数量,这些气候变量是一个合理的农业规划所必须的输入数据。
农业研究寻求演变的方法来处理作物和土壤变化、天气生成器(使用气候资料产生模拟天气数据的计算机应用)和空间插值,在一个区域未取样的站点以有限数量的采样点为线索进行属性的价值估值。
从气象站点获取的空间点数据,利用空间内插和外推的方法进行气象要素的空间展布,得到区域尺度的有关参数,从而为生态、农业、资源环境等相关学科提供基础数据源,对在区域和全球尺度生态系统变化的模拟、生态系统管理、自然资源区划和管理中有着着重要作用。
一、气温数据插值研究现状
空间数据的内插可以做如下简单的描述:
设已知一组空间数据,他们可以是离散点的形式,也可以是多边形分区数据的形式,现在要从这些数据中找到一个函数关系式,使关系式最好地逼近这些一直的空间数据,并能根据该函数关系式推求出区域范围内其他任意点或任意多边形分区范围的值。
这种通过已知点或多边形的数据,推求任意点或多边形分区数据的方法就称为空间数据的内插。
近些年,随着地理信息系统(GIS)等空间信息技术的迅速发展,气候资源信息化工作得到强有力的技术保障,气候以及土壤、地形、土地等多种相关资源的空间数据库得以建立,同时,以这些数据为基础,可以进行气候资源的评价、监测和变化分析等研究。
近些年,随着地理信息系统(GIS)等空间信息技术的迅速发展,气候资源信息化工作得到强有力的技术保障,气候以及土壤、地形、土地等多种相关资源的空间数据库得以建立,同时,以这些数据为基础,可以进行气候资源的评价、监测和变化分析等研究。
有很多国内外学者从不同角度对气温空间插值进行了研究,并取得了一定的成果。
张蕾等[1]用基于温度梯度修正的气温内插方法对山东省气温数据进行内插试验;李莎等[2]以黑龙江省近37a的月均气温数据为研究对象,介绍了一类积分式时空协方差(变异)函数模型进行时空Kriging插值。
针对月均气温呈现出的明显季节变化,对各站点的气温进行去季节项处理,并在此基础上建立时空变异函数。
将空间维的普通Kriging插值扩展至时空维,同时考虑空间和时间相关性对研究变量进行时空估计,并将估计结果与空间Kriging插值效果进行了比较;杨凤海等[3]以ArcGISGeostaticticalAnalyst为支撑,利用高程、坡向数据作为辅助,采用协同克里格(Cokriging)方法,对黑龙江省近10年旬平均气温进行空间插值;李莎等[4]以月平均气温数据为例,运用时空Kriging方法结合R统计语言进行时空插值研究及其实现;陈锋锐等[5]为了提高地表气温的插值精度,提出了融合多源信息的地表气温插值方法,该方法以地表气温和辅助信息之间显著相关为前提条件,利用多元地统计(拟协同克里金、基于局部变化均值的简单克里金、带外部漂移的克里金)来实现多源信息的融合。
SaileshSamanta等[6]利用遥感和GIS技术提出了一种建模和映射的月度和年度空气温度经验方法。
李兰海[7]采用Delta方法对24个GCMs模型月数据降尺度至0.5°水平分辨率,分析A1B、A2和B1三个情景下新疆未来气候变化格局。
郑东凯等[8]对插值结果图以及插值精度进行了简要的分析,结果表明:
综合考虑气温分布图以及插值精度,四种插值方法的优劣程度为:
“多元回归+残差分析”的插值方法>基于DEM的插值方法>普通Kriging>IDW;仲嘉亮等[9]通过“回归方程计算+空间残差”的方法对全疆2004年年均气温数据进行插值。
从这些学者的研究当中,可以看出,由于影响气温的因素很多,所以在实际研究中很多学者考虑添加DEM、坡度、坡向等因素对插值模型进行修正并取得了比较好的效果,学者们的研究结果表明,经典插值模型模拟得出的结果误差相对较大。
IDW模型、Kriging模型对年均最高温度和年均最低强度的模拟精度各有优势.与IDW模型、Kriging模型的插值敢果相比。
基于DEM修正的插值方法亢分考虑了地型对气温空同分布的影响,插值精度有了明显舶提高。
山地地形的气温空间分布非常复杂,基于DEM修正的插值摸型并不能完全表达地形对气温空间分布的影响特征,但从一定程度上反映了气沮随海拔垂直高度壁化的趋势。
跟据交叉验证的结果,表明基于DEM修正的插值模型精度较高。
但仍需增加站点数来提高模型模拟效果,同时,在横型中引入其他地形因素如坡度、坡向等,将能更加精确地表达地形因素对气温空间变异性的影响.
二、气温数据插值方法介绍
作为生态、资源环境等相关学科基础数据源,气候信息在区域和全球尺度生态系统变化的模拟、生态系统管理、自然资源区划和管理中发挥着重要作用[1-4]。
然而由于气象站点定位观测获取的只是局部有限的空间点数据,要想得到区域尺度的有关参数,只能利用以点代面或者空间内插和外推方法得到气象要素的空间分布数据。
目前用于资料空间插值的方法有多种,主要有克里格(Kriging)插值法、反距离加权法(InverseDistanceWeight,IDW)、样条法(Splines)和综合插值法等。
研究区域和时间尺度的不同决定插值方法选用的不同,即使是同一种插值方法,用于不同的研究区域,所取得的结果也不同,不同的方法插值结果差别也很大。
气象要素的空间分布受诸多要素影响,由于气象观测站点稀少而且分布不均,在很多地形复杂的地区,可用的气象数据非常有限,因此如何充分利用有限的气候资源,根据气候要素的空间分异规律,推测无观测点和少观测点区域的气候要素值,一直是相关学科研究的热点。
地理信息系统(GIS)中获得的空间数据往往是离散点的形式。
离散的点数据常是通过对空间采样点进行观测获得,无法对空间所有点进行观测,但可以设置一些关键的样本点,这些样本点的观测值能反映空间分布的全部或部分特征,然后利用空间内插方法来获取未采样点的值。
人们比较熟悉和用得较多的是点内插,一般的空间内插就是指点内插。
点内插根据其基本假设和数学本质可分为几何方法、统计方法、空间统计方法、函数方法、随机模拟方法、物理模型模拟方法和综合方法[10-12]。
内插法都是基于假设进行的,即空间位置上越靠近的点,越有可能具有相似的特征值,离得越远的点,其特征值相似的可能性越小。
各种插值方法各有优缺点,没有绝对最优的,必须根据数据的特点,在对结果进行严格检验后选择一种相对最优的方法。
考虑到可操作性,本文借助地理信息系统软件中的空间分析模块,采用距离平方反比法(IDW)、梯度距离权重反比法(GIDW)、克立格法(Kriging)、样条函数法(Spline)对辽宁省2005年的最低温度、最高温度、日降水量数据进行空间内插,通过估值评估检验选择一种最优插值方法,建立乡镇天气预报历史资料库。
2.1距离权重反比法(IDW)
距离权重反比法(IDW:
InverseDistanceWeighting)是一种常用而简便的空间插值方法,它以插值点与样本点间的距离为权重进行加权平均,离插值点越近的样本点赋予的权重越大。
若权重用距离反比,称为距离反比法;权重用距离平方反比时称为距离平方反比法。
在实际应用中,通常选择后者,表达式如下:
2-1
式中:
Zp是相邻点的高程,d是插值点到p点的距离;n是参数,范围从1.0到6.0,通常用的值是2.0。
-n表示越靠近被插值点越重要。
2.2克里格法(kriging)
克里格法(Kriging)是地统计学的主要内容之一,从统计意义上说,是从变量相关性和变异性出发,在有限区域内对区域化变量的取值进行无偏、最优估计的一种方法;从插值角度讲是对空间分布的数据求线性最优、无偏内插估计一种方法。
克里格法的适用条件是区域化变量存在空间相关性。
应用克里格法首先要明确三个重要的概念。
一是区域化变量;二是协方差函数,三是变异函数。
(1)区域化变量。
当一个变量呈空间分布时,就称之为区域化变量。
这种变量反映了空间某种属性的分布特征。
矿产、地质、海洋、土壤、气象、水文、生态、温度、浓度等领域都具有某种空间属性。
区域化变量具有双重性,在观测前区域化变量Z(X)是一个随机场,观测后是一个确定的空间点函数值。
区域化变量具有两个重要的特征。
一是区域化变量Z(X)是一个随机函数,它具有局部的、随机的、异常的特征;其次是区域化变量具有一般的或平均的结构性质,即变量在点X与偏离空间距离为h的点X+h处的随机量Z(X)与Z(X+h)具有某种程度的自相关,而且这种自相关性依赖于两点间的距离h与变量特征。
在某种意义上说这就是区域化变量的结构性特征。
(2)协方差函数。
协方差又称半方差,是用来描述区域化随机变量之间的差异的参数。
在概率理论中,随机向量X与Y的协方差被定义为:
2-2
区域化变量
2-3
在空间点x和x+h处的两个随机变量Z(x)和Z(x+h)的二阶混合中心矩定义为Z(x)的自协方差函数,即
2-4
区域化变量Z(x)的自协方差函数也简称为协方差函数。
一般来说,它是一个依赖于空间点x和向量h的函数。
(3)变异函数。
变异函数又称变差函数、变异矩,是地统计分析所特有的基本工具。
在一维条件下变异函数定义为,当空间点x在一维x轴上变化时,区域化变量Z(x)在点x和x+h处的值Z(x)与Z(x+h)差的方差的一半为区域化变量Z(x)在x轴方向上的变异函数,记为γ(h),即:
2-5
在二阶平稳假设条件下,对任意的h有,
,因此上式可以改写为:
2-6
从上式可知,变异函数依赖于两个自变量x和h,当变异函数γ(x,h)仅仅依赖于距离h而与位置x无关时,可改写成γ(h),即
2-7
(4)克里格估计量。
假设x是所研究区域内任一点,Z(x)是该点的测量值,在所研究的区域内总共有n个实测点,即x1,x2,...,xn,那么,对于任意待估点或待估块段V的实测值Zv(x),其估计值是通过该待估点或待估块段影响范围内的n个有效样本值
的线性组合来表示,即
2-8
式中:
λi为权重系数,是各已知样本在Z(xi)在估计值时影响大小的系数,而估计值的好坏主要取决于怎样计算或选择权重系数λi
在求取权重系数时必须满足两个条件,一是使估计值的估计是无偏的,即偏差的数学期望为零;二是最优的,即使估计值和实际值Zv(x)之差的平方和最小,在数学上,这两个条件可表示为
2-9
(5)普通克里格分析方法。
设Z(x)为区域化变量,满足二阶平稳和本征假设,其数学期望为m,协方差函数c(h)及变异函数λ(h)存在。
即
2-10
对于中心位于x0的块段为V,其平均值为Zv(x0)的估计值以进行估计。
2-11
在待估区段V的邻域内,有一组n个已知样本v(xi)(i=1,2,…n),其实测值为Z(xi)(i=1,2,…n)。
克里格方法的目标是求一组权重系数λi(i=1,2,…n),使得加权平均值:
2-12
成为待估值段V的平均值Zv(x0)的线性、无偏最优估计量,即克里格估计量。
2.3样条插值法
样条插值法是用一种数学函数,对一些限定的点值,通过控制估计方差,利用一些特征节点,用多项式拟合的方法来产生平滑的插值曲线,用公式表示为:
2-13
其中,z为待估点的栅格值,
为插值点到第i个气象站点的距离,
为气温的局部趋势函数,x,y为插值点的地理坐标,
为一个基础函数,通过它可以获得最小化表面的曲率,Ai、a、b和c为方程系数,n为用于插值的气象站点数。
本选用规则样条插值法。
规则样条插值将生成一个平滑、渐变的表面,对于规则样条插值来说,权重定义了在曲率最小化表达式中表面的3阶导数的权重。
权重越高,表面越平滑,这一参数的值必须等于或大于零。
本文选用地理信息系统软件中样条函数插值时的默认值,权重值为1,插值运算中所采用的样本点数目为12个。
a、b和c由已知点和插值点要素值以及插值点的地理坐标进行拟合得到。
三、气温空间数据库的创建方法
以ArcGISGeostaticticalAnalyst为支撑,利用高程、坡向数据作为辅劝。
采用协同克里格(Cokriging)方法,对近10年旬平均气温进行空间插值。
36个旬平均气温插值结果均误差、平均标准差和均方根标准差的平均值分别为0.0024℃、0.0006和1.124。
基于全部旬平均气温插值结果及其相关数据,建立旬平均气温Geodatabase空间数据库,为气温变化监测、农业区划和实现千亿斤粮食的作物估产等研究奠定基础。
经过插值得到旬平均气温的栅格数据,为使这些数据以及与它们密切相关的气象站点、行政区划等数据能得以有序和高效管理,这里利用ArcCatolog建立Creodatabase空间数据库。
按照一定的模型和规则组合地理要素集。
提供对要素类及其空间和非空间关系的支持,将这些数据分类、分层次组织存放在数据库中,实现GIS应用软件和一般的关系型数据库(RDBMs)之间进行数据共享,为农业科学研究和农业生产服务。
3.1旬平均气温空间数据库文件的建立
通过ArcCatalog创建地理空间数据库TendayTemp.gdb,以便在其中创建有关气温的要素数据集(FeatureDataset)、要素类(FeatureClass)、栅格数据编目(RasterCatalog)等。
3.2旬平均气温数据入库
在TendayTemp.gdb中创建气温栅格编目Temp,由LoadData调入36个旬的平均栅格数据。
3.3地形数据入库
在TendayTemp.gdb创建栅格编目Terrain,调入DEM坡度和坡向等相关栅格数据。
3.4站点和区划数据入库
利用数据处理时所采用的地图投影参数,创建要素数据集(FeatureDataset)、WeaStat和Region,分别调入站点和行政区划矢量要素类。
四、相关英文文献翻译
4.1气候插值变量和温度建模
SamantaS,PalDK,LoharD,etal.Interpolationofclimatevariablesandtemperaturemodeling[J].TheoreticalandAppliedClimatology,2012,107(1-2):
35-45.
原文:
GeographicInformationSystems(GIS)andmodelingarebecomingpowerfultoolsinagriculturalresearchandnaturalresourcemanagement.ThisstudyproposesanempiricalmethodologyformodelingandmappingofthemonthlyandannualairtemperatureusingremotesensingandGIStechniques.ThestudyareaisGangeticWestBengalanditsneighborhoodintheeasternIndia,whereanumberofweathersystemsoccurthroughouttheyear.GangeticWestBengalisaregionofstrongheterogeneoussurfacewithseveralweatherdisturbances.Thispaperalsoexaminesstatisticalapproachesforinterpolatingclimaticdataoverlargeregions,providingdifferentinterpolationtechniquesforclimatevariables'useinagriculturalresearch.Threeinterpolationapproaches,likeinversedistanceweightedaveraging,thin-platesmoothingsplines,andco-krigingareevaluatedfor4°×4°area,coveringtheeasternpartofIndia.Thelanduse/landcover,soiltexture,anddigitalelevationmodelareusedastheindependentvariablesfortemperaturemodeling.Multipleregressionanalysiswithstandardmethodisusedtoadddependentvariablesintoregressionequation.Predictionofmeantemperatureformonsoonseasonisbetterthanwinterseason.Finallystandarddeviationerrorsareevaluatedaftercomparingthepredictedtemperatureandobservedtemperatureofthearea.Forbetterimprovement,distancefromthecoastlineandseasonalwindpatternarestressedtobeincludedasindependentvariables.
Weatherandclimateremainthedominantcomponentstodeterminethechoiceofaparticularagricultureactivity.Developingcountriesneedaninexpensiveandreliablemethodofinterpolationtomakegoodforthelackofadequatenumbersamplingstationsforcollectingdataontheclimaticvariablesthatarenecessaryinputforsoundagriculturalplanning.Agriculturalresearchseekstoevolvemethodstodealwithcropandsoilvariability,weathergenerators(computerapplicationsthatproducesimulatedweatherdatausingclimateprofiles),andspatialinterpolation,theestimationofthevalueofpropertiesatunsampledsiteswithinanareatakingcuefromthelimitednumberofsampledpoints(Boumanetal.1996).Especiallyindevelopingcountries,thereisaneedforaccurateandinexpensivequantitativeapproachestospatialdataacquisitionandinterpolation(Mallawaarachchietal.1996).Mostdataforenvironmentalvariablesarecollectedfrompointsources.Thevalueofanareabetweendatapointscanbeinterpolatedormodeledbyfittingasuitablemodeltoaccountfortheexpectedvariation.Interpolationapproachforagivensetofinputdataisespeciallytrueforareassuchasmountainousregions,wheredatacollectionissparseandmeasurementsforgivenvariablesmaydiffersignificantlyevenatrelativelyreducedspatialscales(CollinsandBolstad1996).
翻译:
地理信息系统(GIS)和建模在农业研究和自然资源管理领域逐渐成为强大的工具。
本研究利用遥感和GIS技术提出了一种建模和映射的月度和年度空气温度经验方法。
研究区是恒河的西孟加拉邦和其附近的印度东部,那里一个数量的天气系统发生在整个一年。
河的西孟加拉邦地区是一个有若干个天气干扰的强劲的异构表面。
本文还研究了在大区域插值气候数据的统计方法,在农业研究中对气候变量的使用提供了不同的插值方法。
三种插值方法,如逆距离加权平均,薄板平滑样条函数,和协同克里格对覆盖在印度东部的4°×4°区域经行评估。
土地利用/土地覆盖、土壤质地、和数字高程模型作为独立变量进行温度建模。
使用多重回归分析与标准方法将因变量添加回归方程。
对平均温度的预测季风季节要比冬季更准确。
最后在比较预测温度和观察温度的区域之后进行标准偏差错误的评估。
为了更好的改善,海岸线和季节性风模式的距离都强调要包括作为独立的变量。
天气和气候仍然是确定一个特定农业活动选择的主导组件。
发展中国家需要一个廉价、可靠的插值法来适应缺乏足够的取样站数量,这些气候变量是一个合理的农业规划所必须的输入数据。
农业研究寻求演变的方法来处理作物和土壤变化、天气生成器(使用气候资料产生模拟天气数据的计算机应用)和空间插值,在一个区域未取样的站点以有限数量的