GIS考试+地理数据.docx
《GIS考试+地理数据.docx》由会员分享,可在线阅读,更多相关《GIS考试+地理数据.docx(21页珍藏版)》请在冰豆网上搜索。
GIS考试+地理数据
空间数据
一、地理数据的分层
概念:
GIS的数据可以按照空间数据的逻辑关系或专业属性分为各种逻辑数据层或专业数据层,通常称为图层(Coverage)。
1、数据层设计
1)主要依据是数据的专业内容:
例如,地形图数据可分为地貌、水系、道路、植被、控制点、居民地等诸层分别存贮。
2)也要考虑数据间的相互关系:
例如,需考虑两类物体共享边界(道路与行政边界重合、河流与地块边界的重合)等
3)还考虑不同数据的应用功能:
在分析和应用时往往会同时用到。
例如多边形的湖泊、水库,线状的河流、沟渠,点状的井、泉等,在GIS的运用中往往同时用到,因此,可作为一个数据层。
其他考虑因素:
比例尺的一致性、不同部门的数据(便于维护)、不同安全级别(便于控制)、
不同的数据源(便于更新)
2、比较常用的空间数据分层方法:
1)专题分层
每一个图层对应一个专题,包含某一种或某一类数据。
如道路层、居民地层等。
2)时间序列分层
即把不同时间或不同时期的数据作为一个数据层。
3)地面垂直高度分层
3、空间数据分层的目的
便于空间数据的管理、查询、显示、分析等。
1)便于管理:
空间数据分为若干数据层后,对所有空间数据的管理就简化为对各数据层的管理,而一个数据层的数据结构往往比较单一,数据量也相对较小,管理起来就相对简单;
2)便于查询:
对分层的空间数据进行查询时,不需要对所有空间数据进行查询,只需要对某一层空间数据进行查询即可,因而可加快查询速度;
3)便于显示:
分层后的空间数据,便于任意选择需要显示的图层,增加了图形显示的灵活性;
4)便于空间分析:
对不同数据层进行叠加,可进行各种目的的空间分析。
4、图幅内的空间数据组织
1)工作区:
通常将一幅图或几幅图的范围当作一个工作单元,或工作区。
工作区包含了所有各层的空间数据。
工作区通常按范围定义。
2)工作层:
工作是空间数据处理的一个工作单位。
可包含若干逻辑层。
3)逻辑层:
具有多个地物类组成。
4)地物类(专题层):
具有相同属性和意义的地物组合。
二、空间数据特征:
1)空间特征:
一般需要建立空间索引。
2)非结构化特征:
结构化的,即满足第一范式:
每条记录定长,且数据项是原子数据.而空间数据数据项变长,对象包含一个或多个对象,需要嵌套记录。
3)空间关系特征:
拓扑数据给空间数据的一致性和完整性维护增加了复杂性。
4)分类编码特征:
一种地物类型对应一个属性数据表文件。
多种地物类型共用一个属性数据表。
5)海量数据特征。
三、空间数据库特点:
1)数据量大、2)有大量的空间数据、3)数据应用广泛。
栅格数据结构
编码方法
优点
缺点
1.完全栅格:
限定属性值的范围,按照一定的顺序(逐行、逐像元、逐波段)存储各个栅格的属性值。
1、最易于实现
2、适用于二维和多维结构。
1、数据冗余量最大。
2.链码:
(弗里曼Freeman链码)
由弗里曼[Freeman]提出的用曲线出发点坐标和线的斜率来描述二值线图形的一种方法。
1、可以有效地压缩栅格数据,
2、对于估算面积、长度、转折方向的凹凸度等运算十分方便
3、比较适合于存储图形数据
1、是对边界进行合并和插入等修改编辑比较困难
2、对修改局部将改变整体结构,效率较低,
3、相邻区域的边界将被重复存储而产生冗余。
3.游程编码:
只在各行(或列)发生变化时记录该代码以及重复的次数。
游程用一对数字表达,第一个值表示游程长度,第二个值表示属性值。
1、压缩效率较高
2、易于检索,叠加合并等操作
3、运算简单,适用于机器存储容量小,数据需大量压缩,而又要避免复杂的编码解码运算增加处理和操作时间的情况。
4、适用与二维和多维结构。
1、在一定程度上减少了数据冗余量,但减少的程度与栅格属性值存储的顺序有关。
2、在某些操作时,则必须解码,转换为基本栅格结构进行。
4、块码:
采用方形区域作为记录单元,每个记录单元包括相邻的若干栅格,数据结构由初始位置(行、列号)和半径,再加上记录单位的代码组成。
1、块码具有可变的分辨率,
2、块码在合并、插入、检查延伸性、计算面积等操作时有明显的优越性。
1、块码与游程长度编码相似,图形越复杂程度率越低。
2、在某些操作时,则必须解码,转换为基本栅格结构进行。
5、.四叉数:
栅格图像等分为四块,若某一块中像元属性值不相同,继续等分这个块,直到所有的块(大小可以不同)中像元的属性值都相同。
而后,按照一定的顺序,存储这些块和块中像元的属性值。
1、利用了空间属性的连续性,具有可变的分辨率,可以达到较低的数据冗余量,且压缩数据灵活。
特别适用于处理分布不均匀的块状空间数据(但不适用于连续表面,如地形或线状地物)
2、采用Morton的“Z”字形顺序,可以快速检索。
3、许多运算可以在编码数据上直接实现,大大地提高了运算效率,是优秀的栅格压缩编码之一。
目前应用四叉树还存下列问题:
1)矢/栅正反变换还不理想。
2)四叉树建立耗时。
3)四叉树虽可修改,但很费事(具体的数据结构中会提到)
4)未能直接表示物体间的拓扑关系。
5)与非树表示法比较,四叉树表示法的缺点在于转换的不稳定性或叫滑动变异。
例如,两个图像的差异仅由于平移,就会构成极为不同的四叉树,因而很难根据四叉树来判断这两个图像是否全同,也就给空间分析带来麻烦。
6)一个物体的图像在构成四叉树时会被分割到若干个象限中,使它失去了内在的相关性。
二维行程编码:
在生成线性四叉树之后,仍然存在前后叶结点的值相同的情况,因而可以进一步压缩数据,将前后值相同的叶结点合并,形成一个新的线性表列。
这种记录方式类似游程编码,但是所合并的不是栅格单元,而是合并了代表范围大小不一的叶结点,所以称它为二维行程编码。
矢量数据结构
1.点
用一个二维或多维坐标数组表达。
基本矢量结构,是其他矢量结构的基本构成元素
2.线
用一个二维或多维坐标数组序列表达。
表示一个空间中的线划要素,如空间对象边界
3.面(多边形)
多边形矢量编码不但要表示位置和属性,更为重要的是要能表达区域的拓扑性质,如形状、邻域和层次等
①、二维的面由一组闭合的线序列组成;
编码方法
评价
1、实体式:
(.坐标序列法、Spaghetti法)
由多边形边界的x、y坐标对集合及说明信息组成,是最简单的一种多边形矢量编码。
优点:
1、文件结构简单
2、易于实现以多边形为单位的运算和显示。
缺点:
1、公共边被数字化和存储两次,由此产生冗余和碎屑多边形;
2、每个多边形自成体系而缺少邻域信息,难以进行邻域处理,如消除某两个多边形之间的共同边界;
3、岛只作为一个单个的图形建造,没有与外包多边形的联系;
4、不易检查拓扑错误。
适用范围:
制图及一般查询,不适合复杂的空间分析
2.索引式:
(树状索引编码法)
该法采用树状索引以减少数据冗余并间接增加邻域信息,方法是对所有边界点进行数字化,将坐标对以顺序方式存储,由点索引与边界线号相联系,以线索引与各多边形相联系,形成树状索引结构。
优点:
1、消除了相邻多边形边界的数据冗余和不一致的问题
2、在简化过于复杂的边界线、或合并相邻多边形时,可不必改造索引表,
缺点:
1、领域信息和岛状信息可以通过对多边形文件的线索引处理得到,但是比较繁琐,因而给相邻函数运算,消除无用边,处理岛状信息以及检查拓扑关系带来一定的困难,
2、编码表都需要人工建立,工作量大且容易出错。
3、拓扑结构编码法
是通过建立一个完整的拓扑关系结构,彻底解决邻域和岛状信息处理问题的方法。
优点:
1、较好地解决空间关系查询等问题
缺点:
1、增加了算法的复杂性和数据库的大小
目前并无统一的最佳的矢量结构编码方法,在具体工作中应根据数据的特点和任务的要求而灵活设计。
②、三维的面用等高线表示法或剖面表示法实现
表示面状要素,三维空间曲面的表示方法比二维空间区域要难得多
4.体
三维空间中的实体目前可用三维边界法,即通过顶点表、边表和面表的关联表示
这个方法目前需要解决如何确定出尽可能少的平面用来模拟复杂的三维实体的问题
空间分析
空间分析的主要内容:
类型
研究内容
空间位置
研究地球表面的可展性,借以量化描述空间实体的地理位置。
空间分布
研究同类空间实体的群体定位信息,如分布中心、标准距离、分布密度、分布轴线、空间聚类和趋势面等。
空间形态
描述空间实体的几何特征,如连通性、走向以及面积、周长、坡度等。
空间距离
确定空间实体之间几何上的接近程度。
空间相关
空间实体之间的空间方位关系、拓扑关系以及之间的相似关系
空间插值
一、概念和理论
理论假设:
越靠近的点越相似;
空间插值包括:
内插:
是一种通过已知点的数据推求同一区域其它未知点数据的计算方法(由已知点推未知点);
外推:
是通过已知区域的数据,推求其它区域数据的方法(由已知区域推未知区域)。
必须插值的情况:
1)现有的离散曲面的分辨率,象元大小或方向与要求不符,需要重新插值。
2)现有的连续曲面的数据模型与所需的数据模型不符,需要重新插值。
如TIN到栅格。
3)现有的数据不能完全覆盖要求的区域范围,需要插值。
如将采样点内插为表面。
二、数据源
数据源:
●摄影测量得到的正射航片或卫星影象;
●卫星或航天飞机的扫描影象;
●野外测量采样数据,采样点随机分布或有规律的线性分布(沿剖面线或沿等高线);
●数字化的多边形图、等值线图;
采样方法:
均匀布点、完全随机的采样、成层随机采样、聚集采样、规则断面采样、等值线采样。
三、空间插值方法
1、整体插值方法:
用研究区所有采样点的数据进行全区特征拟合。
此方法通常不直接用于空间插值,而用来检测不同于总趋势的最大偏离部分,在去除了宏观地物特征后,可用剩余残差来进行局部插值。
由于整体插值方法将短尺度的、局部的变化看作随机的噪声,从而丢失了这一部分信息
2、局部插值方法(邻近点—>未知点):
是仅仅用邻近的数据点来估计未知点的值。
局部插值方法能弥补整体插值方法的缺陷,可用于局部异常值,而且不受其它点的影响。
步骤:
定义搜索范围—>搜索邻域内的点—>表示数学函数—>给所有的点赋值
1)定义搜索范围;
2)搜索范围内的点;
3)根据这有限个点的空间变化,表示数学函数;
4)为落在规则格网单元上的数据点赋值。
重复直到所有点赋值完毕。
应用时需注意:
1、所使用的插值函数;
2、邻域的大小、形状和方向;
3、数据点的个数;
4、数据点的分布方式是规则的还是不规则的。
空间插值方法
评价
应用
整体插值
1)边界内插方法:
边界内插方法假设任何重要的变化发生在边界上,边界内的变化是均匀的。
在使用边界内插时,应仔细考虑数据源是否符合这些理论假设。
2)趋势面分析:
根据采样点的属性数据与地理坐标的关系,进行多元回归分析得到平滑数学平面方程的方法,称为趋势面分析。
优点:
1、非常容易理解,至少是在计算方面。
2、多数情况下可用低次多项式拟合,
缺点:
1、给复杂的多项式赋予明确的物理意义比较困难。
在使用某种局部插值方法之前,可用趋势面分析从数据中去掉一些宏观特征,不直接用它进行空间插值。
3)变换函数插值:
根据一个或多个空间参量的经验方程进行整体空间插值,这种插值方法称为变换函数插值。
评价:
计算比较简单,需要的数据量相对较小。
必须清楚回归模型的物理意义。
局
部
插
值
1)泰森多边形方法:
即最近邻点法,采用了一种极端的边界内插方法,只用最近的单个点进行区域插值,即用每一个泰森多边形内拥有的唯一的点赋给整个泰森多边形内的所有点。
评价:
此插值方法得到的结果图变化只发生在边界上,在边界内是无变化的。
共同的问题:
1、需要计算平均值数据点的数目;
2、搜索邻域大小、方向和形状的确定;
3、有没有比计算简单距离函数更好的估计权重系数的方法;
3、与插值有关的误差问题。
2)移动平均法:
距离倒数插值,距离倒数插值方法综合了泰森多边形的邻近点方法和趋势面分析的渐变方法的长处,它假设未知点x0处属性值是在局部邻域内中所有数据点的距离加权平均值。
距离倒数插值方法是加权移动平均方法的一种
优点:
综合了泰森多边形方法和趋势面分析方法的长处,
缺点:
易受数据点集群的影响,常出现一种孤立点数据明显高于周围数据点的“鸭蛋”分布模式,可以通过动态修改搜索准则进行一定的改进。
3)样条函数插值方法
样条函数:
是一个分段函数,进行一次拟合只有与少数点拟合,同时保证曲线段连接处连续。
这就意味着样条函数可以修改少数数据点配准而不必重新计算整条曲线。
优点:
1、插值速度快;
2、保留了局部的变化特征;3、视觉上令人满意。
缺点:
1、误差不能直接估算;2、样条块的定义麻烦,且容易出现异常。
4)克里金插值:
它充分吸收了地理统计的思想,认为任何在空间连续性变化的属性是非常不规则的,不能用简单的平滑数学函数进行模拟,可以用随机表面给予较恰当的描述。
这种应用地理统计方法进行空间插值的方法,称为克里金插值。
克里金插值方法的目的是提供确定权重系数最优的方法和并能描述误差信息。
由于克里金点模型(常规克里金模型)的内插值与原始样本的容量有关,当样本少的情况下,采用简单的点常规克里金插值的内插结果图会出现明显的凹凸现象。
可以通过修改克里金方程以估计子块B内的平均值来克服这一缺点。
该方法叫块克里金插值,该方法对估算给定面积试验小区的平均值或对给定格网大小的规则格网进行插值比较适用。
数字地形模型和地形分析
1、DEM的表示法
1)数学方法
①、整体拟合法:
即根据区域所有的高程点数据,用傅立叶级数和高次多项式拟合统一的地面高程曲面。
②、局部拟合法:
将地表复杂表面分成正方形规则区域或面积大致相等的不规则区域进行分块搜索,根据有限个点进行拟合形成高程曲面。
2)图形方法
①、线模式:
如等高线、山脊线、谷底线、海岸线及坡度变换线等。
②、点模式:
用离散采样数据点建立DEM常用的方法。
数据采样可以是规则采样、不规则采样、或选择重要特征点采样。
2.DEM的主要表示模型(01年考)
存储方法
优点(01)
缺点
数学分块模型
这种方法把地面分成若干个块,每块用一种数学函数,以连续的3维函数高平滑度地表示复杂曲面,并使函数曲面通过离散采样点。
广泛用于复杂表面模拟的机助设计系统。
这种近似数学函数表示的DTM不太适合于制图,
随机分布模型
实质上就是地面特性离散点3维坐标的集合,离散点是通过实地测量的即没有整理过的特征点,离散点之间彼此独立。
最大的优点是能表达任何类型的地面特性,且不需要专门的数据结构来组织数据;
缺点是表达不直观,完成空间分析比较困难。
规则格网模型
规则网格可以是正方形,矩形、三角形等。
每个格网单元对应一个高程值。
数学上可用矩阵表示,计算机中则是一个二维数组。
1、矩阵可以很容易地用计算机处理。
可以很容易地计算等高线、坡度坡向、山坡阴影和自动提取流域地形
2、与我国DEM、DTM现有数据格式吻合。
1、不能准确表示地形的结构和细部
2、数据量过大
3、在某些计算,如通视问题,过分强调网格的轴方向。
等高线模型
采用类似于线状要素的矢量数据来表达DTM,但一般不带拓扑关系。
1、用二维的链表来存储(常用)。
2、用图来表示等高线的拓扑关系,将等高线之间的区域表示成图的节点,用边表示等高线本身。
可以改造成无圈的自由树。
他的特点是直观,易于理解地表特性的变化规律,一般用做其他模型数据分析结果的输出。
不适合计算和分析,必须转为网格高程矩阵。
TIN模型
利用所有采样点取得的离散数据,按照优化组合的原则,把这些离散点连接成相互连续的三角面。
1、三角形的记录:
包括三个指向它三个边的记录的指针;
2、边的记录:
有四个指针字段,其中两个指向相邻三角形记录,两个指向顶点记录
3、节点记录:
x、y、z坐标。
可以按情况改变采样点的密度和位置,所以减少数据冗余。
同时在计算(如坡度)效率方面又优于基于等高线的方法。
可以用彩色表达地形、坡度、坡向,或三维显示。
数据结构较复杂,表达地形面积较大时,效率不高。
层次地形模型
是一种表达多种不同精度水平的数字高程模型,通常由不同精度的TIN叠加在一起。
优点:
①、通常TIN的数据点越多精度越高,但数据点多要求更多的计算资源;
②、可以根据要求选择不同精度的地形模型以节省计算资源。
必须注意的问题:
1)数据冗余问题;2)搜索的效率问题;
3)三角网形状的优化问题;4)混合模型模型问题,5)地貌特征表达的一致性问题。
DEM建立的一般步骤
数字高程模型的建立过程是一个模型建立过程。
从模型论角度讲,就是将源域(地形)表现在另一个域(目标域或DEM)中的一种结构,建模的目的是对复杂的客体进行简化和抽象,并把对客体(源域,DEM中为地形起伏)的研究转移到对模型的研究上来。
模型建立之初,首先要为模型构造一个合适的空间结构(spatialframework)。
空间结构是为把特定区域内的空间目标镶嵌在一起而对区域进行的划分,划分出的各个空间范围称为位置区域或空间域。
空间结构一般是规则的(如格网),或不规则的(如不规则三角网TIN)。
建立在空间结构基础上的模型是由n个空间域的有限集合组成。
由于空间数据包含位置特征和属性特征,而属性特征是定义在位置特征上的,因此每一个空间域就是由空间结构到属性域的计算函数或域函数。
模型的可计算性要求有两点,一是空间域的数量、属性域和空间结构是有限的,二是域函数是可计算的。
构筑模型的一般内容和过程为:
①采用合适的空间模型构造空间结构;
②采用合适的属性域函数;
③在空间结构中进行采样,构造空间域函数;
④利用空间域函数进行分析。
当空间结构为欧几里德平面,属性域是实数集合时,模型为一自然表面。
将欧几里德平面充当水平的XY平面,属性域给出Z坐标(或高程),模型即为数字高程模型。
对于数字高程模型而言,空间结构的构造过程即为DEM的格网化过程(形成格网),属性值为高程,构造空间域函数即为内插函数的确定,利用空间域函数进行分析就是求取格网点的函数值。
DEM的应用:
(01年考)
(1)作为国家地理信息的基础数据:
我国现在强调4D产品的建设。
即:
数字线化图(DigitalLinearGraphs,简称DLG);数字高程模型(DigitalElevationModels,简称DEM);数字正射影像(DigitalOrthophotoQuadrangles,简称DOQ);数字栅格图(DigitalRasterGraphs,简称DRG)。
并以前3D作为国家空间数据基础设施(NSDl)的框架数据。
(2)土木工程、景观建筑与矿山工程的规划与设计
(3)为军事目的(军事模拟等)而进行的地表三维显示
(4)景观设计与城市规划
(5)流水线分析、可视性分析
(6)交通路线的规划与大坝的选址
(7)不同地表的统计分析与比较
(8)生成坡度图、坡向图、剖面图,辅助地貌分析,估计侵蚀和径流等。
(9)作为背景叠加各种专题信息如土壤、土地利用及植被覆盖数据等,以进行显示与分析等等
GIS的地理基础--控制基础
各种GIS的数据源、服务目的和各自特征可以不同,但均有自身统一的地理基础。
地理基础是地理信息数据表示格式与规范的重要组成部分
1、地理基础的内容:
①、统一的地图投影系统、②、统一的地理格网坐标系统(地理参照系)
③、统一的地理编码系统。
2、投影与坐标系:
每一种投影都与一个坐标系统相联系。
坐标系统是一套说明某一物体地理坐标的参数,参数之一为投影。
投影关系着如何将图形物体显示于平面上,而坐标系统则显示出地形地物所在的相对位置。
3、统一的地图投影系统的意义:
为地理信息系统选择和设计一种或几种适用的地图投影系统和网格坐标系统,为各种地理信息的输入、输出及匹配处理提供一个统一的定位框架,使各种来源的地理信息和数据能够具有共同的地理基础,并在这个基础上反映出它们的地理位置和地理关系特征。
GIS设计的基本原则
基本原则
具体内容
标准化
符合GIS的基本要求和标准;符合现有的国家标准和行业规范
先进性
硬件设备的先进性;软件设计的先进性;技术方法的先进性;管理手段的先进性
兼容性
数据具有可交换性,选择标准的数据格式和实现数据格式转换功能,实现与不同数据库之间的数据共享
高效性
具有高效率的数据采集工艺方法和图形处理能力、存取能力、管理能力等等
可靠性
保证系统正常运行以及系统运行结果的正确性
通用性
系统数据组织灵活,可以满足不同应用分析的需求
GIS设计与一般信息系统设计的差异
GIS设计
一般信息系统设计
设计重心
处理的是海量空间数据,数据库设计在GIS设计中尤其重要
软件功能实现是其设计重心
数据库建设
不仅要进行属性数据库的设计,更要进行空间数据库的设计,包括空间数据结构、存储方式、管理机制等
只需要建立属性数据库
设计方法
以业务需求为导向、以空间数据为驱动进行系统设计
以业务需求为导向,以功能为驱动进行系统设计
GIS可应用于哪些领域?
试结合你的专业论述GlS的应用.
(1)在市政工作中的决策支持:
城市发展的宏观决策中、宏观经济社会信息统计、公共安全、道路建设、税收管理、财政、工商行政、建筑物审批、水利、农业、环境、土地管理、矿业、国土绿化、医疗卫、人民防空、防震减灾
(2)在社会公共事业中:
城市供水、公共交通、铁路、邮电通讯、电力供应、煤气燃气供应
(3)在第三产业中:
物业估价、房地产管理、中介服务、广告宣传、金融保险、商业服务
(4)在军事中:
作战指挥、后方管理
GIS空间分析模型
一、地学模型概述
地理信息系统不仅要完成管理大量复杂的地理数据的任务,更为重要的是要完成地理分析、评价、预测和辅助决策的任务,必须发展广泛的适用于地理信息系统的地理分析模型,这是地理信息系统走向实用的关键。
模型:
所谓模型,就是将系统的各个要素,通过适当的筛选,用一定的表现规则描写出来的简明的映象。
通常表达了某个系统的发展过程或发展结果。
地学模型:
是用来描述地理系统各个要素之间相互关系和客观规律的,它用信息的、语言的、数学的或其它表达形式,通常反映地学过程及其发展趋势或结果。
是在对系统所描述的具体对象与过程,进行大量专业研究的基础上,总结出来的客观规律的抽象或模拟。
地学模型也称为专题分析模型。
模型的作用和特点:
●应用模型是联系GIS应用系统与常规专业研究的纽带
●应用模型是综合利用GIS应用系统中大量数据的工具
●应用模型是GIS应用系统解决各种实际问题的武器
●应用模型是GIS应用系统向更高技术水平发展的基础
对象-关系数据库管理系统
将对象关系数据库管理系统应用于空间数据管理和GIS应用中,通过对对象存储访问的支持,不仅解决了关系数据库所面临的问题,同时通过兼容关系数据库系统的功能,具有如下明显优势:
①支持可扩充的数据类型,例如Informix中可把一组数据类型及其上的有关函数和操作符、访问方法封装成数据刀片(DataBlade);
②支持复杂对象,除了支持包括二维的点、线、多边形、椭圆、圆及其它二维数据类型外,还支持