第六章GIS的数据获取与处理Word文档下载推荐.docx
《第六章GIS的数据获取与处理Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《第六章GIS的数据获取与处理Word文档下载推荐.docx(44页珍藏版)》请在冰豆网上搜索。
(7)、已有系统的数据
GIS还可以从其它已建成的信息系统和数据库中获取相应的数据。
由于规范化、标准化的推广,不同系统间的数据共享和可交换性越来越强。
这样就拓展了数据的可用性,增加了数据的潜在价值。
2、数据集。
一个结构化的相关数据的集合体,包括数据本身和数据间的联系。
数据集独立于应用程序而存在,是数据库的核心和管理对象。
GIS的主要数据集。
数字线划数据(DLG)、数字扫描数据(DRG)、影像数据(DOM)、数字高程数据(DEM)和属性数据(包括社会经济数据)、专业数据。
二、空间数据采集的任务
空间数据采集的任务是将现有的地图、外业观测成果、航空像片、遥感图像、文本资料等转换成GIS可以处理与接收的数字形式,通常要经过验证、修改、编辑等处理。
不同数据输入需要用到不同的设备。
例如,对于文本数据通常用交互的方式通过键盘录入,也可用扫描仪扫描后用字符识别软件自动录入;
对于矢量地图数据,可用平板数字化仪,采用手扶跟踪的方法输入,也可用扫描仪扫描成图像后,用栅格数据矢量化的方法自动追踪输入;
等等。
GIS软件的这一部分还应具有数据转换装载的功能,即能把其它GIS或专题数据库中的数据通过转换装载到当前的GIS系统中。
这一部分GIS软件的数据处理工作主要是几何纠正、图形和文本数据的编辑、图幅的拼接、拓扑关系的生成等,即完成GIS的空间数据在装入GIS的地理数据库前的各种工作。
三、空间数据主要采集技术
在GIS的几何数据采集中,如果几何数据已存在于其它的GIS或专题数据库中,那么只要经过转换装载即可;
对于由测量仪器获取的几何数据,只要把测量仪器的数据传输进入数据库即可,测量仪器如何获取数据的方法和过程通常是与GIS无关的。
对于栅格数据的获取,GIS主要涉及使用扫描仪等设备对图件的扫描数字化,这部分的功能也较简单。
因为通过扫描获取的数据是标准格式的图像文件,大多可直接进入GIS的地理数据库。
从遥感影像上直接提取专题信息,需要使用几何纠正、光谱纠正、影像增强、图像变换、结构信息提取、影像分类等技术,主要属于遥感图像处理的内容。
因此,以下主要介绍GIS中矢量数据的采集。
GIS中矢量数据的采集主要包括地图跟踪数字化与地图扫描数字化。
1、地图跟踪数字化
跟踪数字化是目前应用最广泛的一种地图数字化方式,是通过记录数字化板上点的平面坐标来获取矢量数据的。
其基本过程是:
将需数字化的图件(地图、航片等)固定在数字化板上,然后设定数字化范围、输入有关参数、设置特征码清单、选择数字化方式(点方式和流方式等),就可以按地图要素的类别分别实施图形数字化了。
由于跟踪数字化本身几乎不需要GIS的其它计算功能,所以跟踪数字化软件往往可以与整个GIS系统脱离开,因而可单独使用。
地图跟踪数字化时数据的可靠性主要取决于操作员的技术熟练程度,操作员的情绪会严重影响数据的质量。
操作员的经验和技能主要表现在能选择最佳点位来数字化地图上的点、线、面要素,判断十字丝与目标重合的程度等能力。
为了保持一致的精度,每天的数字化工作时间最好不要超过6小时。
GIS中的地图跟踪数字化软件为了获取矢量数据应具有下列基本功能:
1°
、图幅信息录入和管理功能
即对所需数字化的地图的比例尺、图幅号、成图时间、坐标系统、投影等信息进行录入和管理。
这是所采集的矢量数据的数据质量的基本依据。
2°
、特征码清单设置
特征码清单是指安放在数字化仪台面或屏幕上的由图例符号构成的格网状清单,每种类型的符号占居清单中的一格。
在数字化时只要点中特征码清单区的符号所在的网格,就可知道所数字化要素的编码,以方便属性码的输入。
地图跟踪数字化软件应能使用户方便地按自己的意愿设置和定义特征码清单。
3°
、数字化键值设置
即设置数字化标识器上各按键的功能,以符合用户的习惯。
4°
、数字化参数定义
主要是指系统应能选定不同类型的数字化仪,并确定数字化仪与主机的通讯接口。
5°
、数字化方式的选择
主要是指选择点方式还是流方式等进行数字化。
6°
、控制点输入功能
应能提示用户输入控制点坐标,以便于进行随后的几何纠正。
2、地图扫描数字化
扫描数字化是目前较为先进的地图数字化方式,也是今后的发展方向,但要实现完全自动化还要做大量艰巨的努力,目前所能提供的扫描数字化软件是半自动化的,还需做相当的人机交互工作。
地图扫描数字化的基本思想是:
首先通过扫描将地图转换为栅格数据,然后采用栅格数据矢量化的技术追踪出线和面,采用模式识别技术识别出点和注记,并根据地图内容和地图符号的关系,自动给矢量数据赋属性值。
根据目前的技术水平,首先要对所扫描的彩色地图进行分版处理,通常分为黑版要素、水系版要素、植被要素和地貌要素,也可以直接对分版图进行扫描,然后由软件进行二值化,去噪音等处理,经常需要进行一些编辑,以保证自动跟踪和识别的进行;
在软件自动进行跟踪和识别时,仍需要进行部分的人机交互,如处理断线、确定属性值等,有时甚至要人工在屏幕上进行数字化。
与地图跟踪数字化相比,地图扫描数字化具有速度快、精度高、自动化程度高等优点,正在成为GIS中最主要的地图数字化方式。
地图扫描数字化的自动化程度高,但必须具有一些对扫描后的地图数据的预处理能力,同时,由于其最后结果同地图跟踪数字化的结果是相同的,因而还必须具有地图跟踪数字化所具有的一些功能。
因此,其基本功能可描述为:
、地图扫描输入功能
即能使用各种扫描仪把地图扫描数字化为栅格数据。
、图像格式转换和图像编辑功能
能接受不同格式的栅格数据,并具有基本的图像编辑功能。
、彩色地图图像数据的分版功能
能够将所扫描的彩色地图图像分成不同要素版的图像数据,以便于跟踪和识别。
、线状要素的矢量化功能
能够对线状要素进行细化、断线修复、跟踪,也即具有自动提取线状要素中心线的功能。
由于目前的自动化程度还不够高,经常需要进行人机交互,诸如在多条线的交叉点找到粘连及断开处,原实体连续担图形中断处(桥下河,桥中路……),需人机交互指明继续追踪的方向。
、点状符号和注记的自动识别功能
应该能对点状符号和注记字进行自动识别,但完全自动化目前仍有困难,因此,有时需要人工在屏幕上进行数字化。
、属性编码的自动赋值
应能对已数字化的要素自动根据其符号特征赋以相应的编码(包括等高线的高程)。
这方面目前还需要较多的人机交互。
7°
、图幅信息录入与管理功能
同地图跟踪数字化一样,地图扫描数字化也需要录入图幅信息,以便于管理和质量控制。
8°
、要素编码设置功能
为了能进行属性编码的自动赋值,以及人机交互地进行属性编码赋值,都必须针对不同的要求进行地图要素的编码设置。
9°
为了进行数字化后的数据纠正,必须具有控制点输入功能。
3、属性数据的采集
属性数据在GIS中是空间数据的组成部分。
例如,道路可以数字化为一组连续的象素或矢量表示的线实体,并可用一定的颜色、符号把GIS的空间数据表示出来,这样,道路的类型就可用相应的符号来表示。
而道路的属性数据则是指用户还希望知道的道路宽度、表面类型、建筑方法、建筑日期、入口覆盖、水管、电线、特殊交通规则、每小时的车流量等。
这些数据都与道路这一空间实体相关。
这些属性数据可以通过给予一个公共标识符与空间实体联系起来。
属性数据的录入主要采用键盘输入的方法,有时也可以辅助于字符识别软件。
当属性数据的数据量较小时,可以在输入几何数据的同时,用键盘输入;
但当数据量较大时,一般与几何数据分别输入,并检查无误后转入到数据库中。
为了把空间实体的几何数据与属性数据联系起来,必须在几何数据与属性数据之间有一公共标识符,标识符可以在输入几何数据或属性数据时手工输入,也可以由系统自动生成(如用顺序号代表标识符)。
只有当几何数据与属性数据有一共同的数据项时,才能将几何数据与属性数据自动地连接起来;
当几何数据或属性数据没有公共标识码时,只有通过人机交互的方法,如选取一个空间实体,再指定其对应的属性数据表来确定两者之间的关系,同时自动生成公共标识码。
当空间实体的几何数据与属性数据连接起来之后,就可进行各种GIS的操作与运算了。
当然,不论是在几何数据与属性数据连接之前或之后,GIS都应提供灵活而方便的手段以对属性数据进行增加、删除、修改等操作。
4、数据格式转换
因GIS软件的原因,不同的GIS软件对空间数据定义和存储结构的差别,GIS数据库中的数据格式之间存在不兼容的问题。
即不同的GIS软件所支持的数据存储格式不能直接相互利用。
需经过格式转换才能相互被对方使用。
(1)数据格式转换的内容
数据格式转换的内容包括三个方面的内容:
Ø
空间定位信息,即几何信息,主要是实体的坐标。
空间关系信息,几何实体之间的拓扑或几何关系数据。
属性信息,几何实体的属性说明数据。
(2)数据格式转换的方式
A、通过外部数据交换文件进行。
大部分GIS工具软件都定义了外部交换文件格式,如:
ARCINFOE00;
MapInfoMID;
AutoCADDXF;
MGEASCIILoader等。
系统文件格式的转换需经过三次转换才能完成。
B、通过标准空间数据文件转换。
实现二次转换。
C、通过标准的API函数进行转换。
实现一次转换。
三、空间数据的基本操作算法
1、基本计算
(1)几何计算(距离、周长、面积、重心)。
(2)线目标基本操作算法
A、直线求交算法
B、曲线光滑处理算法(张力样条、多项式拟合等)
C、曲线简化(与B相反的操作)。
D、平行线处理
E、直角化处理
例:
p123~134(自学)。
2、多边形基本操作算法
p134~138(自学)
3、图形屏幕编辑的基本操作算法
图形编辑的关键是点、线、面的捕捉,即如何根据光标的位置找到需要编辑的要素,以及图形编辑的数据组织。
下面分别作简要介绍。
(1)点的捕捉算法
图形编辑是在计算机屏幕上进行的,因此首先应把图幅的坐标转换为当前屏幕状态的坐标系和比例尺。
设光标点为S(x,y),图幅上某一点状要素的坐标为A(X,Y),则可设一捕捉半径D(通常为3~5个象素,这主要由屏幕的分辩率和屏幕的尺寸决定)。
若S和A的距离d小于D则认为捕捉成功,即认为找到的点是A,否则失败,继续搜索其它点。
d可由下式计算:
但是由于在计算d时需进行乘方运算,所以影响了搜索的速度,因此,把距离d的计算改为:
即把捕捉范围由圆改为矩形,这可大大加快搜索速度.
(2)线的捕捉算法
设光标点坐标为S(x,y),D为捕捉半径,线的坐标为(x1,y1),(x2,y2),…(xn,yn)。
通过计算S到该线的每个直线段的距离di(如图4—11所示),若min(d1,d2,…dn-1)<D,则认为光标S捕捉到了该条线,否则为未捕捉到。
在实际的捕捉中,可每计算一个距离di就进行一次比较,若di<D,则捕捉成功,不需再进行下面直线段到点S的距离计算了。
为了加快线捕捉的速度,可以把不可能被光标捕捉到的线以简单算法去除。
如图,对一条线可求出其最大最小坐标值Xmin,Ymin,Xmax,Ymax,对由此构成的矩形再向外扩D的距离,若光标点S落在该矩形内,才可能捕捉到该条线,因而通过简单的比较运算就可去除大量的不可能捕捉到的情况。
对于线段与光标点也应该采用类似的方法处理。
即在对一个线段进行捕捉时,应先检查光标点是否可能捕捉到该线段。
即对由线段两端点组成的矩形再往外扩D的距离,构成新的矩形,若S落在该矩形内,才计算点到该直线段的距离,否则应放弃该直线段,而取下一直线段继续搜索。
如图4—13所示,点S(x,y)到直线段(x1,y1),(x2,y2)的距离d的计算公式为:
可以看出计算量较大,速度较慢,因此可按如下方法计算。
即从S(x,y)向线段(x1,y1)(x2,y2)作水平和垂直方向的射线,取dx,dy的最小值作为S点到该线段的近似距离。
由此可大大减小运算量,提高搜索速度。
计算方法为:
(3)面的捕捉算法
面的捕捉实际上就是判断光标点S(x,y)是否在多边形内,若在多边形内则说明捕捉到。
判断点是否在多边形内的算法主要有垂线法或转角法,这里介绍垂线法。
垂线法的基本思想是从光标点引垂线(实际上可以是任意方向的射线),计算与多边形的交点个数。
若交点个数为奇数则说明该点在多边形内;
若交点个数为偶数,则该点在多边形外。
为了加速搜索速度,可先找出该多边形的外接矩形,即由该多边形的最大最小坐标值构成的矩形,如图4—15。
若光标点落在该矩形中,才有可能捕捉到该面,否则放弃对该多边形的进一步计算和判断,即不需进行作垂线并求交点个数的复杂运算。
通过这一步骤,可去除大量不可能捕捉的情况,大大减少了运算量,提高了系统的响应速度。
在计算垂线与多边形的交点个数时,并不需要每次都对每一线段进行交点坐标的具体计算。
对不可能有交点的线段应通过简单的坐标比较迅速去除。
对图4—16所示的情况,多边形的边分别为1~8,而其中只有第3、7条边可能与S所引的垂直方向的射线相交。
即若直线段为(x1,y1)(x2,y2)时,若x1≤x≤x2,或x2≤x≤x1时才有可能与垂线相交,这样就可不对1,2,4,5,6,8边进行继续的交点判断了。
对于3、7边的情况,若y>y1且y>y2时,必然与S点所作的垂线相交(如边7);
若y<y1且y<y2时,必然不与S点所作的垂线相交。
这样就可不必进行交点坐标的计算就能判断出是否有交点了。
对于y1≤y≤y2或y2≤y≤y1,且x1≤x≤x2或x2≤x≤x1时,如图4—17。
这时可求出铅垂线与直线段的交点(x,y′),若y′<y则是交点;
若y′>y,则不是交点;
若y′=y则交点在线上,即光标在多边形的边上。
以上都是一些提高面捕捉算法的常用技术。
四、空间数据的错误检查
1、空间数据错的误类型
图形和属性数据的错误类型主要有:
空间数据的不完整或重复,包括点、线、面数据的丢失或重复,多边形中心点的遗漏,数据断线、多边形不封闭等。
空间数据位置不准确,点位不准确,线段过长或过短,结点不重合.。
比例尺不准确。
数据变形。
属性与空间数据连接错误。
属性不完整。
2、检查方法
无论是地图跟踪数字化还是地图扫描数字化,都不可能完全正确,因此,必须进行空间数据的检查。
常用的空间数据检查方法为:
、通过图形实体与其属性的联合显示,发现数字化中的遗漏、重复、不匹配等错误;
、在屏幕上用地图要素对应的符号显示数字化的结果,对照原图检查错误;
、把数字化的结果绘图输出在透明材料上,然后与原图叠加以发现错漏;
、对等高线,通过确定最低和最高等高线的高程及等高距,编制软件来检查高程的赋值是否正确;
、对于面状要素,可在建立拓扑关系时,根据多边形是否闭合来检查,或根据多边形与多边形内点的匹配来检查等;
、对于属性数据,通常是在屏幕上逐表、逐行检查,也可打印出来检查;
、对于属性数据还可编写检核程序,如有无字符代替了数字,数字是否超出了范围,等等;
、对于图纸变形引起的误差,应使用几何纠正来进行处理。
3、GIS支持数据检查的功能
GIS一般都能提供下列功能:
、符号设计与符号库建立功能。
为了能以不同符号表示不同类型的矢量数据,必须具有符号设计与符号库建立功能。
如新符号的创建、旧符号的修改等等。
、符号设置功能。
即为每一类空间数据指定选用的符号,包括符号的形状、色彩、尺寸、图案等。
、注记配置功能。
注记是地图上不可缺少的重要信息,也是数据检查的重要内容和参照信息。
注记应确定其字体、大小、间隔、色彩、排列、旋转等,最重要的确定其定位点。
、图形显示功能。
应能将所采集的矢量数据,以符号化的方式显示在屏幕上,并能进行放大、缩小、漫游、分层显示等操作。
、查询功能。
通过查询来发现问题,可以由几何数据查询其属性信息,也可由属性信息查询其空间数据。
、绘图输出功能。
即通过绘图机把所数字化的地图再以符号化的形式输出,这是数据检查的基本方法。
五、图形编辑
图形编辑的内容:
结点吻合
结点与线的吻合
清楚假结点
删除与增加角点
移动角点
删除与增加弧段
数据清理
更新数据
例:
p138~141(自学)
六、GIS空间数据的基本处理方法
由数据输入软件获取的图形数据在进入地理数据库之前还需进行一些图形处理,主要包括:
、几何变换处理。
包括几何纠正处理和坐标变换处理。
为了纠正由纸张变形所引起的数字化数据的误差,几何纠正要以控制点的理论坐标和数字化坐标为依据来进行。
坐标变换的目的是将不同坐标系的数据统一到一个共同坐标系的处理。
、投影变换处理。
为了GIS地理数据库中空间数据的一致性,须将原图投影下的矢量数据转换为地理坐标或指定投影下的数据。
、图形接边和拼接处理。
在相邻地图的接合处可能会产生裂隙。
包括几何裂隙和属性裂隙。
在自动接边无法处理时,需要人机交互进行。
接边处理完成后,还需要进行图幅的合并处理,以得到无缝图层。
4°
、图形图象的压缩处理。
5°
、数据格式的转换处理。
矢量数据格式和栅格数据格式的转换。
1、图形图象的几何变换处理
在图形编辑中,只能消除数字化产生的明显误差,而图纸变形产生的误差难以改正,因此要进行几何纠正。
几何纠正常用的有高次变换、二次变换和仿射变换。
(1)、高次变换
其中A、B代表二次以上高次项之和。
上式是高次变换方程,符合上式的变换称为高次变换。
(2)、二次变换
当不考虑高次变换方程中的A和B时,则变成二次变换方程,称为二次变换。
二次变换适用于原图有非线性变形的情况,至少需要5对控制点的坐标及其理论值,才能求出待定系数。
(3)、仿射变换
仿射变换是使用最多的一种几何纠正方式,只考虑到x和y方向上的变形,仿射变换的特性是:
·
直线变换后仍为直线;
平行线变换后仍为平行线;
不同方向上的长度比发生变化。
对于仿射变换,只需知道不在同一直线上的三对控制点的坐标及其理论值,就可求得待定系数。
但在实际使用时,往往利用4个以上的点进行纠正,利用最小二乘法处理,以提高变换的精度。
仿射变换常用于GIS的坐标变换。
如在数字化仪坐标和国家平面坐标之间的变换。
2、投影变换处理
当系统所使用的数据是来自不同地图投影的图幅时,需要将一种投影的几何数据转换成所需投影的几何数据,这就需要进行地图投影变换。
地图投影变换的实质是建立两平面场之间点的一一对应关系。
假定原图点的坐标为x,
y(称为旧坐标),新图点的坐标为X,Y(称为新坐标),则由旧坐标变换为新坐标的基本方程式为:
实现由一种地图投影点的坐标变换为另一种地图投影点的坐标就是要找出上述关系式,其方法通常分为三类:
A、解析变换法
这类方法是找出两投影间坐标变换的解析计算公式。
由于所采用的计算方法不同又可分为反解变换法和正解变换法。
反解变换法(又称间接变换法)。
这是一种中间过渡的方法,即先解出原地图投影点的地理λ,对于x,y的解析关系式,将其代入新图的投影公式中求得其坐标。
即:
正解变换法(又称直接变换法)。
这种方法不需要反解出原地图投影点的地理坐标的解析公式,而是直接求出两种投影点的直角坐标关系式。
B、数值变换法
如果原投影点的坐标解析式不知道,或不易求出两投影之间坐标的直接关系,可以采用多项式逼近的方法,即用数值变换法来建立两投影间的变换关系式。
例如,可采用二元三次多项式进行变换。
二元三次多项式为:
通过选择10个以上的两种投影之间的共同点,并组成最小二乘法的条件式,即:
其中:
n为点数,Xi,Yi为新投影的实际变换值,Xi′,Yi′为新投影的理论值。
根据求极值原理,可得到两组线性方程,即可求得各系数的值。
必须明确,实际中所碰到的变换,决定于区域大小,已知点密度,数据精度,所需变换精度及投影间的差异大小,理论和时间上决不是二元三次多项式所能概括的。
C、数值解析变换法
当已知新投影的公式,但不知原投影的公式时,可先通过数值变换求出原投影点的地理坐标φ,λ,然后代入新投影公式中,求出新投影点的坐标。
3、剪裁、拼接与合并处理
剪裁:
通过剪裁巨型或多边形进行
拼接:
几何接边
逻辑接边
合并:
图形合并
图幅合并(逻辑无缝合并,物理无缝合并)
物理合并:
(直接合并成一副连续图)
A1
A2
A3
A
逻辑合并(通过建立逻辑关系文件索引)