GIS复习资料.docx
《GIS复习资料.docx》由会员分享,可在线阅读,更多相关《GIS复习资料.docx(21页珍藏版)》请在冰豆网上搜索。
GIS复习资料
GIS复习资料
第—章地理信息系统概论
1.数据:
指输入到计算机并能被计算机进行处理的数字、文字、符号、声音、
图像等符号。
数据是对客观现象的表示,数据本身并没有意戈。
2.信息:
信息是现实世界在人们头脑中的反映。
它以文字、数据、符号、声音、
图像等形式记录下来,进行传递和处理,为人们的生产,建设,管理等提供依据。
具有客观性、适用性、传输性、共享性。
(◊数据与信息的关系:
数据是信息的表达、载体,信息是数据的内涵、是形鸟质的关系。
数据只有经过解释才有意义,成为信息。
)
3.地理数据:
地理特征和现象间关系的符号化描述。
基本特征:
空间特征、时间特征、属性特征。
4.地理信息:
地理信息是指与研究对象的空间地理分布有关的信息,它表示地理
系统诸要素的数量、质量、分布特征,相互联系和变化规律的图、文、声、像等的总称。
5.信息系统:
信息系统是具有数据采集、管理、分析和表达数据能力的系统,
它能够为单一的或有组织的决策过程提供有用的信息。
它能对数据和信息进行采棊、存储、加工和再现,具有采集、管理、分析和表达数据的能力。
主要由计算机硬件、软件、数据、用户四大要素组成。
信息系统的类型:
事务处理系统、信息管理系统、决策支持系统、人工智能和专家系统。
6.地理信息系统(GIS):
GIS是由计算机硬件、软件和不同的方法组成的系统,
该系统设计用来支持空间数据的采集、管理、处理、分析、建模和显示,以便解决复杂的规划和管理问题。
7.空间数据:
空间数据是地理信息的载体,是地理信息系统的操作对象,它具
体描述地理实体的空间特征、属性特征和时间特征。
空间特征走指地理实体的空间位置及其相互关系;
属性特征眾示地理实体的名称、类型和数量等;
时间特征箱实体随时间而发生的相关变化。
数据类型:
空间特征数据、时间属性数据、专题属性数据。
数据表达可以采用矢量和栅格两种组织形式,分别称为矢量数据结构和栅格数据结构。
PPT思考题:
1.什么是GIS它具有什么特点
GIS是由计算机硬件、软件和不同的方法组成的系统,该系统设计用来支持空间数据的采集、管理、处理、分析、建模和显示,以便解决复杂的规划和管理问题。
2.GIS与其它信息系统有什么区别
GIS是一种决策支持系统,它具有信息系统的各种特点。
地理信息系统与其他信息系统的主要区别在于其存储和处理的信息是经过地理编码的,数据具有空间分布的性质,地理位置及与该位置有关的地物属性信息成为信息检索的重要部分。
GIS是能对空间数据进行分析的DBMS:
GIS要对图形数据和属性数据库共同管理、分析和应用,MIS则只有属性数据库的管理,即使存贮了图形,也是以文件形式管理,图形要素不能分解、查询、没有拓扑关系;地图数据库仅仅是将数字地图有组织地存放起来,不注重分析和查询,它只是GIS的一个数扌居源。
3.简述GIS的构成。
计算机硬件、计算机软件(GIS专业软件、系统软件、数据库软件)、空间数据(地理信息的载体,是地理信息系统的操作对象,它具体描述地理实体的空间特征、属性特征和时间特沁、人员(包括系统开发、系统管理和使用人员)、应用模型。
4.简述OpenGIS的九层模型
(各种世界)
第二章空间数据模型
8.空间数据模型:
是关于现实世界中空间实体及其相互间联系的概念。
场模型表示了在二维或者三维空间中被看作是连续变化的数据。
基于对象(要素)的模型强调了离散对象,根据它们的边界线以及组成它们或者与它们相关的其它对象,可以详细地描述离散对象。
模型把信息空间分解为对象或实体。
一个实体必须符合三个条件:
可被识别、重要、可被描述。
网络模型表示了特殊对象之间的交互,如水或者交通流。
网络模型的基本特征是节点数据间没有明确的从属关系,一个节点可与其他多个节点相联系。
网状模型将数据组织成有向图结构。
9.空间自相关:
是空间场中的数值聚集程度的一种量度,描述了某一位置上的
属性值与相邻位置上的属性值之间的关系。
10.栅格数据模型:
基于连续铺盖(铺盖可以分为规则和不规则),将连续空间
离散化。
栅格模型把空间看作像元的划分,每个像元都记录了所在位置的某种现象,用像元值表示;地理实体的位置和状态是它们占据栅格的行列号来定艾的。
■
每个栅格的大小代表了定义的空间分辨率。
栅格模型的一个重要特征就是每个栅格中的像元的位置是预先确定的。
11.矢量数据模型:
12.拓扑关系:
指图形保持连续状态下变形,但图形关系不变的性质。
拓扑关联:
指存在于空间图形中的不同拓扑元素之间的关系。
(不同类)拓扑邻接:
指存在于空间图形中的相同拓扑元素之间的关系。
(同类)
拓扑包含:
指存在于空间图形中的面与其它元素之间的关系。
(不同级)
13.空间数据的拓扑关系对GIS的数据处理和空间分析具有重要意义
拓扑关系能清楚地反映实体之间的逻辑结构关系;
有助于空间要素的查询,利用拓扑关系可以解决许多实际问题:
根据拓扑关系可重建地理实体。
14.GIS中引入拓扑关系的优缺点
优点
描述点、线、面的空间关系不完全依赖于具体的坐标位置。
空间关系信息丰富、简洁,数据冗余小。
方便多边形和多边形的叠合。
便于检查数据输入过程中的错误。
缺点
拓扑关系建立过程比较复杂
数据结构本身复杂
TGIS技术的本质特点是''时空效率”。
当前主要的TGIS模型包括:
空间时间立方体模型(Space-timeCube);序列快照模型(SequentSnapshots):
基图修正模型(BaseStatewithAmendments):
空间时间组合体模型
(Space-timeComposite)。
TGIS模型研究两种思路:
综合模型和分解模型。
一个合理的时空模型考虑:
节省存储空间、加快存取速度、表现时空语艾。
16.八叉树
规则八叉树的存贮结构用一个有尤介芋授的记录来表示树中的每个结点。
线性八叉树注重考虑如何提高空间利用率。
用某一预先确定的次序遍历八叉树将八叉树转换成一个线性表,表的每个元素与一个结点相对应。
线性八叉树则只需要记录叶结点的地址码和属性值。
一是节省存储空间,因为只需对叶结点编码,节省了大量中间结点的存储。
每个结点的指针也免除了,而从根到某一特定结点的方向和路径的信息隐含在定位码之中,定位码数字的个位数显示分辨率的高低或分解程度;
其次,线性八叉树可直接寻址,通过其坐标值则能计算出任何输入结点的定位码(称编码),而不必实际建立八叉树,并且定位码本身就是坐标的另一种形式,不必有意去存储坐标值。
若需要的话还能从定位码中获取其坐标值(称解码);
第三,在操作方面,所产生的定位码容易存储和执行,容易实现集合、相加等组合操作;
PPT思考题:
1.何为场模型它和栅格数据模型有什么关系
2.何为要素模型它和矢量数据模型有什么关系
4
概念略。
场模型和要素模型类同于栅格数据模型和矢量数据模型,但前者是概念模型,
后者是指其在信息系统中的实现。
3.空间要素有哪些空间关系
地理要素之间的空间关系可抽象为点、线、多边形的空间几何关系,如点-点、点-线、点-面、线-线、线-面、面-面。
(空间关系包含三种基本类型:
拓扑关系、方向关系、度量关系。
)
4.什么是拓朴关系
指图形保持连续状态下变形,但图形关系不变的性质。
5.何为八叉树结构它主要用于什么目的
八叉树是一种用于描述三维空间的树状结构,每个节点有八个子节点,是二维四叉树的延伸。
第四章G/S中的数据
17.空间数据类型:
空间特征数据、时间属性数据、专题属性数据。
*18.数据的测量尺度,由粗到细依次为命名、次序、间隔、比例。
19.数据质量的基本概念:
准确性、精度、空间分辨率、比例尺、误差、不确性。
I
20.空间数据的不确定性:
包括空间位置的不确定、属性不确定、时域不确定、
逻辑上的不一致、数据的不完整性。
21.空间数据质量问题的来源:
空间现象自身存在的不稳定性、空间现象的表达、数据处理中的误差、数据使用中的误差。
22.元数据:
关于数据的描述性数据信息,尽可能多地反映数据集自身的特征规
律,以便于用户对数据集的准确、高效与充分的开发与利用。
目的:
促进数据集的高效利用,为计算机辅助软件工程(CASE)服务。
作用:
通过元数据可以检索、访问数据库,可以有效的利用计算机资源,可以对数据进行如工处理、质量控制,以及二次开发等。
■
获取方法:
键盘键入、关联表、测量法、计算法、推理法。
第五章空间数据获取
23.数字化是将地图上的空间特征转化成为用数字形式表示数据的过程。
在计算
机中,构成一幅地图的点、线、而各要素转化为X,Y坐标表示。
单个坐标代表一个点,一串坐标代表一条线,一条或多条线囲成一个区域(面或多边形)。
所以数字化是获取一系列点和线的过程。
方法:
数字化仪数字化、扫描数字化、屏幕跟踪数字化、格式转换数据。
数字化仪采用的数字化方式:
点方式和流方式。
流方式录入的点多于点方式,所以要根据采样原则进行实时采样以减少不必要的特征点。
常用的采样原则:
距离流方式、时间流方式。
数据压缩算法:
道格拉斯-普克法、垂距法、光栏法。
几种方法的比较:
大多数情况下道格拉斯——普克法的压缩算法较好,但必须在对整条曲线数字化完成后才能进行,且计算量较大;
光栏法的压缩算法也很好,并且可在数字化时实时处理,每次判斷下一个数字化的点,且计算量较小;
垂距法算法简单,速度快,但有时会将曲线的弯曲极值点P值去掉而失真。
扫描数字化:
纸地图——扫描转换——裁剪地图——图像处理矢量化一—矢量图合成——矢量图编辑;图像拼接、裁剪。
将栅格图像转换为矢量地图一般需要以下一系列步骤:
I
1)图像二值化(Threshold):
从原始扫描图像计算得到黑白二值图像(BinaryImage)。
2)平滑(Smooth):
图像平滑用于去除图像中的随机噪声,通常表现为斑点。
(毛刺、凹、洞)
3)细化:
细化将一条线细化为只有一个像素宽,细化是矢量化过程中的重要步骤,也是矢量化的基础。
(算法)
线细化:
就是不斷去除曲线上不影响连通性的轮廓像素的过程。
对细化的一般要求是:
保证细化E曲线的连通性:
细化结果是原曲线的中心线;保留细线端点。
细化算法对二值图像进行处理。
4)链式编码:
链式编码将细化后的图像转换成为点链的集合,其中每个点链对应于一条弧段。
(弗里曼码:
用曲线的出发点坐标和线的斜率来描
述二值线。
)
5)矢量线提取:
将每个点链转化成为一条矢量线。
每条线由一系列点组成,点的数目取决于线的弯曲程度和要求的精度。
(D-P)
24.图像拼接/裁剪:
(数据录入后的处理)
1)图像拼接:
以两相邻地图图像的部分重叠区为基础,把它们合成为一幅整图的过程。
2)图像裁剪:
把一幅图像裁成两两相邻的规则图块的过程称为地图裁劳。
PPT思考题:
1.假设一条矢量等高线上点过于密集,如何减少占用系统存储空间你能给出多少方法各有什么适用范围
f
2.二值图像的处理对于GIS有什么意义有哪些常用方法
3.为什么数字化地图进行编辑与处理后才能入GIS数据库数字化过程中哪些主要错误形式
第六章空间数据的管理
25.地理信息系统的数据库:
(简称空间数据库或地理数据库)是某一区域内关
于一定地理要素特征的数据集合。
特点:
数据量大、信息复杂:
数据记录是变长的;不仅存放属性数据,还存放空间数据,维护空间拓扑关系,实现对数据的关联、联通、包含、
叠加等操作;需要一些复杂的图形功能;数据应用广泛。
26.数据库(database,DB):
就是为一定目的服务,以特定的数据存储的相关联的数据集合,它是数据管理的高级阶段,是从文件管理系统发展而来的。
27.数据组织的分级
数据库中的数据组织一般可以分为四级:
数据项:
是可以定艾数据的最小单位,也叫元素、基本项、
字段等,不可分割,具有独立的逻辑意义。
记录:
由若干相关联的数据项(或数据项组)组成,是文件存储的慕本单位。
文件:
是一给定类型的(逻辑)邕垂的全部具体值的集合。
数据库:
数据库是具有特定联系的数据的集合,也可以看成是具有
特定联系的多种类型的记录的集合。
数据库的内部构造是文件的集合,这些文件之间存在某种联系,不能孤立存在。
28.常用数据文件:
顺序文件、索引文件、直接文件、倒排文件。
顺序文件:
是最简单的文件组织形式,对记录按照主关键字的顺
进行组织。
索引文件:
索引文件除了存储记录本身(主文件)以外,还建立了
若干索引表,这种带有索引表的文件叫索引文件。
索引表中列出记录关键字和记录在文件中的位置(地址)。
直接文件:
直接文件又称随机文件,其存储是根据记录关键字的值,
通过某种转换方法得到一个物理存储位置,然后把记录存储在该位置上。
倒排文件;是带有辅索引的文件,其中辅索引是按照一些辅关键
来组织索引的。
29.空间数据编码:
是空间数据结构的实现。
栅格结构的主要编码方式有直接栅格编码、链码、游程长度编码、块码、死叉树码等;
矢量数据结构主要有坐标序列编码、树状索引编码、二元拓扑编码等。
30.栅格数据结构:
栅格结构是最简单最直接的空间数据结构,是指将地球表面
划分为大小均匀紧密相邻的网格阵列,每个网格作为一个象元或象素由行、列定义,并包含一个代码表示该象素的属性类型或量值,或仅
仅包括指向其属性记录的指针。
点——用一个栅格单元表示:
线——沿线走向的一组相邻栅格单元表示,每个栅格单元最多只有
两个相邻单元在线上;
面——用记有区域属性的相邻栅格单元的集合表示,每个栅格单元
四叉树(具有可变分辨率)
基本思想:
将图像区域划分为四个大小相同的象限,而每个象限又可根据一定规则判断是否继续等分为次一层的四个象限,其终止判据是,不管是哪一层上的象限,只要划分到仅代表一种地物或符合既定要求的少数几种地物时,则不再继续划分,否则一直划分到单个栅格象元为止。
定义:
将2n2n像元阵列连续地进行4象限等分,一直分到子象限中像素值单调为止,这查即形成一颗四分叉的倒向树。
根:
整个区域;高:
深度、分几级,几次分割;叶:
不能再分割的块;树叉:
还需分割的块;每个树叉均有4个分叉,叫四叉树。
编码方法
四叉树编码要求图像必须为2nX2n的栅格阵列。
1)常规四叉树:
指针不仅增加了数据的存储量,而且增如了复杂性,常规四叉树并不广泛用于存储数据,其价值在于建立索引文件,进行数据检索。
2)线性四叉树:
记录叶结点的位置,深度(几次分割)和属性。
地址码:
Morton码、四进制码、十进制码。
Morton码(四进制):
码的位数表示分割的次数:
每一个位均是不大于3的四进制数,表达位置。
Morton码(十进制):
行列号二进制表示,交叉,转换为十进制
具有以下优点:
存贮量小,只对叶结点编码,节省了大量中间结点的存储,地址码隐含着结点的分割路径和分割次数。
线性四叉树可直接寻址,通过其坐标值直接计算Morton码,而不用建立四叉树。
定位码容易存储和执行实现集合相加等组合操作。
四叉树优缺点
优点:
1)对于团块图像,四叉树表示法占用空间比其他表示法要少得多,四叉树表示法基本上是一种非冗余表示法。
2)四叉树特别适用于处理分布不均匀的块状空间数据,但不适用于连续表面(如地形)或线状地物。
缺点:
1)栅矢转换不理想;
2)建立四叉树费时、修改四叉树困难:
3)四叉树未能直接表示物体的拓扑关系;
4)-
5)转换时发生滑动异变;
6)一个物体的图像在构成四叉树时会被分割到若干个象限中,使它失去了内在的相关性。
33.矢量数据结构:
通过记录坐标的方式,尽可能精确地表示点、线和多边形等地理实体,坐标空间设为连续,允许任意位置、长度和面积的精确定艾。
点——由一对X、Y坐标表示;
线——由一串的X、Y坐标表示;
面——由一串或几串有序且首尾坐标相同的坐标对及面标识表示。
矢量数据的获取方式:
由外业测量获得、由栅格数据转换获得、跟踪数字化;
矢量数据的特点:
定位明显,属性隐含:
其定位是根据坐标直接存储的,而属性则一般存于文件头或数据结构中某些特定的位置上,
34.矢量编码方法
坐标序列法、树状索引编码法、拓扑结构编码法。
坐标序列法只记录空间对象的位置坐标和属性信息,不记录拓扑关系。
这种方法可用于简单的粗精度制图系统中。
无拓扑关系,主要用于显示、输出及一般查询
多边形之间的公共边界被数字化和存储两次,由此产生冗余和碎屑多边形;
每个多边形自成体系而缺少邻域信息,难以进行邻域处理,如消除某两个多边形之间的共同边界;
岛只作为一个单个的图形建造,没有与外包多边形的联系;不易检查拓扑错误。
树状索引编码对所有边界点进行数字化,将坐标对以顺序方式存储,由点索引与边界线号相联系,以线索引与各多边形相联系,形成树状索引结构。
树状索引减少了数据冗余并间接增加邻域信息。
柘扑结构编码解决邻域和岛状信息处理问题。
完整的拓扑关系结构,这种结构应包括以下内容:
唯一标识,多边形标识,外包多边形指针,邻接多边形指针,边界链接,范围(最大和最小x、y坐标值)。
双重独立式编码:
线号-左多边形-右多边形-起点-终点
链式双重独立式编码:
每个弧段可以有中间点,数据结构中含有四个文件:
多边形文件、弧段文件、弧段坐标文件、节点文件。
35.栅矢比较:
优点
缺点
数据结构复杂
多边形叠加分析比较困难
矢量数据1.数据结构紧凑、冗余度低1.
2.有利于网络和检索分析2.
3.图形显示质量好、精度高
[1.数据结构简单1.数据量大
栅格数据2.便于空间分析和地表模拟2.投影转换比较复杂
3.现勞性较强
36.栅格向矢量转换:
1)多边形边界提取:
采用高通滤波将栅格图像二值化或以特殊值标识边界点;
2)边界线追踪:
对每个边界弧段由一个结点向另一个结点搜索,通常对每个已知边界点需沿除了进入方向的其他7个方向搜索下一个点,直到连成边界弧段;
3)拓扑关系生成:
对于矢量表示的边界弧段数据,判斷其与原图上各多边形的空间关系,以形成完整的拓扑结构并建立与属性数据的联系;
4)去除多余点及曲线圆滑:
由于搜索是逐个栅格进行的,必须去除由此造成的多余点记录,以减少数据冗余;搜索结果,曲线由于栅格精
[
度的限制可能不够圆滑,需采用一定的插补算法进行光滑处理。
37.空间索引:
就是指依据空间对象的位置和形状或空间对象之间的某种空间
关系按一定的顺序排列的一种数据结构,其中包含空间对象的槪要信息,如外包矩形、对象标识、指向空间实体的指针。
空间索引作为一种辅助数扌居结构,介于操作算法与空间对象之间。
方法:
格网型空间索引、BSP树、KDB树、R树、R+树、CELL树。
38.空间查询:
在GIS中根据一定的图形条件或属性条件或两者的结合条件,检
索出对应的空间对象的属性或图形的一种工具。
<
空间数据查询的种类:
几何参数查询、空间定位查询、空间关系查询、属性查询。
PPT思考题:
1.空间实体可抽象为哪几种基本类型它们在矢量数据结构和栅格数据结构分别是如何表示的
矢量数据结构:
点——由一对X、Y坐标表示:
线——由一串的X、Y坐标表示;
面——由一串或几串有序且首尾坐标相同的坐标对及面标识表示。
%
栅格数据结构:
点——用一个栅格单元表示;
线——沿线走向的一组相邻栅格单元表示,每个栅格单元最多只有两个相邻单元在线上;
面——用记有区域属性的相邻栅格单元的集合表示,每个栅格单元可有多于两个的相邻单元同属一个区域。
2.叙述栅格数据存储的压缩编码方法。
数据压缩编码用尽可能少的数据量记录尽可能多的信息,分为信息有
损编码和信息无损编码。
常用方法有链码、游程长度编码、块码、四叉树码。
链码即弗里曼链码;
游程长度编码:
按行或列扫描,将相邻等值的像元合并,并记录代码的重复个数。
一种编码方案是只在各行(或列)数据的代码发生变化时依次记录该代码以及相同的代码重复的个数(代码、个数);另一种编码方法是逐个记录各行(或.列)代码发生变化的位置和相应代码(位置,代码)。
(解码难)
块码是游程长度编码扩展到二维的情况,釆用方形区域作为记录单元,每个记录单元包括相邻的若干栅格,数据结构由初始位置(行、列号)和半径,再加上记录单元的代码组成。
(具有可变分辨率)四叉树(具有可变分辨率)将图像区域划分为四个大小相同的象限,而每个象限又可根据一定规则判断是否继续等分为次一层的四个限,其终止判据是,不管是哪一层上的象限,只要划分到仅代表一种地物或符合既定要求的少数几种地物时,则不再继续划分,否则一直划分到单个栅格象元为止。
3.-
4.试列表比较栅格和矢量数据结构的优缺点。
(见35)
5.叙述由矢量数据向栅格数据的转换的方法。
6.叙述由栅格数据向矢量数据的转换的方法。
(见36)
7.什么是空间索引简述有哪些空间索引方法。
(见37)
第七章空间分析
39.空间分析:
是对分析空间数据有关技术的统称。
根据作用的数扌居性质不同,可以分为:
基于空间图形数据的分析运算,基于非空间属性的分析运算,空间和非空间数据的联合运算。
*-
*空间查询与量算:
空间分析定量基础
39.空间查询:
在GIS中根据一定的图形条件或属性条件或两者的结合条件,检索出对应的空间对象的属性或图形的一种工具。
空间查询方式:
基于空间关系查询、恳于空间关系和属性特征查询(扩展SQL)、地址匹配查询。
40.空间数据查询语言:
是通过对标准SQL的空来形成的,即在数据库查询语言上如入空间关系查询。
为此需要增加空间数据类型(如点、线、而等)和空间操作算子(如求长度、而积、叠如等)。
在给定查询条件时也需含有空间概念,如距离、邻近、叠加等。
*空间变换
41.空间变换:
为了满足特定空间分析的需要,需对原始图层及其属性进行一系
列的逻辑或代数运算,以产生新的具有特殊意艾的地理图层及其属性,这个过程称为空间变换。
栅格结构空间变换分为单点变换、领域变换、区域变换。
4-缓冲区分析
42.缓冲区:
所谓缓冲区就是地理空间目标的一种影响范围或服务范围。
缓冲
区分析的基本思想是给定一个地理空间对象或集合,确定他们的邻域,大小由邻域半径R确定。
缓冲区计算的基本问题是双线问题(图形加粗、加宽线、中心线扩张)。
角平分线法、凸角圆弧法(凹凸性判斷)。
43.自相交多边形:
进行缓冲区算法时,当轴线的弯曲空间不容许双线的边线
无压盖通过时,就会产生自相交多边形。
自相交多边形分为两种情况:
岛屿多边形和重叠多边形。
岛屿多边形是缓冲区边线的有效组成部分;重叠多边形不是缓冲区边线的有效组成,不参与缓冲区边线的最终重构。
<
岛屿多边形和重叠多边形的自动判别方法,首先定狡轴线坐标点序为其方向,缓冲区双线分成左右边线,左右边线自相交多边形的判别情形恰好对称。
对于左边线,岛屿自相交多边形呈逆时针方向,重叠自相交多边形呈顺时针方向;对于右边线,岛屿多边形呈顺时针方向,重叠多边形呈逆时针方向。
44.叠加分析:
将有关主题层组成的数据层面进行叠加产生一个新的数据层面
的操作,其结果包含了原来两层或多层元素的所有的属性。
叠加分析不仅包含空间关系的比较,还包含空间属性的比较。
(
叠加分析包括视觉信息叠加、点与多边形叠加、线与多边形叠加、多边形与多边形叠加、栅格图层叠加。
45.重分类是将属性数据的类别合并或转换成新类。
即对原来数据中的多种属
性类型,按照一定的原则进行重新分类,以利于分析。
I网