gis复习.docx
《gis复习.docx》由会员分享,可在线阅读,更多相关《gis复习.docx(20页珍藏版)》请在冰豆网上搜索。
gis复习
第一章概论-----什么是地理信息系统
1地理信息系统(GeographicInformationSystem或Geo-Informationsystem,GIS)有时又称为“地学信息系统”或“资源与环境信息系统”。
是在计算机硬、软件系统支持下,对整个或部分地球表层(包括大气层)空间中的有关地理分布数据进行采集、储存、管理、运算、分析、显示和描述的技术系统。
2GIS的组成:
硬件系统
软件系统
空间数据
系统开发、管理和使用人员
3GIS的功能:
空间数据的获取(采集与输入)
空间数据的编辑处理
空间数据的组织、存储与管理
空间查询与空间分析
数据的显示与输出
第二章地理空间信息表达及空间数据结构
1“地理空间”一般包括地理空间定位框架及其所连接的空间对象;
(1)地理空间定位框架即大地测量控制,由平面控制网和高程控制网组成;----坐标、高程
目前,我国采用的大地坐标系为1980年中国国家大地坐标系现在规定的高程起算基准面为1985国家高程基准。
(2)空间对象:
指具有形状、属性和时序特点的空间实体,包括点、线、面、曲面和体
2空间对象一般按地形维数进行归类划分:
(1)点:
零维
(2)线:
一维
(3)面:
二维
(4)体:
三维
(5)时间:
通常以第四维表达,但目前GIS还很难处理时间属性。
空间对象的维数与比例尺是相关的。
3对现实世界的各类空间对象的表达有两种方法,分别称为矢量表示法(矢量数据模型)和栅格表示法(栅格数据模型)。
4空间对象的三大基本特征:
空间特征、属性和时间特征。
属性特征:
描述空间对象的特性,即是什么,如对象的类别、等级、名称、数量等。
空间特征:
描述空间对象的地理位置以及相互关系,又称几何特征和拓扑特征,前者用经纬度、坐标表示,后者如交通学院与电力学院相邻等。
时间特征:
描述空间对象随时间的变化
5元数据指解释说明其他数据的数据。
6矢量数据结构是利用欧几里得几何学中的点、线、面及其组合体来表示地理实体空间分布的一种数据组织方式。
7栅格数据结构指将空间分割成各个规则的网格单元,然后在各个网格单元内赋以空间对象相应的属性值的一种数据组织方式;
8栅格数据的编码方式:
游程长度编码
其编码方案是,
(1)只在各行(或列)数据的代码发生变化时依次记录该代码以及相同代码重复的个数,从而实现数据的压缩。
例如对图3-6(a)所示的栅格数据,可沿行方向进行如下游程长度编码:
(2)将原始栅格矩阵中属性值相同的连续若干个栅格单元映射为一个游程,每个游程的数据结构为(A,P)整数对,A代表属性值或属性值的指针,P代表游程最右端栅格的列号。
四叉树编码
四又树结构的基本思想是将一幅栅格地图或图像等分为四部分。
逐块检查其格网属性值(或灰度)。
如果某个子区的所有格网值都具有相同的值。
则这个子区就不再继续分割,否则还要把这个子区再分割成四个子区。
这样依次地分割,直到每个子块都只含有相同的属性值或灰度为止。
9栅格数据结构:
单元值确定
中心点法——以网格中心点对应的属性值来确定
重要性——具有特殊意义的较小地物
面积占优——在该网格单元中占据最大面积的属性值来确定
百分比法
长度占优法——以网格中线的大部分长度所对应的属性值来确定
10矢量数据
优点:
•表示地理数据的精度较高
•严密的数据结构,数据量小
•完整的描述空间关系
•图形输出精确美观
•图形数据和属性数据的恢复、更新、综合都能实现
•面向目标,不仅能表达属性,而且能方便的记录每个目标的具体属性信息
缺点:
•数据结构复杂
•矢量叠置较为复杂
•数学模拟比较困难
•技术复杂,特别是软硬件
栅格数据
优点:
•数据结构简单
•空间数据的叠置和组合方便
•各类空间分析很易于进行
•数学模拟方便
缺点:
•图形数据量大
•用大像元减少数据量时,精度和信息量受损
•地图输出不美观
•难以建立网络连接关系
•投影变换比较费时
第三章GIS的地理数学基础
1GIS的地理数学基础主要包括:
(1)统一的地图投影系统
(2)统一的地理网格坐标系统
(3)统一的地理编码系统
2我国的大地坐标系
(1)1954年北京坐标系
选用克拉索夫斯基椭球体参数,大地原点是前苏联玻尔可夫天文台);
(2)1980年西安坐标系,它们均属参心大地坐标系
选用1975年国际大地测量协会推荐的椭球体参数(ICA-75),大地原点在陕西泾阳县永乐镇的北洪流村。
3我国的高程系
中国高程起算面是黄海平均海水面。
(1)1956年黄海高程系:
1956年在青岛观象山设立了水准原点,其他各控制点的绝对高程均是据此推算,称为1956年黄海高程系。
基于1956年黄海高程系,水准原点的高程为72.289米。
(2)1985国家高程基准
1987年国家测绘局公布:
启用《1985国家高程基准》取代《黄海平均海水面》其比《黄海平均海水面》上升29毫米。
基于1985国家高程基准,水准原点的高程为72.260米。
4我国基本比例尺地形图(1:
100万、1:
50万、1:
25万、1:
10万、1:
5万、1:
2.5万、1:
1万、1:
5000)除1:
100万以外均采用高斯-克吕格投影为地理基础;1:
100万地形图采用Lambert投影。
1:
2.5万至1:
50万的地形图采用6°分带方案。
从格林尼治0°经线开始,全球共分为60个投影带。
我国位于东经72°到136°之间,共11个投影带(13-22带)。
1:
1万以及更大比例尺地图采用3°分带方案。
5高斯——克吕格投影(横轴等角切圆柱投影)
条件:
中央经线和地球赤道投影成为直线且为投影的对称轴;
等角投影;
中央经线上没有投影变形;
特点:
Ø中央经线上没有变形
Ø同一条纬线上,离中央经线越远,变形越大
Ø同一条经线上,纬度越低,变形越大
6空间数据的编码:
是指将数据分类的结果,用一种易于被计算机和人识别的符号系统表示出来的过程,编码的结果是形成代码。
代码由数字或字符组成。
第四章空间数据的获取与输入
1数据的规范化和标准化
一、统一的地理基础
统一的地图投影系统
统一的地理网格坐标系统
统一的地理编码系统,
二、统一的分类编码原则
科学性、系统性、实用性、统一性、完整性、可扩充行。
既要考虑率本身的属性,也要顾及信息之间的相互关系,保证分类代码的唯一性和稳定性。
三、数据交换格式标准
规定数据交换时的数据记录方式----简单适用,便于修改、扩充,便于数据交换
四、标准的数据采集技术规范
(1)图形数据采集技术流程
(2)摄影测量数据采集技术流程
——设备要求、作业步骤、质量控制、数据记录格式、数据库管理及产品验收。
(3)遥感影像数据采集技术流程和地质数据采集技术流程
2空间数据的输入方法:
一、空间数据的输入
键盘输入:
----位置信息(坐标)
手扶跟踪数字化仪输入:
---矢量图
扫描仪输入:
——栅格图
现有数据转换:
二、非空间属性数据的输入
在图形适当位置健入、现有数据库
三、空间数据与非空间属性数据的连接
——用唯一的标示符(公共字段)
第五章空间数据的处理
1空间数据处理功能:
空间数据的编辑
空间数据的坐标变换
空间数据结构的转换
空间数据的压缩与综合
空间数据的内插方法
图幅数据边沿匹配处理
2空间插值——将离散点的测量数据转换为连续的数据曲面的过程,它包括了空间内插和外推两种算法。
3空间插值的理论假设
其理论假设是空间位置上越靠近的点,越可能具有相似的特征值;而距离越远的点,其特征值相似的可能性越小。
算法
(1)空间内插算法:
通过已知点的数据推求同一区域其它未知点数据;
(2)空间外推算法:
通过已知区域的数据,推求其它区域数据的方法。
4空间插值方法
(1)整体插值:
用研究区域所有采样点的数据进行全区域特征拟合,如边界内插法、趋势面分析等。
(2)部分插值:
仅仅用邻近的数据点来估计未知点的值,如最邻近点法(泰森多边形方法)、移动平均插值方法(距离倒数插值法)、样条函数插值方法、空间自协方差最佳插值方法(克里金插值)等。
5趋势面面分析:
思路:
某种地理属性在空间的连续变化,可以用一个平滑的数学平面加以描述。
即先用已知采样点数据拟合出一个平滑的数学平面方程,再根据该方程计算无测量值的点上的数据。
它的理论假设是地理坐标(x,y)是独立变量,属性值Z也是独立变量且是正态分布的,同样回归误差也是与位置无关的独立变量。
是一种多项式回归分析技术,用多项式表示线或面,按最小二乘法原理对数据点进行拟合。
1)线性回归:
或
2)数据是二维的
6双三次多项式(样条函数)内插
将内插点周围的16个点的数据带入多项式,可计算出所有的系数。
特点:
内插速度很快可用于精确的内插,可用于平滑处理
7加权移动平均法:
λi是采样点i对应的权值
加权平均内插的结果随使用的函数及其参数、采样点的分布、窗口的大小等的不同而变化。
通常使用的采样点数为6—8点。
对于不规则分布的采样点需要不断地改变窗口的大小、形状和方向,以获取一定数量的采样点。
第六章GIS空间数据库
1地理信息系统的数据库(以下称为空间数据库)是某区域内关于一定地理要素特征的数据集合。
空间数据库的特点:
1)数据量特别大;
2)不仅有地理要素的属性数据,还有大量的空间数据,并且两者之间具有不可分割的联系;
3)数据应用广泛,如:
地理研究,环境研究,土地利用与规划,资源开发、生态环境、市政管理、道路建设等。
2传统空间数据模型
面向记录的传统数据模型:
它们以记录为单位构造数据模型,如数据库中常用的层次模型、网状模型和关系模型等。
一、层次模型
是一种树结构模型,把数据按自然的层次组织起来,以反映数据的隶属关系。
特点是地理数据组织成有向有序的树结构,也叫树形结构。
结构中的结点代表数据记录,连线描述位于不同结点数据间的从属关系(一对多的关系)。
层次模型反映了地理世界中实体之间的层次关系,在描述地理世界中自然的层次结构关系时简单、直观,易于理解,并在一定程度上支持数据的重构。
它用于GIS地理数据库存在的主要问题是:
1)很难描述复杂的地理实体之间的联系,描述多对多的关系时导致物理存储上的冗余;
2)对任何对象的查询都必须从层次结构的根结点开始,低层次对象的查询效率很低,很难进行反向查询;
3)数据独立性较差,数据更新涉及许多指针,插入和删除操作比较复杂,父结点的删除意味着其下层所有子结点均被删除;
4)层次命令具有过程式性质,要求用户了解数据的物理结构,并在数据操纵命令中显式地给出数据的存取路径;
5)基本不具备演绎功能和操作代数基础
二、网状模型
将数据组织成有向图结构(系结构),图中的结点代表数据记录,连线描述不同结点数据间的联系。
模型特点:
允许有一个结点无双亲;一个结点可以有多于一个的双亲(多对多)即:
结点数据之间没有明确的从属关系,一个结点可与其它多个结点建立联系,即结点之间的联系是任意的,任何两个结点之间都能发生联系,可表示多对多的关系
网状模型是层次模型的一般形式,反映了地理世界中常见的多对多关系,在一定程度上支持数据的重构,具有一定的数据独立和数据共享特性,且运行效率较高。
用于GIS地理数据库的主要问题如下:
1)由于网状结构的复杂性,增加了用户查询的定位困难,要求用户熟悉数据的逻辑结构,知道自己所处的位置;
2)网状数据操作命令具有过程式性质,存在与层次模型相同的问题;
3)不直接支持对于层次结构的表达;
4)基本不具备演绎功能和操作代数基础。
三、关系数据模型
用表格数据表示实体和实体之间关系的数据模型,表为二维表,满足一定的条件。
特点:
数据结构单一,是一种二维表格结构。
学号
姓名
性别
年龄
系号
毕业学校
张三
男
18
01
中大附中
李四
女
17
02
六十六中
关系模型用于GIS地理数据库的局限性
1)无法用递归和嵌套的方式来描述复杂关系的层次和网状结构,模拟和操作复杂地理对象的能力较弱;
2)用关系模型描述本身具有复杂结构和涵义的地理对象时,需对地理实体进行不自然的分解,导致存储模式、查询途径及操作等方面均显得语义不甚合理;
3)由于概念模式和存储模式的相互独立性,及实现关系之间的联系需要执行系统开销较大的联接操作,运行效率不够高。
不难看出,关系模型的根本问题是不能有效地管理复杂地理对象。
3面向对象的数据模型
基本思想
基本出发点就是尽可能按照人类认识世界的方法和思维方式来分析和解决问题。
客观世界是由许多具体的事物或事件、抽象的概念、规则等组成的。
因此,我们将任何感兴趣或要加以研究的事物概念都统称为“对象”(或称目标)。
无论怎样复杂的事例都可以准确地由一个对象表示,这个对象是一个包含了数据集和操作集的实体。
面向对象方法有抽象性、封装性、多态性等特性。
4GIS中空间数据库的组织方式
一、混合结构模型(HybridModel)
1、基本思想:
用两个子系统分别存储和检索空间数据与属性数据,其中属性数据存储在常规的RDBMS中,几何数据存储在空间数据管理系统中,两个子系统之间使用一种标识符联系起来。
在检索目标时必须同时询问两个子系统,然后将它们的回答结合起来。
2、优缺点:
结构模型的一部分建立在标准RDBMS之上,故存储和检索数据比较有效、可靠。
但由于使用两个存储子系统,它们有各自的规则,查询操作难以优化,存储在RDBMS外面的数据有时会丢失数据项的语义;此外,数据完整性的约束条件有可能遭破坏,例如在几何空间数据存储子系统中目标实体仍然存在,但在RDBMS中却已被删除。
二、扩展结构模型(ExtendedModel)
1、基本思路:
采用同一DBMS存储空间数据和属性数据,其做法是在标准的关系数据库上增加空间数据管理层,即利用该层将地理结构查询语言(GeoSQL)转化成标准的SQL查询,借助索引数据的辅助关系实施空间索引操作。
2、优缺点:
优点是省去了空间数据库和属性数据库之间的繁琐联结,空间数据存取速度较快,但由于是间接存取,在效率上总是低于DBMS中所用的直接操作过程,且查询过程复杂。
三、统一模数据型(IntegratedModel)
1、基本思路:
不是基于标准的RDBMS,而是在开放型DBMS基础上扩充空间数据表达功能。
空间扩展完全包含在DBMS中,用户可以使用自己的基本抽象数据类型(ADT)来扩充DBMS。
2、优缺点:
在核心DBMS中进行数据类型的直接操作很方便、有效,并且用户还可以开发自己的空间存取算法。
该模型的缺点是,用户必须在DBMS环境中实施自己的数据类型,对有些应用将相当复杂。
第七章空间分析
1空间分析功能:
空间查询与量算
缓冲区分析
叠加分析
网络分析
空间统计分类分析
空间插值
空间建模与空间决策支持
2空间查询
(一)查询类型:
属性查图形:
按属性信息的要求来查询定位空间位置,称为“属性查图形”
图形查属性:
根据对象的空间位置查询有关属性信息,称为“图形查属性”。
(二)查询方式:
大多数GIS中,提供的空间查询方式有:
(1)基于空间关系查询:
这里的空间关系包括拓扑、顺序、距离、方位
(2)基于空间关系和属性特征查询
(3)地址匹配查询
3缓冲区就是地理空间目标的一种影响范围或服务范围。
具体指在点、线、面实体的周围,自动建立的一定宽度的多边形。
缓冲区分析作用:
解决求地理实体的影响范围,即邻近度问题。
邻近度(Proximity)描述了地理空间中两个地物距离相近的程度,是空间分析的一个重要手段。
4叠加分析是将同一地区的两组或两组以上的要素(地图)进行叠置,产生新的特征(新的空间图形或空间位置上的新属性的过程)的分析方法。
点与多边形叠加,实际上是计算多边形对点的包含关系。
通过点与多边形叠加,可以计算出每个多边形类型里有多少个点,不但要区分点是否在多边形内,还要描述在多边形内部的点的属性信息。
通常不直接产生新数据层面,只是把属性信息叠加到原图层中,然后通过属性查询间接获得点与多边形叠加的需要信息
算法:
判断点是否落入多边形
线与多边形的叠加,是比较线上坐标与多边形坐标的关系,判断线是否落在多边形内。
计算过程通常是计算线与多边形的交点,只要相交,就产生一个结点,将原线打断成一条条弧段,并将原线和多边形的属性信息一起赋给新弧段。
算法:
线的多边形裁剪。
多边形叠加将两个或多个多边形图层进行叠加产生一个新多边形图层的操作,其结果将原来多边形要素分割成新要素,新要素综合了原来两层或多层的属性。
应用:
寻求和确定同时具有几种属性的分布区域
5网络分析就是依据网络拓扑关系(线性实体之间、线性实体与节点之间、节点与节点之间的连通和连接关系),通过考察网络元素的空间和属性数据,对网络的性能特征进行多方面的分析计算。
网络分析的根本目的是研究、筹划一项网络工程如何安排,并使其运行效果最好。
例如一定资源的最佳分配,从一地到另一地的运输费用最低等。
6网络数据模型的组成
1、网线或链(Link)
网线构成网络的骨架,是资源传输或通信联络的通道。
如街道、河流、水管、铁路、公路、航线等,其状态属性包括阻力和需求。
2、结点(Node)--节点
网络中链的结点,是网线的端点,又是网线的汇合点,如港口、车站、电站、河流汇合点等,其状态属性包括阻力和需求等。
结点中的几种特殊的类型
(1)障碍(Barrier),对资源传输和通信联络起阻碍作用的点。
如:
被破坏的桥梁、静止通行的港口
(2)拐弯(Turn),在网络链中的分割结点,状态属性有阻力,如拐弯的时间和限制(如在8:
00到18:
00不允许左拐)。
(3)中心(Center),是接受或分配资源的位置,如水库、商业中心、电站等,其状态属性包括资源容量(如总量),阻力限额(中心到链的最大距离或时间限制)。
(4)站点(Stop),也叫停靠点。
在路径选择中资源增减的结点,如库房、车站、电厂等,其状态属性有资源需求,如产品数量。
8主要网络分析功能
(一)路径分析
1、最短路径分析含义:
在网络中从起点经一系列特定的结点至终点的资源运移的最佳路线,即阻力最小的路径。
2、核心算法
求两点间的权数最小路径,常用的算法是Dijkstra。
——距离最短或用时最短
3、路径分析的内容
1)静态求最佳路径:
在给定每条链上的属性后,求两点间最佳路径。
2)N条最佳路径分析:
确定起点或终点,求代价最小的N条路径,以供选择。
3)最短路径或最低耗费路径:
确定起点、终点和要经过的中间点、中间连线,求最短路径或最小耗费路径。
4)动态最佳路径分析:
网络中每条链上的属性是动态变化的,而且可能出现一些临时障碍点,需要动态求最佳路径。
(二)资源分配
——为网络中的网线和结点寻找最近的中心(资源发散或汇集地)。
(三)连通分析——最小生成树
分析从一节点出发所能到达的全部节点或网线。
类似在n个城市间建立通信线路这样的连通分析问题。
图的顶点表示城市,边表示两城市间的线路,边上所赋的权值表示代价。
(四)流分析
按照某种优化标准(时间最少、费用最低、路程最短或运送量最大等)设计资源的运送方案。
9空间建模与空间辅助决策是针对具体的应用领域存在的空间分析问题而采取的解决手段:
采用各种简单或复杂的空间分析操作,建立空间分析模型。
空间建模一般步骤
1、确定目标和评价准则
2、准备分析数据
3、建立模型
3、寻求手段
4、结果评价
空间建模应用
–最佳路径、选址、定位分析、资源分配等
第八章:
数字地形模型(DTM)与地形分析
14D:
DLG(数字线划图)、DOM(数字正射影像)、DEM(数字高程模型)、DTM(数字地形模型)
2DTM是地形表面形态属性信息的数字表达,是带有空间位置特征和地形属性特征的数字描述。
3DTM模型中地形属性为高程时称为数字高程模型(DEM)。
DEM通常用地表规则网格单元构成的高程矩阵表示,广义的DEM还包括等高线、三角网等所有表达地面高程的数字表示。
4DEM的表示法
1、数学方法
用数学方法来表达,可以采用整体拟合方法,,也可用局部拟合方法。
2、图形方法
(1)线模式
等高线是表示地形最常见的形式。
其它的地形特征线也是表达地面高程的重要信息源,如山脊线、谷底线、海岸线及坡度变换线等。
(2)点模式
用离散采样数据点建立DEM是DEM建立常用的方法之一。
数据采样可以按规则格网采样,可以是密度一致的或不一致的;可以是不规则采样,如不规则三角网、邻近网模型等;也可以有选择性地采样,采集山峰、洼坑、隘口、边界等重要特征点。
5DEM的主要表示模型
一、规则格网模型
1、表示方法:
规则网格,通常是正方形,也可以是矩形、三角形等规则网格。
规则网格将区域空间切分为规则的格网单元,每个格网单元对应一个数值。
数学上可以表示为一个矩阵,在计算机实现中则是一个二维数组。
每个格网单元或数组的一个元素,对应一个高程值。
2、优缺点:
优点是可以很容易地用计算机进行处理,还可以很容易地计算等高线、坡度坡向、山坡阴影和自动提取流域地形,使得它成为DEM最广泛使用的格式。
缺点是①不能准确表示地形的结构和细部。
为避免这些问题,可采用附加地形特征数据,如地形特征点、山脊线、谷底线、断裂线,以描述地形结构。
②数据量过大,给数据管理带来了不方便,通常要进行压缩存储。
二、等高线模型
三、不规则三角网(TIN)模型
TIN模型根据区域有限个点集将区域划分为相连的三角面网络,区域中任意点落在三角面的顶点、边上或三角形内。
如果点不在顶点上,该点的高程值通常通过线性插值的方法得到(在边上用边的两个顶点的高程,在三角形内则用三个顶点的高程)。
所以TIN是一个三维空间的分段线性模型,在整个区域内连续但不可微。
不规则三角网数字高程由连续的三角面组成,三角面的形状和大小取决于不规则分布的测点,或节点的位置和密度。
不规则三角网与高程矩阵方法不同之处是随地形起伏变化的复杂性而改变采样点的密度和决定采样点的位置,因而它能够避免地形平坦时的数据冗余,又能按地形特征点如山脊、山谷线、地形变化线等表示数字高程特征
6DEM数据采集方法:
1、地面测量
2、现有地图数字化
利用数字化仪对已有地图上的信息(如等高线)进行数字化,如:
手扶跟踪数字化仪和扫描数字化仪。
3、空间传感器
利用全球定位系统GPS,结合雷达和激光测高仪等进行数据采集
4、数字摄影测量方法
利用附有的自动记录装置(接口)的立体测图仪或立体坐标仪、解析测图仪及数字摄影测量系统,进行人工、半自动或全自动的量测来获取数据。
1、沿等高线采样
在地形复杂即陡峭地区,可采用此方法。
等距离间隔记录数据或等时间间隔记录数据。
2、规则格网采样
利用解析测图仪在立体模型中按规则格网进行采样,直接构成格网DEM。
3、渐进采样