地理信息系统概论第一二章Word下载.docx
《地理信息系统概论第一二章Word下载.docx》由会员分享,可在线阅读,更多相关《地理信息系统概论第一二章Word下载.docx(20页珍藏版)》请在冰豆网上搜索。
地学信息所表示的信息范围更广泛,不仅来自地表,还包括地下、大气层甚至宇宙空间。
它是人们深入认识地球系统、适度开发资源、保护环境的前提和保证。
四、信息系统和地理信息系统
1、信息系统(InformationSystem,IS)
1)系统:
由相互作用和相互依赖的若干组成部分结合而成,能完成特定功能的有机整体。
2)信息系统:
能对数据和信息进行采集、存储、加工和再现,并能回答用户一系列问题的系统。
具有采集、管理、分析和表达数据的能力。
3)类型:
从适用于不同管理层次角度出发、信息系统分为下列不同类型。
事务处理系统、管理信息系统:
主要支持操作层人员的日常事务处理,图书管理,借还书。
决策支持系统:
从MIS中获取信息,进行推测,以辅助决策。
人工智能、专家系统:
用计算机模仿人类思维过程进行推理,在医学上应用较成功。
为有效地对信息流进行控制,组织、管理、充分利用,就需要建立某种信息系统,那么对地理信息进行管理、利用就需要建立地理信息系统。
2、地理信息系统(GeographicInformationSystem,GIS)
不同领域、不同专业对GIS的理解不同,目前没有完全统一的被普遍接受的
A、GIS是对地理环境有关问题进行分析和研究的一门学科,它将地理环境的各种要素,包括它们的空间位置形状及分布特征和与之有关的社会、经济等专题信息以及这些信息之间的联系等进行获取、组织、存储、检索、分析,并在管理、规划与决策中应用。
B、为了获取、存储、检索、分析和显示空间定位数据而建立的计算机化的数据库管理系统。
---美国国家地理信息与分析中心
C、是在计算机软硬件支持下,以采集、存储、管理、检索、分析和描述空间物体的定位分布及与之相关的属性数据,并回答用户问题为主要任务的计算机系统。
D、GIS是一种获取、存储、检索、操作、分析和显示地球空间数据的计算机系统。
--英国教育部
2)理解
aGIS是一计算机系统,既然是系统,就要具有系统的基本功能,数据采集、管理、分析和表达,所以每个GIS系统都是由若干具有一定功能的模块组成。
bGIS的处理对象是有关的地理分布数据,也就是空间数据,为了能对这些空间数据进行定位,定性和定量的描述,决定了GIS要对空间数据按统一地理坐标进行编码,这是GIS与其他信息系统不同的根本所在。
§
1-3GIS构成
一、GIS组成
从计算机的角度看,GIS是由软件、硬件、数据和用户组成。
二、硬件配置
输入数字化、解析测图仪、扫描仪遥感处理设备等
存贮处理计算机硬盘光盘等存储设备
输出打印机绘图仪显示终端等
网络服务器、网络适配器、传输介质、调制解调器等网络设备。
功能硬件配置
数据采集与输入
数据编辑与更新
数据存储与管理
数据显示与输出
空间查询与分析
一、GIS功能
第二章地理信息系统的数据结构
一、地理实体(空间实体)---GIS处理对象
1、定义:
指自然界现象和社会经济事件中不能再分割的单元,它是一个具体有概括性,复杂性,相对意义的概念。
2、理解:
地理实体类别及实体内容的确定是从具体需要出发的,例如,在全国地图上由于比例尺很小,武汉就是一个点,这个点不能再分割,可以把武汉定为一个空间实体,而在大比例尺的武汉市地图上,武汉的许多房屋,街道都要表达出来,所以武汉必须再分割,不能作为一个空间实体,应将房屋,街道等作为研究的地理实体,由此可见,GIS中的空间实体是一个概括,复杂,相对的概念。
二、地理实体的描述——空间数据——反映了实体的三个特征
2、空间数据基本特征
1)依据数据来源的不同分为:
地图数据
地形数据
属性数据
元数据
影象数据
2)依据表示对象的不同分为:
类型数据、区域数据、网络数据、样本数据、曲面数据、文本数据、符号数据
三、实体的空间特征
在地图上实体维数的表示可以改变点---面线(单线河)---面(双线河),通过地图综合。
(一)空间维数:
有0,1,2,3维之分,点、线、面、体。
二)空间特征类型
1、点状实体
2、线状实体
3、面状实体
4、体状实体
点或节点、点状实体。
点:
有特定位置,维数为0的物体。
1)实体点:
用来代表一个实体。
2)注记点:
用于定位注记。
3)内点:
用于负载多边形的属性,存在于多边形内。
4)角点、节点Vertex:
表示线段和弧段上的连接点。
具有相同属性的点的轨迹,线或折线,由一系列的有序坐标表示,并有如下特性:
1)实体长度:
从起点到终点的总长
2)弯曲度:
用于表示像道路拐弯时弯曲的程度。
3)方向性:
如:
水流方向,上游—下游,公路,单、双向之分。
线状实体包括:
线段,边界、链、弧段、网络等。
3、面状实体(多边形
是对湖泊、岛屿、地块等一类现象的描述。
在数据库中由一封闭曲线加内点来表示。
面状实体的如下特征:
1)面积范围2)周长
3)独立性或与其它地物相邻
如中国及其周边国家
4)内岛屿或锯齿状外形:
如岛屿的海岸线封闭所围成的区域。
5)重叠性与非重叠性:
如学校的分区,菜市场的服务范围等都有可能出现交叉重叠现象,而一个城市的各个城区一般说来不会出现重叠
4、体、立体状实体
立体状实体用于描述三维空间中的现象与物体,它具有长度、宽度及高度等属性,立体状实体一般具有以下一些空间特征:
·
体积,如工程开控和填充的土方量。
每个二维平面的面积。
周长。
内岛。
含有弧立块或相邻块。
断面图与剖面图。
(三)实体类型组合
现实世界的各种现象比较复杂,往往由不同的空间单元组合而成,例如根据某些空间单元或几种空间单元的组合将空间问题表达出来,复杂实体由简单实体组合表达。
点、线、面两两之间组合表达复杂的空间问题:
线—面面--面
可见,用各要素之间的空间关系,可描述诸多空间问题。
空间关系是GIS数据描述和表达的重要内容,一方面它为GIS数据库的有效建立,空间查询,空间分析,辅助决策等提供了最基本的关系,另一方面有助于形成标准的SQL空间查询语言,便于空间特征的存储,提取,查询,更新等。
线—面
1、区域包含线:
计算区域内线的密度,某省的水系分布情况。
2、线通过区域:
公路上否通过某县。
3、线环绕区域:
区域边界,搜索左右区域名称,中国与哪些国家接壤。
4、线与区域分离:
距离。
面—面
1、包含:
岛,某省的湖泊分布。
2、相合:
重叠,学校服务范围与菜场服务范围重叠区。
3、相交:
划分子区。
4、相邻:
计算相邻边界性质和长度,公共连接边界。
分离:
计算距离。
四、实体间空间关系
(一)空间关系类型
1、
拓扑空间关系:
2、
顺序空间关系:
(方向空间关系)
用上下左右、前后、东南西北等方向性名称来描述空间实体的顺序关系,算法复杂,至今没有很好的解决方法。
3、
度量空间关系,主要指实体间的距离关系,远近。
1)在地理空间中两点间的距离有两种度量方法。
a、沿真实的地球表面进行,除与两点的地理坐标有关外,还与所通过路径的地形起伏有关,复杂,引入第二种。
b、沿地球旋转椭球体的距离量算。
2)
距离类别:
欧氏距离(笛卡尔坐标系)、曼哈顿(出租车)距离、时间距离(纬度差)、大地测量距离(大地线)(沿地球大圆经过两个城市中心的距离)。
二)拓扑关系
二)拓扑关系1、定义2、种类3、拓扑关系的表达4、意义
指图形保持连续状态下变形,但图形关系不变的性质。
将橡皮任意拉伸,压缩,但不能扭转或折叠。
2、种类
1)关联性:
(不同类要素之间)结点与弧段:
如V9与L5,L6,L3
多边形与弧段:
P2与L3,L5,L2
2)邻接性:
(同类元素之间)
多边形之间、结点之间。
邻接矩阵
重叠:
--邻接:
1不邻接:
3)连通性:
与邻接性相类似,指对弧段连接的判别,如用于网络分析中确定路径、街道是否相通。
4)方向性
一条弧段的起点、终点确定了弧段的方向。
用于表达现实中的有向弧段,如城市道路单向,河流的流向等。
5)包含性:
指面状实体包含了哪些线、点或面状实体。
6)区域定义:
多边形由一组封闭的线来定义。
7)层次关系:
相同元素之间的等级关系,武汉市有各个区组成。
主要的拓扑关系:
拓扑邻接、拓扑关联、拓扑包含。
最基本的拓扑关系
3、拓扑关系的表达
拓扑关系具体可由4个关系表来表示:
(1)
面--链关系:
面构成面的弧段
(2)
链--结点关系:
链链两端的结点
(3)
结点--链关系:
结点通过该结点的链\
(4)链—面关系:
链左面右面
4、拓扑关系的意义:
对于数据处理和GIS空间分析具有重要的意义,因为:
1)拓扑关系能清楚地反映实体之间的逻辑结构关系,它比几何关系具有更大的稳定性,不随地图投影而变化。
2)有助于空间要素的查询,利用拓扑关系可以解决许多实际问题。
如某县的邻接县,--面面相邻问题。
又如供水管网系统中某段水管破裂找关闭它的阀门,就需要查询该线(管道)与哪些点(阀门)关联。
3)根据拓扑关系可重建地理实体。
2-2栅格数据结构
一、图形表示
栅格结构用密集正方形(或三角形,多边形)将地理区域划分为网格阵列。
位置由行,列号定义,属性为栅格单元的值。
由单个栅格表达。
线:
由沿线走向有相同属性取值的一组相邻栅格表达。
面:
由沿线走向有相同属性取值的一片栅格表达。
栅格数据表示的是二维表面上的地理数据的离散化数值。
在栅格数据中,地表被分割为相互邻接、规则排列的地块,每个地块与一个象元相对应。
因此,栅格数据的比例尺就是栅格(象元)的大小与地表相应单元的大小之比,当象元所表示的面积较大时,对长度、面积等的量测有较大影响。
每个象元的属性是地表相应区域内地理数据的近似值,因而有可能产生属性方面的偏差。
二、栅格数据组织
——针对一个栅格单元对应多个属性值的多层栅格文件。
组织方法
方法a:
以象元为记录序列,不同层上同一象元位置上的各属性值表示为一个列数组。
N层中只记录一层的象元位置,节约大量存储空间,栅格个数很多。
方法b:
每层每个象元的位置、属性一一记录,结构最简单,但浪费存储。
方法c:
以层为基础,每层内以多边形为序记录多边形的属性值和多边形内各象元的坐标。
节约用于存储属性的空间。
将同一属性的制图单元的n个象元的属性只记录一次,便于地图分析和制图处理。
(一)建立途径
手工获取,专题图上划分均匀网格,逐个决定其网格代码。
2、扫描仪扫描专题图的图像数据{行、列、颜色(灰度)},定义颜色与属性对应表,用相应属性代替相应颜色,得到(行、列、属性)再进行栅格编码、存贮,即得该专题图的栅格数据。
由矢量数据转换而来。
4、
遥感影像数据,对地面景象的辐射和反射能量的扫描抽样,并按不同的光谱段量化后,以数字形式记录下来的象素值序列。
5、
格网DEM数据,当属性值为地面高程,则为格网DEM,通过DEM内插得到。
2-3栅格数据结构
栅格坐标系的确定
表示具有空间分布特征的地理要素,不论采用什么编码系统,什么数据结构(矢、栅)都应在统一的坐标系统下,而坐标系的确定实质是坐标系原点和坐标轴的确定。
由于栅格编码一般用于区域性GIS,原点的选择常具有局部性质,但为了便于区域的拼接,栅格系统的起始坐标应与国家基本比例尺地形图公里网的交点相一致,并分别采用公里网的纵横坐标轴作为栅格系统的坐标轴。
栅格单元的尺寸
1)原则:
应能有效地逼近空间对象的分布特征,又减少数据的冗余度。
格网太大,忽略较小图斑,信息丢失。
一般讲实体特征愈复杂,栅格尺寸越小,分辨率愈高,然而栅格数据量愈大(按分辨率的平方指数增加)计算机成本就越高,处理速度越慢。
2)方法:
用保证最小多边形的精度标准来确定尺寸经验公式:
h为栅格单元边长
Ai为区域所有多边形的面积。
(三)栅格代码(属性值)的确定
当一个栅格单元内有多个可选属性值时,按一定方法来确定栅格属性值。
1、中心点法:
取位于栅格中心的属性值为该栅格的属性值。
2、面积占优法:
栅格单元属性值为面积最大者,常用于分类较细,地理类别图斑较小时。
3、重要性法:
定义属性类型的重要级别,取重要的属性值为栅格属性值,常用于有重要意义而面积较小的要素,特别是点、线地理要素。
4、长度占优法——每个栅格单元的值由该栅格中线段最长的实体的属性来确定
四、栅格数据编码方法
1、直接栅格编码:
将栅格数据看作一个数据矩阵,逐行记录代码数据。
1)每行都从左到右记录;
AAAAABBBAABBAABB
2)奇数行从左到右,偶数行从右到左;
特点:
最直观、最基本的网格存贮结构,没有进行任何压缩数据处理。
栅格数据量大,格网数多,由于地理数据往往有较强的相关性,即相邻象元的值往往是相同的。
所以,出现了各种栅格数据压缩方法。
数据压缩是将数据表示成更紧凑的格式以减少存储空间的一项技术。
分为:
无损压缩:
在编码过程中信息没有丢失,经过解码可恢复原有的信息---信息保持编码。
有损压缩:
为最大限度压缩数据,在编码中损失一些认为不太重要的信息,解码后,这部分信息无法恢复。
--信息不保持编码。
2、行程编码(变长编码):
将原图表示的数据矩阵变为数据对:
1)属性码,长度,行号(可不要)
长度:
连续相同码值的栅格个数。
2)属性码,点位
对于游程长度编码,区域越大,数据的相关性越强,则压缩越大,适用于类型区域面积较大的专题图,而不适合于类型连续变化或类别区域分散的分类图(压缩比与图的复杂程度成反比)。
这种编码在栅格加密时,数据量不会明显增加,压缩率高,并最大限度地保留原始栅格结构,编码解码运算简单,且易于检索,叠加,合并等操作,这种编码应用广泛。
3、块码----游程编码向二维扩展
采用方形区域作为记录单元,每个记录单元包括相邻的若干栅格。
数据对组成:
(初始行、列,半径,属性值)
具有可变分辨率,即当属性变化小时图块大,对于大块图斑记录单元大,分辨率低,压缩比高。
小块图斑记录单元小,分辨率高,压缩比低
所以,与行程编码类似,随图形复杂程度的提高而降低分辩率。
4、链式编码、Freeman链码、边界链码
1)首先定义一个3x3窗口,中间栅格的走向有8种可能,并将这8种可能0~7进行编码。
2)记下地物属性码和起点行、列后,进行追踪,得到矢量链.一般按顺时针方向
属性码
起点行
起点列
链码
a
1
4
556656
b
3
7
0…
优点:
链码可有效地存贮压缩栅格数据,便于面积、长度、转折方向和边界、线段凹凸度的计算。
缺点:
不易做边界合并,插入操作、编辑较困难(对局部修改将改变整体结构)。
区域空间分析困难,相邻区域边界被重复存储。
五、四叉树编码
一)四叉树概述:
一种可变分率的非均匀网格系统。
是最有效的栅格数据压缩编码方法之一
基本思想:
将2n×
2n象元组成的图像(不足的用背景补上)按四个象限进行递归分割,
并判断属性是否单一,单一:
不分。
不单一:
递归分割。
最后得到一颗四分叉的倒向树。
四叉树的树形表示:
用一倒立树表示这种分割和分割结果。
根:
整个区域
高:
深度、分几级,几次分割
叶:
不能再分割的块
树叉:
还需分割的块
每个树叉均有4个分叉,叫四叉树。
3、编码方法
1)常规四叉树
记录这棵树的叶结点外,中间结点,结点之间的联系用指针联系,
每个结点需要6个变量:
父结点指针、四个子结点的指针和本结点的属性值。
指针不仅增加了数据的存储量,还增加了操作的复杂性:
如层次数(分割次数)由从父结点移到根结点的次数来确定,结点所代表的图像块的位置需要从根节点开始逐步推算下来。
所以,常规四叉树并不广泛用于存储数据,其价值在于建立索引文件,进行数据检索。
2)线性四叉树
记录叶结点的位置,深度(几次分割)和属性。
地址码(定位码、Morton码)四进制、十进制
存贮量小,只对叶结点编码,节省了大量中间结点的存储,地址码隐含着结点的分割路径和分割次数。
线性四叉树可直接寻址,通过其坐标值直接计算其Morton码,而不用建立四叉树。
定位码容易存储和执行实现集合相加等组合操作。
2-3矢量数据结构
一、图形表示
二、矢量数据的获取方式
1)由外业测量获得
可利用测量仪器自动记录测量成果(常称为电子手薄),然后转到地理数据库中。
2)由栅格数据转换获得
利用栅格数据矢量化技术,把栅格数据转换为矢量数据。
3)跟踪数字化
用跟踪数字化的方法,把地图变成离散的矢量数据。
三、矢量数据组织
矢量数据表示时应考虑以下问题:
●·
矢量数据自身的存贮和处理。
与属性数据的联系。
矢量数据之间的空间关系(拓扑关系)。
几何位置坐标文件
连接关系表
坐标对(x,y)+识别符
坐标对系列(x1,y1)..(xn,yn)及有关属性、其它属性
首尾相同的坐标串
四、矢量数据编码方式
(一)实体式
(spaghetti)--面条模型:
以实体为单位记录其坐标
结构简单、直观、易实现以实体为单位的运算和显示。
缺点:
1、相邻多边形的公共边界被数字化并存储两次,造成数据冗余和碎屑多边形—数据不一致,浪费空间,导致双重边界不能精确匹配。
2、自成体系,缺少多边形的邻接信息,无拓扑关系,难以进行邻域处理,如消除多边形公共边界,合并多边形。
3、岛作为一个单个图形,没有与外界多边形联系。
不易检查拓扑错误。
所以,这种结构只用于简单的制图系统中,显示图形。
(二)索引式(树状)
对所有点的坐标按顺序建坐标文件,再建点与边(线)、线与多边形的索引文件。
索引文件:
点号
坐标
x1,y1
1、点文件:
弧段号
起点
终点
A
5
2
7,8,9,10
2、弧段文件
面号
P1
A,B,C
3、面文件:
与实体式相比:
用建索引的方法消除多边形数据的冗余和不一致,邻接信息、岛信息可在多边形文件中通过是否公共弧段号的方式查询。
表达拓扑关系较繁琐,给相邻运算、消除无用边、处理岛信息、检索拓扑关系等带来困难,以人工方式建立编码表,工作量大,易出错。
(三)双重独立式编码
简称DIME(DualIndependentMapEncoding),是美国人口统计系统采用的一种编码方式,是一种拓扑编码结构。
1、点文件
2、线文件:
线文件是以线段为记录单位
线号
左多边形
右多边形
L210
P2
10
关联关联关联关联
L210,L109…
3、面文件
(四)链状双重独立式编码--拓扑数据结构
坐标系列(串)
x2,y2,X10,y10…
1、弧段坐标文件
弧段号
2、弧段文件:
链—面,链—结点关系
A,B,-C
点号
A,B,D
4、点拓扑文件:
结点—链关系
链状双重独立式编码特点
拓扑关系明确,也能表达岛信息,而且以弧段为记录单位,满足实际应用需要。
当图形数据修改、删除、增加点、线、面要素后,其拓扑关系也发生改变,所以,需重新建拓扑。
2-4矢栅一体化数据结构
一、矢、栅优缺点:
优点
缺点
矢量
1、便于面向现象(土壤类,土地利用单元等)
2、结构紧凑,冗余度低,便于描述线或边界。
3、利于网络、检索分析,提供有效的拓扑编码,对需要拓扑信息的操作更有效