第三章 空间数据模型Word文件下载.docx
《第三章 空间数据模型Word文件下载.docx》由会员分享,可在线阅读,更多相关《第三章 空间数据模型Word文件下载.docx(33页珍藏版)》请在冰豆网上搜索。
地理信息系统中的地理空间分为绝对空间和相对空间两种形式。
绝对空间是具有属性描述的空间位置的集合,它由一系列不同位置的空间坐标值组成;
相对空间是具有空间属性特征的实体的集合,由不同实体之间的空间关系构成。
在地理信息系统应用中,空间概念贯穿于整个工作对象、工作过程、工作结果等各个部分。
空间数据就是以不同的方式和来源获得的数据,如地图、各种专题图、图像、统计数据等,这些数据都具有能够确定空间位置的特点。
空间数据模型是关于现实世界中空间实体及其相互间联系的概念,它为描述空间数据的组织和设计空间数据库模式提供着基本方法。
因此,对空间数据模型的认识和研究在设计GIS空间数据库和发展新一代GIS系统的过程中起着举足轻重的作用(图3-1)。
图3-1:
概念数据模型
1.2空间数据模型的类型
在GIS中与空间信息有关的信息模型有三个,即基于对象(要素)(Feature)的模型、网络(Network)模型以及场(Field)模型。
基于对象(要素)的模型强调了离散对象,根据它们的边界线以及组成它们或者与它们相关的其它对象,可以详细地描述离散对象。
网络模型表示了特殊对象之间的交互,如水或者交通流。
场模型表示了在二维或者三维空间中被看作是连续变化的数据。
有很多类型的数据,有时被看作场,有时被看作对象。
选择某一种模型而不选择另外一种模型主要是顾及数据的测量方式。
如果数据来源于卫星影像,其中某一现象的一个值主要是为区域内每一个位置提供的,如作物类型或者森林类型可以采用一个基于场的观点;
如果数据是以测量区域边界线的方式而且区域内部被看成是一致的,就可以采用一个基于要素的观点;
如果是将分类空间分成粗略的子类,一个基于场的模型可以被转换成一个基于要素的模型,因为后者更适合于离散面的或者线的特征的度量和分析。
1.3GIS空间数据模型的学术前沿
时空数据模型、三维数据模型、动态空间数据结构、分布式空间数据管理、空间存取方法、GIS设计的CASE工具等是目前国际上GIS空间数据模型研究的学术前沿。
1.3.1时空数据模型
时空数据模型的核心问题是研究如何有效地表达、记录和管理现实世界的实体及其相互关系随时间不断发生的变化。
这种时空变化表现为三种可能的形式,一是属性变化,其空间坐标或位置不变;
二是空间坐标或位置变化,而属性不变,这里空间的坐标或位置变化既可以是单一实体的位置、方向、尺寸、形状等发生变化,也可以是两个或两个以上的空间实体之间的关系发生变化;
三是空间实体或现象的坐标和属性都发生变化。
当前时态GIS研究的主要问题有:
表达时空变化的数据模型、时空数据组织与存取方法、时空数据库的版本问题、时空数据库的质量控制、时空数据的可视化问题等。
1.3.2三维空间数据模型
国际上关于三维空间数据模型的研究大体上可分为两个方向:
一是三维矢量模型,其是用一些基元及其组合去表示三维空间目标,这些基元本身是可以用简单数学解析函数描述的。
二是体模型,以体元(Voxel)模型为代表,这种体元模型的特点是易于表达三维空间属性的非均衡变化,其缺点是所占存储空间大、处理时间长。
1.3.3分布式空间数据模型
分布式空间数据库管理系统和联邦空间数据库是国际上关于分布式空间数据模型的两个主要研究方向。
1)分布式空间数据库管理系统
分布式空间数据库管理系统是将空间数据库技术与计算机网络技术相结合,利用计算机网络对通过通讯线路相关联的空间数据库进行数据和程序的分布处理,以实现集中与分布的统一,即分布式空间数据库管理系统是将分散的空间数据库连成一体。
其主要问题包括空间数据的分割、分布式查询、分布式并发控制。
2)联邦空间数据库(FederatedSpatialDatabase)
联邦空间数据库则是在不改变不同来源的各空间数据库管理系统的前提下,将非均质的空间数据库系统联成一体,形成联邦式的空间数据库管理体系,并向用户提供统一的视图。
1.3.4CASE工具*
CASE工具是计算机信息系统结构化分析、数据流程描述、数据实体关系表达、数据字典与系统原型生成、原代码生成的重要工具,在非空间型计算机信息系统的设计与建立中有着较为广泛的应用。
当前国际上的一个重要发展方向是,根据GIS空间数据建模的特点和CASE工具的原理,在现有CASE软件平台上,发展GIS空间数据建模与系统设计的专用功能,这将有效地提高GIS空间数据建模及其应用系统设计的自动化程度和技术水平。
2.场模型
对于模拟具有一定空间内连续分布特点的现象来说,基于场的观点是合适的。
例如,空气中污染物的集中程度、地表的温度、土壤的湿度水平以及空气与水的流动速度和方向。
根据应用的不同,场可以表现为二维或三维。
一个二维场就是在二维空间中任何已知的地点上,都有一个表现这一现象的值;
而一个三维场就是在三维空间中对于任何位置来说都有一个值。
一些现象,诸如空气污染物在空间中本质上讲是三维的,但是许多情况下可以由一个二维场来表示。
场模型可以表示为如下的数学公式:
z:
sz(s)
上式中,z为可度量的函数,s表示空间中的位置,因此该式表示了从空间域(甚至包括时间坐标)到某个值域的映射。
表3-1给出了地理研究中一些常模型的例子[A.Vckovski]。
场模型
定义域维数
值域维数
自变量
因变量
T(z)
1
空间坐标(高程)
高度z处的气温
E(t)
3
时间坐标
某时刻的静电力
H(x,y)
2
空间坐标
地表高程
P(x,y,z)
土壤的孔隙度
v(λ,φ,z)
空间坐标(λ,φ经纬度,z高度)
风速(三维矢量)
σ(x,y,z)
9
压力张量
Θ(λ,φ,p,t)
4
p压力面,t时间
潜温
Θt(λ,φ,p)
∞
p压力面
时间序列的潜温
I(x,y,z,t,λ)
5
x,y,z,t时空坐标,λ波长
波长λ的电磁波在x,y,z,t处的辐射强度
2.1场的特征
场经常被视为由一系列等值线组成,一个等值线就是地面上所有具有相同属性值的点的有序集合。
2.1.1空间结构特征和属性域
在实际应用中,“空间”经常是指可以进行长度和角度测量的欧几里德空间。
空间结构可以是规则的或不规则的,但空间结构的分辨率和位置误差则十分重要,它们应当与空间结构设计所支持的数据类型和分析相适应。
属性域的数值可以包含以下几种类型:
名称、序数、间隔和比率。
属性域的另一个特征是支持空值,如果值未知或不确定则赋予空值。
2.1.2连续的、可微的、离散的
如果空间域函数连续的话,空间域也就是连续的,即随着空间位置的微小变化,其属性值也将发生微小变化,不会出现像数字高程模型中的悬崖那样的突变值。
只有在空间结构和属性域中恰当地定义了“微小变化”,“连续”的意义才确切;
当空间结构是二维(或更多维)时,坡度——或者称为变化率——不仅取决于特殊的位置,而且取决于位置所在区域的方向分布(图3-2)。
连续与可微分两个概念之间有逻辑关系,每个可微函数一定是连续的,但连续函数不一定可微。
图3-2:
某点的坡度取决于位置所在区域的各方向上的可微性
如果空间域函数是可微分的,空间域就是可微分的;
行政区划的边界变化是离散的一个例子,如果目前测得的边界位于A,而去年这时边界位于B,但这并不表明6个月前边界将位于BA之间的中心,边界具有不连续跃变。
2.1.3与方向无关的和与方向有关的(各向同性和各向异性)
空间场内部的各种性质是否随方向的变化而发生变化,是空间场的一个重要特征。
如果一个场中的所有性质都与方向无关,则称之为各向同性场(IsotropicField)。
例如旅行时间,假如从某一个点旅行到另一个点所耗时间只与这两点之间的欧氏几何距离成正比,则从一个固定点出发,旅行一定时间所能到达的点必然是一个等时圆,如图3-3-(a)所示。
如果某一点处有一条高速通道,则利用与不利用高速通道所产生的旅行时间是不同的,见图3-3-(b)。
等时线已标明在图中,图中的双曲线是利用与不利用高速通道的分界线。
本例中的旅行时间与目标点与起点的方位有关,这个场称为各向异性场(AnisotropicField)。
(a)(b)
图3-3:
在各向同性与各向异性场中的旅行时间面
2.1.4空间自相关
空间自相关是空间场中的数值聚集程度的一种量度。
距离近的事物之间的联系性强于距离远的事物之间的联系性。
如果一个空间场中的类似的数值有聚集的倾向,则该空间场就表现出很强的正空间自相关;
如果类似的属性值在空间上有相互排斥的倾向,则表现为负空间自相关(图3-4)。
因此空间自相关描述了某一位置上的属性值与相邻位置上的属性值之间的关系。
图3-4:
强空间正负自相关模式
2.2栅格数据模型
栅格数据模型是基于连续铺盖的,它是将连续空间离散化,即用二维铺盖或划分覆盖整个连续空间;
铺盖可以分为规则的和不规则*的,后者可当做拓扑多边形处理,如社会经济分区、城市街区;
铺盖的特征参数有尺寸、形状、方位和间距。
对同一现象,也可能有若干不同尺度、不同聚分性(AggregationorSubdivisions)的铺盖。
在边数从3到N的规则铺盖(RegularTesselations)中,方格、三角形和六角形是空间数据处理中最常用的。
三角形是最基本的不可再分的单元,根据角度和边长的不同,可以取不同的形状,方格、三角形和六角形可完整地铺满一个平面(图3-5)。
图3-5:
三角形、方格和六角形划分
基于栅格的空间模型把空间看作像元(Pixel)的划分(Tessellation),每个像元都与分类或者标识所包含的现象的一个记录有关。
像元与“栅格”两者都是来自图像处理的内容,其中单个的图像可以通过扫描每个栅格产生。
GIS中栅格数据经常是来自人工和卫星遥感扫描设备中,以及用于数字化文件的设备中。
采用栅格模型的信息系统,通常应用了前面所述的分层的方法。
在每个图层中栅格像元记录了特殊的现象的存在。
每个像元的值表明了在已知类中现象的分类情况(图3-6)。
图3-6:
栅格数据模型
由于像元具有固定的尺寸和位置,所以栅格趋向于表现在一个“栅格块”中的自然及人工现象。
因此分类之间的界限被迫采用沿着栅格像元的边界线。
一个栅格图层中每个像元通常被分为一个单一的类型。
这可能造成对现象的分布的误解,其程度则取决与所研究的相关的像元的大小。
如果像元针对特征而言是非常小的,栅格可以是一个来表现自然现象的边界随机分布的特别有效的方式,该现象趋于逐渐地彼此结合,而不是简单地划分。
如果每个像元限定为一个类,栅格模型就不能充分地表现一些自然现象的转换属性。
除非抽样被降低到一个微观的水平,否则许多数据类事实上都是混合类。
模糊的特征通过混合像元,在一个栅格内可以被有效地表达,其中组成分类通过像元所有组成度量的或者预测的百分比来表示。
尽管如此,也应该强调一个栅格的像元仅仅被赋予一个单一的值。
为了GIS数据处理,栅格模型的一个重要的特征就是每个栅格中的像元的位置被预先确定,所以很容易进行重叠运算以比较不同图层中所存储的特征。
由于像元位置是预先确定的,且是相同的,在一个具体的应用的不同的图层中,每个属性可以从逻辑上或者从算法上与其它图层中的像元的属性相结合以便产生相应的重叠中一个的属性值。
其不同于基于图层的矢量模型之处,在于图层中的面单元彼此是独立的,直接地比较图层必须作进一步处理以识别重叠的属性。
体元(Voxels):
GIS中基于的栅格表示可以被扩展到三维以产生一个体元(Voxel)模型,其中像元是由长方形,典型是立方体、立体元素所组成。
地理数据的一些类型,并不总是由边界表示的,因为数据值可能与一个属性相关,而该属性随着位置的变化而变化,而且并不是清楚地理解边界。
这类模型的数据的一个比较合适的模型就是体元模型。
该模型被广泛地应用于媒体成像,其中它们源于计算机辅助断层(CT)及核磁反应扫描仪。
它们很好地表现渐进的、特殊的位置变化,并适于产生这种变化的剖面图。
3.要素模型
3.1欧氏(Euclidean)空间和欧氏空间中的三类地物要素
许多地理现象模型建立的基础就是嵌入(Embed)在一个坐标空间中,在这种坐标空间中,根据常用的公式就可以测量点之间的距离及方向,这个带坐标的空间模型叫做欧氏空间,它把空间特性转换成实数的元组(Tuples)特性,两维的模型叫做欧氏平面。
欧氏空间中,最经常使用的参照系统是笛卡尔坐标系(CartesianCoordinates),它是由一个固定的、特殊的点为原点,一对相互垂直且经过原点的线为坐标轴。
此外,在某些情况下,也经常采用其它坐标系统,如极坐标系(PolarCoordinates)。
将地理要素嵌入到欧氏空间中,形成了三类地物要素对象,即点对象、线对象和多边形对象。
3.1.1点对象
点是有特定的位置,维数为零的物体,包括:
.点实体(PointEntity):
用来代表一个实体;
.注记点:
用于定位注记;
.内点(LabelPoint):
用于记录多边形的属性,存在于多边形内;
.结点(节点)(Node):
表示线的终点和起点;
.角点(Vertex):
表示线段和弧段的内部点。
3.1.2线对象
线对象是GIS中非常常用的维度为1的空间组分,表示对象和它们边界的空间属性,由一系列坐标表示,并有如下特征:
.实体长度:
从起点到终点的总长;
.弯曲度:
用于表示像道路拐弯时弯曲的程度;
.方向性:
水流方向是从上游到下游,公路则有单向与双向之分。
线状实体包括线段、边界、链、弧段、网络等,多边线如图3-7所示。
3.1.3多边形对象
面状实体也称为多边形,是对湖泊、岛屿、地块等一类现象的描述。
通常在数据库中由一封闭曲线加内点来表示。
面状实体有如下空间特性:
.面积范围;
.周长;
.独立性或与其它的地物相邻,如中国及其周边国家;
.内岛或锯齿状外形,如岛屿的海岸线封闭所围成的区域等;
.重叠性与非重叠性,如报纸的销售领域,学校的分区,菜市场的服务范围等都有可能出现交叉重叠现象,一个城市的各个城区一般说来相邻但不会出现重叠。
在计算几何中,定义了许多不同类型的多边形,如图3-7所示。
图3-7:
多边线和多边形
3.2要素模型的基本概念
基于要素的空间模型强调了个体现象,该现象以独立的方式或者以与其它现象之间的关系的方式来研究。
任何现象,无论大小,都可以被确定为一个对象(Object),假设它可以从概念上与其邻域现象相分离。
要素可以由不同的对象所组成,而且它们可以与其它的相分离的对象有特殊的关系。
在一个与土地和财产的拥有者记录有关的应用中,采用的是基于要素的视点,因为每一个土地块和每一个建筑物必须是不同的,而且必须是唯一标识的并且可以单个地测量。
一个基于要素的观点是适合于已经组织好的边界现象的,尽管并不被限定。
因此,这也适合于人为现象的,例如,建筑物、道路、设施和管理区域。
一些自然现象,如湖、河、岛及森林,经常被表现在基于要素的模型中的,因为它们为了某些目的,可以被看成为离散的现象,但应该记住的是,这样现象的边界随着时间的变化很少是固定的,因此,在任何时刻,它们的实际的位置定义很少是精确的。
基于要素的空间信息模型把信息空间分解为对象(Object)或实体(Entity)。
一个实体必须符合三个条件:
.可被识别;
.重要(与问题相关);
.可被描述(有特征)。
而有关实体的特征,可以通过静态属性(如城市名)、动态的行为特征和结构特征来描述实体。
与基于场的模型不同,基于要素的模型把信息空间看作许多对象(城市、集镇、村庄、区)的集合,而这些对象又具有自己的属性(如人口密度、质心和边界等)。
基于要素的模型中的实体可采用多种维度来定义属性,包括:
空间维、时间维、图形维和文本/数字维。
空间对象之所以称为“空间的”,是因为它们存在于“空间”之中,即所谓“嵌入式空间”。
空间对象的定义取决于嵌入式空间的结构。
常用的嵌入式空间类型有:
(1)欧氏空间,它允许在对象之间采用距离和方位的量度,欧氏空间中的对象可以用坐标组的集合来表示;
(2)量度空间,它允许在对象之间采用距离量度(但不一定有方向);
(3)拓扑空间,它允许在对象之间进行拓扑关系的描述(不一定有距离和方向);
(4)面向集合的空间,它只采用一般的基于集合的关系,如包含、合并及相交等。
1)欧氏平面上的空间对象类型
图3-8表示了在连续的二维欧氏平面上的一种可能的对象继承等级图。
图3-8:
连续空间对象类型的继承等级
在上图中,具有最高抽象层次的对象是“空间对象”类,它派生为零维的点对象和延伸对象,延伸对象又可以派生维一维和二维的对象类。
一维对象的两个子类:
弧和环(Loop),如果没有相交,则称为简单弧(SimpleArc)和简单环(SimpleLoop)。
在二维空间对象类中,连通的面对象称为面域对象,没有“洞”的简单面域对象称为域单位对象。
2)离散欧氏平面上的空间对象
欧氏空间的平面因连续而不可计算,必须离散化后才适合于计算。
图3-8中所有的连续类型的离散形式都存在。
图3-9表示了部分离散一维对象继承等级关系*。
图3-9:
离散一维对象的继承等级
对象行为是由一些操作定义的。
这些操作用于一个或多个对象(运算对象),并产生一个新的对象(结果)。
可将作用于空间对象的空间操作分为两类:
静态的和动态的。
静态操作不会导致运算对象发生本质的改变,而动态操作会改变(甚至生成或删除)一个或多个运算对象。
虽然系统的面向对象方法和基于要素的空间数据模型在概念上很相似,但两者之间仍然有着明显的差别。
实现基于要素的模型并不一定要求运用面向对象的方法;
另一方面,面向对象方法既可以作为描述场的空间模型的框架,也可以作为描述基于要素的空间模型的框架。
对于基于要素的模型,采用面向对象的描述是显然合适的;
而对于基于场的模型同样可以用面向对象方法来构建。
场和对象可以在多种水平上共存,对于空间数据建模来说,基于场的方法和基于要素的方法并不互相排斥。
有些应用可以很自然地应用场来建模,如前面例子中提到的某一区域的气候属性变化就适合于建立场模型;
但是,即使是在这种情况下,场模型也并不是适合所有情况。
例如,如果采集降雨数据的各个点在空间上很分散且分布无规律,加之这些采集点还有各自的特征,那么,一个包含两个属性,即位置和平均降雨量的对象也许更适合于区域气候属性变化的描述。
总之,基于场的模型和基于要素的模型各有长处,应该恰当地综合运用这两种方法来建模。
在地理信息系统应用模型的高层建模中、数据结构设计中及地理信息系统应用中,都会遇到这两种模型的集成问题。
图3-10描述了要素模型和场模型的比较。
图3-10:
要素模型和场模型的比较[A.Vckovski]
3.3矢量数据模型
矢量方法(图3-11)强调了离散现象的存在,由边界线(点、线、面)来确定边界,因此可以看成是基于要素的。
然而,在一些基于矢量的GIS中,表现表面的便利,带给它模拟二维场的可能性,最常见的例子就是地表高程。
栅格技术将重点放置在了空间格网像元位置的内容上,因此经常被描述为基于位置的。
栅格数据模型似乎与上面所描述的场的观点相似,但是所储存的空间信息模型并不是对一个连续变量的描述,而它是格网——像元值的一个集合,这些值当然可以被看成抽样一个场模型,但是同样可以被抽样成一个基于对象的模型。
图3-11:
矢量数据模型
矢量数据模型将现象看作原形实体的集合,且组成空间实体。
在二维模型内,原型实体是点、线和面;
而在三维中,原型也包括表面和体。
观察的尺度或者概括的程度,决定了使用的原型的种类。
在一个小比例尺表现中,诸如城镇这一现象可以由个别的点所组成,而路和河流由线来表示。
当表现的比例尺增大时,必然要考虑到现象的尺度;
在一个中等比例尺上,一个城镇可以由特定的原型,如线,来表示用以记录其边界。
在较大的比例尺中,城镇将被表现为特定的原型的复杂的集合,包括建筑物的边界、道路、公园以及所包含的其它的自然与管理现象。
矢量模型的表达源于原型空间实体本身,通常以坐标来定义。
一个点的位置可以二维或者三维中的坐标的单一集合来描述。
一条线通常由有序的两个或者多个坐标对集合来表示。
特定坐标之间线的路径可以是一个线性函数或者一个较高次的数学函数,而线本身可以由中间点的集合来确定。
一个面通常由一个边界来定义,而边界是由形成一个封闭的环状的一条或多条线所组成。
如果区域有个洞在其中,那么可以采用多个环以描述它。
依据应用的类型,对采用矢量数据描述三维模型有一些特殊的要求。
地形模型应用要求或者是简单的、单一值的表面(单一值的表面是指对于任意的位置,都有单一的、确定的高程数值),这仅可以表示地表高程;
或者它们与地形表面的地形特征相结合,在景观结构中,有必要将地形表面与特征的三维表现结合起来,例如位于其上的建筑物与植被*。
为了制图目的,表现地形表面的传统方法可以采用等高线,而对于分析目的而言,等高线并不是一个方便的表示;
如果表面被采样为等值线(也许从一个地图上被数字化),它们通常将被转换成最通用的基于GIS的地形表现,如规则格网及不规则三角网。
点值的规则格网、或者矩阵,可以直接地来自一个原始的规则的抽样的方案中,通常情况下,是对不规则分布数值的内插,不规则分布数值可以包括数字化等高线和离散点的高程数值。
TIN的特征是它们保留了原始的不规则抽样的数据值,它是一个三角化的被用来表现一个三角形的平面,并与这些原始数值相联系。
一个TIN单元的表面