空间数据库考试知识点Word格式.docx
《空间数据库考试知识点Word格式.docx》由会员分享,可在线阅读,更多相关《空间数据库考试知识点Word格式.docx(20页珍藏版)》请在冰豆网上搜索。
P1/e1、e5、e6拓扑包含:
P3与P4
1.8数据结构:
是指数据的组织形式,在计算机存储、管理和处理的数据逻辑结构。
1.9数据模型(数据库模型):
是描述实体及其相互关系的数学描述,是空间数据库建立的逻辑模型。
1.10关系模型用于空间数据库的局限性
1)无法用递归和嵌套的方式来描述复杂关系的层次和网状结构,模拟和操作复杂地理对象的能力较弱;
2)用关系模型描述本身具有复杂结构和涵义的地理对象时,需对地理实体进行不自然的分解,导致存储模式、查询途径及操作等方面均显得语义不甚合理;
3)由于概念模式和存储模式的相互独立性,及实现关系之间的联系需要执行系统开销较大的联接操作,运行效率不够高。
4)空间数据具有非结构化特性,即通常是变长的,而一般RDBMS只允许记录的长度设定为固定长度,此外,通用DBMS难于存储和维护空间数据的拓扑关系。
5)一般RDBMS都难以实现对空间数据的关联、连通、包含、叠加等基本操作。
6)一般DBMS不能支持GIS需要的一些复杂图形功能。
7)一般RDBMS难以支持复杂的地理信息,因为单个地理实体的表达需要多个文件、多条记录,包括大地网、特征坐标、拓扑关系、属性数据和非空间专题属性等方面信息。
1.11空间数据库(SDBMS)的定义
1.描述、存储和处理空间数据及其属性数据的数据库系统。
2.是描述与特定空间位置有关的真实世界对象的数据集合。
3.是一个存储空间和非空间数据的数据库系统,在它的数据模型和查询语言中能提供空间数
据类型,可以及逆行空间动态索引,并提供空间查询和空间分析的能力
1.12空间数据库特征
1)综合抽象特征
2)非结构化特性
3)分类编号特征
4)多样性和复杂性
1.13空间数据库与传统数据库差异
1)信息描述差异
2)数据管理差异
3)数据操作差异
4)数据更新差异
5)服务应用差异
1.14SDBMS的发展
一、文件管理方式
二、文件与关系数据库混合管理—双元模型
三、全关系型空间数据库管理系统
四、对象-关系空间数据库管理系统
五、空间数据引擎技术
六、面向对象空间数据库管理系统
第二章空间现象抽象表达
2.1.认知科学:
是研究人类感知和思维信息处理的科学。
2.2空间认知:
是对现实世界的空间属性包括位置、大小、距离、方向、形状、模式、运动和物体内部关系的认知,是通过获取、处理、存储、传递和解译空间信息来获取,空间知识的过程。
地理空间认知:
如何理解地理空间,进行地理分析与决策,包括地理信息的直觉、编码、存贮、记忆和解码等一系列心理过程。
地理认知研究:
主要包括地理直觉、地理表象、地理概念化、地理知识的心理表征和地理信息推理,涉及地理知识的获取、存储和使用。
2.3空间认知九层抽象模型
1)现实世界:
基本语言
2)概念世界:
自然语言
3)地理空间世界:
GIS语言
4)维度世界:
度量语言
5)项目世界:
信息团体
6)OGIS点世界:
坐标几何
OGIS几何世界
OGIS要素世界:
要素
OGIS要素集合世界:
要素集合
2.4场模型
场模型将地理空间抽象为空间参照系中具有属性的、连续的、不重合的、无穷个空间位置的
集合,每个位置表示成一个二维或三维坐标向量,坐标取值为连续的实数值。
场模型将空间位置通过不同的函数(数学空间中的连续函数或分段连续函数)映射到多种属性域上,形成多个不同的场。
场的组成场模型由空间参照系统、场函数、网格(一定分辨率)和场操作等四部分组成。
a、空间参照系统:
定义某种地理坐标系统,将地理空间转换为数学空间。
b场函数场函数是场模型的连续、可视化表示形式。
在定义域(研究区域的所有栅格像素)上有一个函数集,分别将空间(栅格像素)位置映射到不同的属性集(不同图层)。
如:
地表高
程、土地使用、温度等。
c、网格
选择一种网格(覆盖),将研究区域离散化,网格分辨率代表离散化的精度。
d、场操作一栅格分析
场操作分为点操作(点变换)、聚焦操作(邻域)和区域操作(区域变换)。
空间自相关
是指一些变量在同一个分布区内的观测数据之间潜在的相互依赖性。
第三章空间数据模型
3.1空间关系概念:
指空间目标之间的一定区域上构成的与空间特性有关的联系。
是空间对象在几何上存
在的一种相互依赖的概念。
类型:
空间拓扑关系
空间度量关系(空间距离关系)空间顺序关系(空间方向关系)
3.2空间拓扑关系指图形保持连续状态下变形,但图形关系不变的性质。
拓扑关系是一种定性关系,而不是定量的。
非拓扑属性:
两点间距离、一点指向另一点的方向、弧段长度、区域周长、面积等
拓扑属性:
一个点在一条弧段的端点、一条弧是一简单弧段(自身不相交)、一个点在一个区域的边界上、一个点在一个区域的内部/外部、一个点在一个环的内/外部、一个面是一个简单面、一个面的连通性面内任两点从一点、可在面的内部走向另一点等
3.3拓扑关系的意义
1)拓扑关系能清楚地反映实体之间的逻辑结构关系,它比几何关系具有更大的稳定性,不随地图投影而变化。
2)有助于空间要素的查询与分析,利用拓扑关系可以解决许多实际问题。
3)根据拓扑关系可重建地理实体。
3.4九交模型
1.九交模型中的外部太大。
对于一个面积有限的空间目标而言,它的外部是无限的。
这导致任意两个目标的外部的交总是非空。
2.外部的无限性,导致目标的外部与边界和内部是线性相关的,使得外部在九交模型中的作用不是很明显。
3.外部的无限性,导致目标的外部与边界和内部是线性相关的,使得外部在九交模型中的作用不是很明显。
3.5面向对象数据库系统所具有的优势
(1)缩小了语义差距
(2)减轻了“阻抗失配”问题
(3)适应非传统应用的需要
3.6空间数据的互操作
指异构环境下两个或两个以上的实体可以互相通信和协作,以完成某一特定任务,这些实体包括程序、对象、系统运行环境等。
GIS互操作类型软件的互操作、数据的互操作、语义互操作
GIS互操作问题
1)没有统一的标准。
2)系统的开发均建立在具体、相互独立和封闭的平台
3.7GeodatabaseGeodatabase的优势具有面向对象的特点空间数据与属性数据的统一存储可创建“智能化”的要素支持不同数据格式间的转换可移植
数据输入和编辑更加准确可伸缩的存储解决方案Geodatabase的三种类型个人地理数据库(.mdb):
FORMSACCESS,存储上限为2GB文件地理数据库(.gdb):
在文件系统中以文件夹的形式表现以二进制文件格式存储、每个表存储上限为1TB
ArcSDE地理数据库:
支持多用户并发编辑、存储于RDBMS中、伸缩性Geodatabase的高级特性几何网络(GeometricNetwork)网络数据集(NetworkDataset)
拓扑(Topology)逻辑示意图数据集(SchematicDataset)版本管理与离线编辑
Cha4-空间数据组织与管理
4.1数据库系统物理独立性:
与数据的物理存储细节和硬件环境无关逻辑独立性:
与具体的应用程序、开发工具及高级程序设计语言无关
4.2空间数据管理方式
1文件管理
2文件与关系数据库混合管理
3全关系型数据库管理
4面向对象数据库管理
5对象-关系数据库管理
6OracleSpatial空间数据存储
4.3空间数据引擎(SDE)
SDE是用来解决如何在关系数据库中存储空间数据,实现正真的数据库方式管理空间数据,建立空间数据服务器的方法。
作用
1.与空间数据库联合,为用户提供空间数据服务;
2.提供开放的数据访问,通过TCP/IP横跨任何同构或异构网络,支持分布式GIS系统
3.SDE对外提供空间几何对象模型,用户可以再次模型基础上建立空间对象,并对这些几何对象进行操作;
4.快速的数据提取与分析;
5.提供了连接DBMS数据库接口;
6.与空间数据库结合可以管理海量空间信息;
7.无缝的数据管理,实现空间数据库与属性数据库统一管理;
8.并发访问;
4.4空间数据与属性数据的连接
4.4.1图形数据与专题属性数据分别管理
4.4.2对通用DBMS扩展以增加空间数据的管理能力
4.4.3属性数据与图形数据具有统一的结构
4.4.4图形数据与属性数据自成体系
4.5纵向分层组织
方法:
1)专题分层
2)时间序列分层
3)地面垂直高度分层
作用:
1)管理简单;
2)可加快查询速度;
3)增加了图形显示的灵活性;
4)对不同数据层进行叠加,可进行各种目的的空间分析和专题制图。
缺点:
少考虑以分类属性和相互关系为基础的结构化实体的内在规律描述,使空间分析能力相对较弱,忽视了地理现象的本质特性及其之间的复杂内在联系,降低了信息的容量等。
4.6横向分块组织
是将某地图划分为多个图幅,以文件或表的形式存放在不同的目录或数据库中。
原因:
1)磁盘容量有限;
2)数据不完全;
3)数据库维护不便;
4)查询分析不高。
4.7栅格数据存储和管理栅格数据管理的目的:
1.将区域内相关的栅格数据有效地组织起来;
2.根据其地理分布建立统一的空间索引,快速调度数据库中任意范围的数据;
3.达到对整个栅格数据库的无缝漫游和处理;
4.与矢量数据库联合使用,复合现实各种专题信息。
组织形式:
1、栅格目录(RasterCatalog)用于管理有相同空间参考系的多幅栅格数据,各栅格数据在物理上独立存贮,易于更新,常用于管理更新周期块、数据量较大的影像数据,同时,栅格目录也可实现栅格数据和栅格数据集的混合管理。
其中,目录项既可以是单幅栅格数据,也可以是地理数据库中已经存在的栅格数据集,具有数据组织灵活、层次清晰的特点。
一般用于管理具有属性信息的影像数据,如分幅数据或者同一地区多期数据。
2、栅格数据集(RasterDataset)用于管理具有相同空间参考系的一幅或多幅镶嵌而成的栅格影像数据,物理上真正实现数据的无缝存储,适合管理DEM等空间连续分布、数据不经常变化,且频繁用于分析的栅格数据类型。
由于物理上的无缝拼接,因此,以栅格数据集为基础的各种栅格数据空间分析具有速度快、精度高的特点。
分块存储的优点:
栅格数据显示时,可减少数据的读盘时间;
有利于栅格数据的压缩,因为栅格数据具有局部相关性;
有利于数据库管理。
数据分块可以与数据库的记录相对应,便于利用商用数据库系统管理海量栅格数据;
第五章空间数据索引技术
5.1索引:
是对被索引数据集种的数据的某种属性的结构化描述,它使得在对数据进行查询时,不必遍历所有数据,只通过对索引数据的访问,就能得到查询结果或者得到一个能够包含全部查询结果的较小的数据集。
索引结构包括索引数据结构、索引的建立及维护算法等内容。
空间索引定义:
指依据空间对象的位置和形状或空间对象之间的某种空间关系,按一定的顺序排列的一种数据结构,其中包括空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针。
传统数据库索引:
B树、B+树、二叉树、ISAM索引、哈希索引等,主要针对一维数据数据的主关键字而设计,不能直接应用用空间数据。
索引文件:
是用来提高数据文件查询效率的辅助文件主索引:
如果数据文件的记录是按主码排序的,那么索引就只需要保存数据文件的每个磁盘页面第一个主码域值
作用:
作为一种辅助性的空间数据结构,空间索引介于空间操作算法和空间对象之间,借助空间索引的筛选,可以排除大量与特定空间操作无关的地理实体,从而缩小空间数据操作的范围,提高空间数据处理和空间分析的速度和效率。
为了提高数据存取和管理的效率,空间数据库都需建立空间索引。
空间索引提出的原因:
①计算机内外存访问的时间差;
②GIS数据的复杂性。
主要索引:
1简单网格空间索引(重点)
2二叉树索引
3B树索引
4四叉树索引
5.2Z-Curve
Z-Curve曲线是空间填充曲线,利用一个线性顺序来填充空间,可以获得从一端到另一端的曲线。
基于Z码的查询匹配算法
点查询:
使用二分法在排序文件中查找给出的z值,或在基于z值的B树索引上使用B树
搜索。
范围查询:
查询形状可以翻译成一组z值,就像它是一个数据区域一样。
然后搜索数据区域的z值以匹配z值。
匹配的有效性:
用z1和z2分别代表两个z值,其中z1是较短的一个,并未失去一般性;
对于相应的区域(比如块)r1和r2,只有两种可能:
1)如果z1是z2的前缀(例如,z1=l***,z2=11**或z1=*l**,z2=11**),则r1完全包含r2;
2)两个区域不相交(例如,z1=*0**,z2=11**)。
5.3Hilberlt
Hilberlt曲线转换
1)读入x和y坐标的n比特二进制表示。
2)隔行扫描二进制比特到一个字符串。
3)将字符串自左向右分成2bit长的串Si,其中i=1,…,n。
4)规定每个2bit长的串的十进制的制,例如:
“00”等于0,“01”等于l;
“10”等于3;
“11”等于2
5)j=0把后面数组中出现的所有1变成3,并把所有出现的3变成1;
j=3把后面数组中出现的所有0变成2,并把所有出现的2变成0。
6)将十进制的di自左向右按位转换成二进制表示,自左向右连接所有的串。
并计算其十进制。
(例如:
32->
1110=14)
5.4线性映射
使用空间填充曲线(Z序、Hilbert曲线等),将二维空间对象映射到一维空间,以便空间对象存储在标准的一维索引(例如B树)中。
5.5网格空间索引原理
a、每个要素在一个或多个网格中;
b、每个网格可含多个要素;
c、要素不真正被网格分割。
5.5评价网格索引性能的指标(必考)
网格大小(越大)、网格索引表记录数(越小)、网格索引表记录数(即空间索引表)与实体(即要素表)记录数的比率、平均每格的实体数(越多)、最大每格的实体数(越多)、完全分布在一个网格中的实体百分比(越高)。
理想的网格大小是:
使网格索引表记录不至于过多,同时使平均及最大每格的实体数处于较低的水平,这个水平可通过试验来得到经验最佳值。
网格的选择不能太大也不能太小,可根据数据的统计特征和空间对象的分布特征来求出最佳值。
传统的简单网格索引编码每个网格分别对应一个索引条目(记录),在每个索引记录中登记上所有位于或穿过该网格的物体的目标标识。
实现方法:
变长指针法、位图法
问题:
空间上相邻的网格编码不连续,若查询涉及的网格编码太多,则容易超出SQL模型
长度改进型单元网格索引编码
改进型单元网格索引将传统型编码由1维升至2维,变成X和Y方向上的编码;
将空间要素的标识、空间要素所在的网格的X和Y方向上的编码、以及空间要素的外包络
矩形作为一条数据库记录存储。
如果一个空间要素跨越多个网格,则同样存储多条记录。
5.6KD树索引
原理:
KD树的每个内部结点都包含一个点,每个结点表示k维空间中的一个点,并且和一
个矩形区域相对应,树的根结点和整个研究区域相对应。
KD树要求用平行于坐标轴的纵横
分界线将平面分为若干区域,使每个区域中的点数不超过给定值。
树中奇数层次上的点的x
坐标和偶数层次上的点的y坐标把矩形区域分成两部分。
特点:
继承二叉树优点,索引树级数多,树形状与点插入次序有关,可能不平衡,树深度不易控制;
最坏情况下,造成单枝;
删除中间结点,可能导致树重新组织,处理复杂;
树的平衡化复杂,不适合线和多边形实体;
5.7KDB树索引
KDB树是KD树与B树的结合,它由两种基本的结构区域页(regionpages,非叶结点)
和点页(pointpages,叶结点)组成,如图5-9所示。
点页存储点目标,区域页存储索引子空间的描述及指向下层页的指针。
在KDB树中,区域页则显式地存储了这些子空间信息。
区域页的子空间(如s11,S12和s13)两两不相交,且一起构成该区域页的矩形索引空间(如
S1)即父区域页的子空间。
SI
5.8BSP树索引
BSP树(BinarySpacePartitioningTree,二值空间划分树)也是一种二叉树,它将空间逐级进行一分为二的划分,例如,二维空间中,线被用作划分空间的对象。
如图5-10所示。
BSP
树能很好地与空间对象的分布情况相适应,但一般而言,BSP树深度较大,对各种操作均有
不利影响。
H]
*图5-10BSP树索引o
5.9G树索引
与KD树类似,G树也是按照循环交替的方式对空间进行分割,但它采取的是平均分割
空间的方法。
各维的属性值,都能规范化到0〜1区间,分割的每个区域不超过2个点。
5.10R树索弓I
R树是用空间对象的最小外包矩形R来表示对象的范围。
矩形是广义的概念。
R树及其众多变种都是一种平衡树,而结构类似于B树。
R树利用B树的某些本质特性来处理多维数据,是B树在多维空间的扩展。
R树的所有叶子都在同一层,其采用空间聚集的方式把相邻近的空间实体划分到一起,组成
更高一层的结点。
®
5-15R树索引数据结构示意圏
R树特点:
1)除根节点外,每个叶子结点包含了m-M条索引记录(其中m<
=M/2);
2)一个叶结点上的每条索引记录了(I,元祖标识符),1是最小外包矩形,在空间上它包含其了所指元祖表达的K维空间对象;
3)除根结点外,每个中间结点至多M个子结点,至少有m个子结点;
4)对于非叶子结点中的每个条目(I,子结点指针),I是在空间上包含其子结点中举行的最小外包矩形;
5)若根结点不是叶子结点,则至少包含2个子结点;
6)所有叶结点出现在同一层;
7)所有MBR的边与一个全局坐标系的坐标轴平行。
5.11R+树
R+树特点:
中点结点的目录矩形之间不能重叠,结点中的数据项和索引项数目没有严格的限制(但有最大数目限制),叶结点中的数据矩形允许重叠,一个空间的对象标识可能重复存储在多个叶结点中。
5.12R*树索引
R*树的特点:
在结构上与R+树完成相同,在数的构造、插入、删除、检索算法也基本相同,但在插入算法方面作了较多改进,提高了性能。
CELL树索引
Cell树的特点:
用凸多边形对空间进行划分,子空间不能重叠。
Cell树的磁盘访问次数比R
树和R+都少,搜索性能高。
第6章空间查询与访问
6.1关系代数:
选择(select)、投影(project)、并(union)、笛卡儿积(cross-product)、差(differenee)以及交(intersection)。
6.2SQL查询语言的功能
SQL语句是由命令、从句、运算和合计函数构成的。
它的基本功能包括查询(query)、操纵
(manipulation)、定义(definition)和控制(control)四个方面。
6.2为适应空间数据库领域,主要从以下方面扩展关系模型:
1)突破关系模型中关系必须是第一范式的限制,允许定义层次关系和嵌套关系。
2)增加抽象数据类型如图形数据类型点、线、面、栅格、图像等用户自定义数据类型;
3)增加空间谓词。
例如,表示空间关系的谓词,包括、相交等;
表示空间操作的谓词,叠加、缓冲区等;
4)增加适合于空间数据的索引方法,如R树、四叉树等;
5)
优势:
1)可以用统一的DBMS来管理图形数据和属性数据,即建立了整体空间数据库系统结构,可以克服由关系数据库相分离的系统结构所带来的一系列问题;
2)图形数据管理也可以享用DBMS在数据管理方面带来的优势,如数据安全保障、数据恢复、并发控制等;
3)图形数据关系化表达,使其能享用客户机/服务器优势。
数据库服务器的主要优点是服务器只把处理后的记录集(而不是整个文件)传输给客户机,从而有利于缓解网络负载。
6.3OGIS操作提供:
(1)针对所有几何类型的基本操作:
如SpatialReferenee用于获得空间参照系
(2)拓扑关系操作:
如Equal,Disjoint,Intersect,Touch,Cross,Within.Contains等。
(3)空间分析操作:
Distance,Buffer,Union.Intersection等。
6.4空间查询示例(以world数据库为例)
--Touch
查询1:
列出Country中所有与美国相邻的国家
SELECTCI.NameASNeighborsofUSA”
FROMCountryC1,CountryC2
WHERETouch(C1.Shape,C2.Shape)=1AND
C2.Name=,USA?
--,Cross
查询2:
找出River表中列出的河流流经的国家
SELECTR.Name,C.Name
FROMRiverR,CountryC
WHERECross(R.Shape,C.Shape)=1
--Distance
查询3:
对于River表的河流,在City中找