空间数据库期末复习docxWord格式.docx
《空间数据库期末复习docxWord格式.docx》由会员分享,可在线阅读,更多相关《空间数据库期末复习docxWord格式.docx(15页珍藏版)》请在冰豆网上搜索。
如果x为空集,则dim(x)=-lo
(2)测试实例:
Interior
Boundary
Exterior
2
1
O
(a)
(t»
基于扩展9-交模型的空间关系谓词描述:
谓词描述:
空间数据结构与组织(P37)
空间索引(P47)
空间数据管理:
1文件与关系数据库混合管理方式
优点:
文件和关系数据库混合应用,空间数据可用不定长文件格式记录;
缺点:
由于查询通过ID将属性数据和图形数据联系起来,使查询运算,模型操作运算速
度慢;
数据分布和共享困难;
因属性数据和图形数据分开存储,数据一致性维护困难即数据的一致性、完整性、安全性差;
缺之表示空间对象及其关系的能力。
2纯关系型数据库管理方式
在全关系型数据库中加入了二进制数据块形式可提高查询速度;
便于数据的维护;
不定长记录造成存储效率的下降;
实现SQL查询要附加接口;
因此它只适用于功能简单的GIS。
3对象-关系数据库管理方式
解决了空间数据的变长记录管理,使数据管理效率大大提高;
空间和属性之间联结有空间数据管理模块解决,空间数据查询速度快。
不仅有操作关系数据的函数,还有操作图形的API函数。
空间数据对象还不能有用户任意定义,使用受一定限制。
如Oracle在其数据库中加入了SpatialWare组件,以支持空间数据;
Informix为用户定义数据类型提供了DataBlade插件。
遥感影像数据库管理
影像金字塔:
是指在统一的空间参照下,根据用户需要以不同分辨率进行存储与显示,形成分辨率由粗到细、数据量由小到大的金字塔结构。
SQL查询语言
1974年由Boyce和Chamberlin提出
1一体化
集DDL,DQL,DML,DCL于一体
单一的结构--关系,带来了数据操作符的统一
2面向集合的操作方式
一次一集合,数据操纵的对象和结果都是集合
3高度非过程化
用户只需提出“做什么”,无须告诉“怎么做”,不必了解存取路径
减轻用户负担,提高数据独立性
4两种使用方式,统一的语法结构
SQL既是自含式语言(用户使用),又是嵌入式语言(程序员使用)
5语言简洁,易学易用
SQL语言完成数据定义、操纵、控制和查询的核心功能只用了9个动词
SQL语言语法简单,接近自然语言,容易学习和使用
第三章GIS数据库设计
GIS数据库设计过程:
(2)概念设计
(4)物理设计
(1)需求分析
(3)逻辑设计
3.2.2实体-联系模型(E-R)
E-R模型的结构
E-R模型的构成成分是实体集、属性和联系集,其表示方法如下:
(1)实体集用矩形框表示,矩形框内写上实体名。
(2)实体的属性用椭圆框表示,框内写上属性名,并用无向边与其实体集相连。
(3)实体间的联系用菱形框表示,联系以适当的含义命名,名字写在菱形框中,用无向连线将参加联系的实体矩形框分别与菱形框相连,并在连线上标明联系的类型,即1—1、1—M或M—M。
图斑号)1图斑[零星地类'
\
、地类号〕1毛面积、|'
净面积通状地物kJI」
实体的属性
3.2.4E-R模型设计步骤与方法
1)设计局部的E-R模型
2)设计全局的E-R模型
3)全局E-R模型的优化
3.3关系型数据库设计
3.3.1关系模型的基本概念
域:
是一组具有相同数据类型的值的集合。
主键(码):
若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码。
主码:
若一个关系有多个候选码,则选定其中一个为主码。
主码的诸属性称为主属性。
不包含在任何侯选码中的属性称为非码属性。
主键(码)的性质:
(1)唯一性
(2)非冗余性(3)有效性
关系模型:
是由若干关系模式组成的集合,是用二维表格结构表示数据及数据之间联系的数据模型。
3.3.2关系数据库设计理论
(1)数据依赖理论
1)数据依赖:
定义属性值间的相互关联(主要体现于值的相等与否),这就是数据依赖,
它是数据库模式设计的关键。
2)函数依赖(P98):
1函数依赖
2平凡函数依赖与非平凡函数依赖
3完全函数依赖与部分函数依赖
4传递函数依赖
(2)规范化理论(P99)
范式:
是符合某一种级别的关系模式的集合。
第一范式
如果一个关系模式R的所有属性都是不可分的基本数据项,则ReINFo
例:
关系模式SLC(Sno,Sdept,Sloe,Cno,Grade)
Sloe为学生住处,假设每个系的学生住在同一个地方。
函数依赖包括:
(Sno,Cno)fGrade
Sno一Sdept
(Sno,Cno)PSdept
Sno一Sloe
(Sno,Cno)PSloe
Sdept一Sloe
问题:
(1)插入异常
⑵删除异常
(3)数据冗余度大
(4)修改复杂
解决方法:
分解为两个关系模式,以消除这些部分函数依赖。
第二范式
若关系模式ReINF,并且每一个非主属性都完全函数依赖于R的码,则R£
2NFo优点:
采用投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。
不足:
将一个1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。
第三范式
如果一个关系模式R属于2NF,并且R的任何一个非主属性都不传递依赖于他的任何一个候选键,则称R为第二范式记为RG3NF。
BC范式(BCNF)
设关系模式R<
U,F>
eiNF,如果对于R的每个函数依赖X-Y,若Y不属于X,
则X必含有候选码,那么ReBCNFo
3.3.3关系数据库设计步骤与方法
1E-R图向关系模型的转换
2数据模型的优化
3关系模型的优化
3.5地理信息元数据的设计
3.5.1地理信息元数据确定的原则
1完整性核心元数据集是有效描述数据特征的最小元数据元素集合,它应该完整地描述数据集最重要的信息。
2准确性在确定核心元数据内容时,需要对相关领域的理论与技术有全面的了解,准确而简洁地描述数据集主要特征的数据元素整合起来。
3结构性地理信息元数据之间具有复杂的联系,应根据其结构联系进行合理的组织,以便对元数据进行修改或扩展时不破坏其整体结构。
4与其他标准的一致性由于元数据也是其他标准的高度概括,在制定元数据时,应调研相关领域现有的国际标准与国家、行业标准,尽量采用已颁布的标准。
3.5.2地理信息元数据的主要内容
1标识信息是唯一标识数据集的元数据信息。
2数据质量信息是数据及质量的总体评价。
3空间参照系统信息对数据集使用的空间参照系统的说明。
4内容信息描述数据集的主要内容,包括实体和属性信息。
5核心元数据参考信息包括核心元数据发布或更新的日期,以及与建立核心元数据单位的联系信息。
3.5.3地理信息元数据的组织
1按照元素性质来组织
2按照功能来组织
3按照使用范围来组织
4按照重要程度来组织
3.6Geodatabase数据库设计(P119)
第五章GIS数据库标准
1、GIS标准化的作用
(1)可移植性:
为了获得在硬件、软件和系统上的综合投资效益,系统必须是可移植的,使所开发的应用模块和数据库能够在各种计算机平台上移植;
(2)互操作性:
一个大型信息系统,往往是一个山多种计算机平台组成的复杂网络系统,有了标准,可以促进用户从网络的不同节点上获取数据。
即从不同硬件环境中获取数据和实现各种应用。
(3)可伸缩性:
为了适应不同的项目和应用阶段,一种优秀的软件必须以相同的用户界面在不同大小级别的计算机上运行。
(4)通用环境:
标准提供了一个通用的系统应用环境,如提供通用的用户界面和查询方法等。
利用这个通用环境,用户可以减少在学习上的弯路和提高生产效率。
2、GIS标准的内容
(1)应用标准
1地理标准主要指地图和空间数据表达方面的标准。
涉及地图要素的位置和位置精度,以及空间信息的分类编码。
2算法标准为了提高应用精度和进行数据转换,各种算法需要达到一定的标
准,同时给用户提供指南。
3解译标准
(2)数据标准
1数据变换将一种数据格式转换为另一种数据格式的技术。
2数据精度主要包括数据的世系性、数据位置精度、属性精度、数据的逻
辑一致性、数据的完备性、数据的时效性。
(3)信息技术标准
(4)行业标准
3、论述GIS数据源的质量问题(作业习题)
5.2.1GIS数据分类编码的意义
实现系统内和系统间信息交换、集成与信息共享。
5.2.2GIS数据分类编码的原则
1科学性和系统性
2稳定性
3不受比例尺限制
4兼容性与一致性
5适用性
6规范化
7国际性
OpenGIS定义的三种模型:
1)开放的地理数据模型
2)OpenGIS服务
3)信息团体模型
5.2.3GIS数据分类编码的方法
GIS数据的分类方法(P188)
1.1线分类法
1.2面分类法
5.2.4GIS数据的分类体系和指标体系
1、地图分类方法
2、成因分类法
3、空间分类法
5.3GIS数据库的数据质量
空间数据质量是指空间数据在表达空间位置、专题特征以及时间信息时能够达到的准确性、一致性、完整性,以及他们二者之间同一性的程度。
5.3.1GIS数据质量概述
①②③④⑤⑥
准确性一个记录值(测量或者观察值)与它的真实值之间的接近程度。
精度数据对现象描述的详细程度。
空间分辨率两个可测量数值之间最小的可辨识的差异。
比例尺
误差测量值和真实值之间的差别。
不确定性包括:
位置的不确定性、属性的不确定性、时域的不确定性、逻
辑上的不一致性以及数据的布完整性;
5.3.2GIS数据源的质量问题
1空间现象自身存在的不稳定性
2空间现象的表达
3空间数据处理中的误差
4空间数据使用中的误差
5.3.3GIS数据库建立过程中的数据质量问题
1属性表的规范化设计
2高程数据的采样设计
3空间数据的配准
4数据质量控制
5数据现时性的解决
6利用数据字典的数据质量跟踪
5.3.4数据质量分析与评价(P200简单了解)
附:
将E-R图转换为关系模型的转换规则如下:
•1)实体集转换为关系
-实体集对应于一个关系
-关系名:
与实体集同名。
-属性:
实体集的所有属性。
-主码:
实体集的主码。
•
2)联系转换为关系
联系转换成为关系模式。
联系转换成为关系模式时,要根据联系方式的不同采用不同的转换方式
①1:
1联系的转换方法
a)将1:
1联系转换为一个独立的关系:
与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,且每个实体的码均是该关系的候选码。
b)将1:
1联系与某一端实体集所对应的关系合并,则需要在被合并关系中增加属性,其新增的属性为联系本身的属性和与联系相关的另一个实体集的码。
②1:
n联系的转换方法
第一步:
联系形成的关系独立存在:
职工表(职工号,姓名,年龄)主码:
职工号产品表(产品号,产品名,价格)主码:
产品号
负责(职工号,产品号)主码:
职工号或产品号
合并方案1:
“负责”与“职工”两关系合并:
职工(职工号,姓名,年龄,产品号)产品(产品号,产品名,价格)
合并方案2:
“负责”与“产品”两关系合并:
职工(职工号,姓名,年龄)
产品(产品号,产品名,价格,职工号)
a)一种方法是将联系转换为一个独立的关系,其关系的属性由与该联系相连的各实体集的码以及联系本身的属性组成,而该关系的码为n端实体集的码;
b)另一种方法是在n端实体集中增加新属性,新属性由联系对应的1端实体集的码和联系自身的属性构成,新增属性后原关系的码不变。
步骤一:
联系形成的关系独立存在。
仓库(仓库号,地点,面积)主码:
仓库号产品(产品号,产品名,价格)主码:
产品号仓储(仓库号,产品号,数量)主码:
产品号合并后方案:
联系形成的关系与n端对象合并。
仓库(仓库号,地点,面积)
产品(产品号,产品名,价格,仓库号,数量)
③m:
在向关系模型转换时,一个m:
n联系转换为一个关系。
转换方法为:
与该联系相连的各实体集的码以及联系本身的属性均转换为关系的属性,新关系的码为两个相连实体码的组合(该码为多属性构成的组合码)。
•该模型包含两个实体集(学生、课程)和一个m:
n联系
・该模型可转换为三个关系模式:
-学生(学号,姓名,性别,年龄)主码:
学号
-课程(课程号,课程名,学分)主码:
课程号
-选课(学号,课程号,成绩)主码:
学号+课程号