空间数据库真题精选Word文档格式.docx
《空间数据库真题精选Word文档格式.docx》由会员分享,可在线阅读,更多相关《空间数据库真题精选Word文档格式.docx(11页珍藏版)》请在冰豆网上搜索。
举例说明数据模型的重要性。
数据模型是数据集的特定结构和模式,是对数据的文件描述,有利于某些性质的前期分析。
作用:
①、属性的前期分析;
②、重利用多媒体应用中的共享数据;
③、组织中交换数据
④、将数据传递给新软件或环境
例子:
千禧年危机正确的使用数据模式可以显著的降低成本,如果软件中的时间和数据被定义成抽象数据模型,只有一小部分的软件会执行数据,ADT数据要被重新修改。
8简述两种常用的空间信息模型:
要素模型和场模型,栅格数据结构。
场模型:
①、空间分割框架
②、场函数
③、场操作:
并、复合
森林模型中分段函数表示,区域中每个点被映射成主要树种对应的值
要素模型:
①、对象:
把空间信息抽象成明确的,可识别的事物或实体;
②、对象具有属性和操作
森林模型中多边形表示(林分),每个对象有唯一的标示符、主要树种和一块区域。
栅格数据结构:
栅格结构用密集正方形(或三角形,多边形)将地理区域划分为网格阵列。
位置由行,列号定义,属性为栅格单元的值。
点:
由单个栅格表达。
线:
由沿线走向有相同属性取值的一组相邻栅格表达。
面:
由沿线走向有相同属性取值的一片栅格表达。
9什么是拓扑关系,举例说明拓扑与非拓扑特性、拓扑与非拓扑操作。
是指满足拓扑几何学原理的各空间数据间的相互关系。
即用结点、弧段和多边形所表示的实体之间的邻接关联和包含等关系。
拓扑特性:
弹性变形后临近物体之间的拓扑关系没有发生改变。
非拓扑特性:
弹性变形后临近物体之间的拓扑关系发生了改变。
拓扑操作与非拓扑操作:
10说明九交模型表达拓扑关系的原理。
在一个平面上。
两个对象A、B之间的二元拓扑关系主要基于以下的相交情况,即分别是A和B的内部、边界、外部。
值六部分可以构成九交模型。
考虑取值有空(0)和非空
(1),可以确定有29=512种二元拓扑关系。
对于R2嵌在中的二维区域,有八个关系是可实现的,并且它们彼此互斥且完全覆盖。
:
相离、相接、交叠、相等、包含、在内部、覆盖、被覆盖。
11ER模型的作用,ER图包括哪些要素,如何表达多值属性?
ER图与空间信息对象模型之间的异同?
ER图可以以一种避开计算机隐喻的方式来表达这个微型世界,从而把应用中的概念与实现细节分离开来。
ER图包括实体(物理上或概念上独立存在的事物或对象)、属性和联系。
实体用属性来刻画性质,实体之间通过练习相互作用和关联。
属性可以是单值或多值。
ER图中实体用矩形表示,属性表示为椭圆,联系为菱形。
码属性加下划线,多值属性用双椭圆。
异同:
①、实体是物体属性的集合;
②、ER模型不允许普通用户定义操作;
③、在对象模型中关系不被直接支持,但可以由操作来模仿。
12数据库三层约束的内容:
码约束--实体完整性(entityintegrity)约束,参照完整性(referentialintegrity]约束和用户参照完整性。
简述关系模式中的三种完整性。
码约束:
每个关系必须要有一个主码;
实体完整性约束:
主码不能为空;
参照完整性约束:
外码的属性值要么是另一个关系的主码,要么为空值。
13对于空间数据,ER模型方法的不足之处?
为表达空间概念,扩展ER模型主要增加了哪些要素?
不足之处:
ER模型的最初设计隐含了基于对象模型的假设。
因此,场模型无法用ER模型进行自然的映射
增加的要素:
在传统的ER模型中,实体之间的联系由所要开发的应用来导出,而在空间建模中,空间对象之间总会有内在的联系
14举例说明类、属性、方法、聚合、泛化、和关联等概念?
类:
是多有在应用中具有相同性质的对象的封装,等价于ER模型中的实体;
例如设施就是一个类。
属性:
描述类的对象。
属性还有一个与之相关联的作用域,分为公有、私有、受保护。
方法:
是一些函数,是类定义的一部分,用来修改类的行为或状态。
关系:
将一个类与另一个类或者它自己相联系,类似于ER中的联系。
UMLCD中三种。
重要关系:
聚合、泛化、关联。
聚合:
描述部分与整体的关系:
强聚合、弱聚合。
泛化:
eg.多边形是点线面的泛化;
关联:
反应不同类的对象是如何联系的。
15比较ER与UML。
1)、没有方法的类就是实体;
2)、属性在两个里都一样;
3)、UML中没有主键和完整性约束;
4)、ER中没有方法;
5)、ER中关系的内容更丰富;
6)、ER图中的实体与数据集有关,但UML的类几乎和数据集无关。
16请列举SQL所包含的功能。
数据定义语言DDL:
创建和修改关系表(包括索引)
数据操纵语言DML:
插入,删除,更新,查询
数据控制语言DCL:
并发控制,事务处理
17IsrelationalDBMSphysicaldatamodelsuitableforspatialdata?
如果不适合,有哪两类解决途径?
不合适。
关系DBMS则只能对数字进行简单处理;
排序、查询树对数字非常有效,但这些概念都不适合用于处理空间数据
途径1:
重新使用关系物理数据模型的概念:
用空间填充曲线来定义点的排列有助于使用有序文件和查询树但可能会导致计算无效率
途径2:
新空间技术:
空间索引:
例如网格,能提供更好的计算表现
18磁道track、扇区sector、柱面cylinder、页面的概念是什么?
磁道:
圆心磁盘片上向边缘延伸的同心圆
扇区:
每个磁道中被分成若干等份的区域
柱面:
是磁盘上具有相同镭的磁道的集合
页面:
又称磁盘块,是磁盘与主存之间的最小传输单位
19使用空间填充曲线组织空间数据的意义?
1.加强了多维空间中的位置排序。
2.允许在空间数据中使用传统的有效搜索
20什么是索引?
索引文件是用来提高数据文件查询效率的辅助文件。
记录的只有码值和数据文件中的页面地址。
索引记录被排序,数据文件本身可以是不按关键码排序。
主索引:
如果数据文件的记录是按照主码排列的,那么索引就只需要保存数据文件的每个磁盘页面第一个主码域值。
每个索引记录一个数据页面。
二级索引:
堆数据文件,一个索引记录一个数据。
一个磁盘最多只有一个主索引,因为主索引决定了数据在磁盘上的存储顺序。
21网格文件包含哪两部分内容?
包含n维网格目录,目录只能够的每一项指向一个数据桶。
第二部分是由称为线性比例的一维数组组成的结构。
更多内容请访问《睦霖题库》微信公众号
22空间查询的基本构件有哪些?
点查询:
给定一个查询点P,找出所有包含它的空间对象O
范围或区域查询:
给定一个查询多边形P,找出所有与之相交的空间对象O
空间链接:
两个表R和S基于一个空间谓语θ进行连接时,该连接成为空间连接。
最近邻居:
空间聚集,即给定一个对象O,找出所有距离O最近的对象P
23对于点查询、区域查询、空间连接查询操作,各自有哪些处理算法(策略)?
它们与什么因素有关?
数据未排列且没有索引:
穷举法,扫描整个文件并判断每条记录是否满足谓语
建立空间索引:
在索引中使用find操作;
需要查找的磁盘扇区等于索引的深度
空间填充曲线散列:
运用折半法寻找点;
检验大约logB(n),的磁盘扇区
区域查询:
在索引中使用范围查询操作
验证Z值满足范围查询要求;
使用折半查询找到最低的Z值;
扫描前面的数据文件直至满足查询要求的最大的Z值
空间连接:
嵌套循环,检验所有可能的空间谓语对;
基于空间分块,只检验普通空间区域的对象对
树匹配:
从每张表中找出分层的的对象组
24什么是查询优化器?
查询优化器所承担的主要任务是什么?
查询优化器是数据库软件中的一个模块,它用于产生不同计算计划并确定适当的执行策略。
主要任务:
逻辑转换、动态规划。
25DistributedEnvironments的概念?
在分布式环境下,空间数据库系统面临哪些挑战?
概念是:
自治异质计算机的集合,通过网络连接,服务器框架:
服务器提供定义明确的服务,用户使用服务。
面临的挑战:
概念模型上:
不同种类模式之间的转换
逻辑模式上:
在其他SDBMS上命名、查询表;
其他SDBMS上的表要复制原始表
查询过程与优化:
通过网路的数据传输代价将会主导CPU和I/O代价,需要新的
策略来控制数据的传输成本。
26对查询树进行逻辑转换的目的和一般方法是什么?
方法:
将非空间的选择和投影操作下推
目的:
减少连接操作所涉及的关系大小,从而减少计算代价。
27空间查询处理的“过滤-精炼模式”是什么,其目的?
目的:
用两步算法高效地处理复杂的数据类型
过滤:
寻找Q最终结果的超集S
精炼:
利用GIS处理S来找到精确的Q的答案
28从查询处理的角度来看,空间数据库与关系数据库之间有哪些主要区别?
至少有三个主要区别:
①、与关系数据库不同,空间数据库没有固定的运算符集合可以充当查询计算的基本构件
②、空间数据库要处理非常大量的复杂对象,这些对象具有空间范围,不能自然的排列成一维数组。
③、检测空间谓语要用到计算量极大的算法,所以不能再假定I/O代价在CPU的处理代价中只能主导地位
29什么是空间索引?
有哪些空间索引方法?
空间索引就是依据空间对象的位置和形状或空间对象之间的某种空间关系按一定的顺序排列的一种数据结构,其中包含空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针。
空间索引的方法:
1)在系统中加入专门的外部空间数据结构,为空间属性提供如同B树之于线性属性的功能。
2)使用空间填充曲线(如Z序、Hilbert曲线)将空间对象映射到一维空间,以便空间对象存储在标准的一维索引中。
30页面的概念是什么?
磁盘与主存之间的最小传输单位。
一个文件可能跨越多个页面。
一个页面是槽的集合,一个槽包含一条记录
31计算机存储设备的种类?
数据库系统是怎么利用各种设备的?
主存:
速度快,但是信息断电丢失
二级存储器:
速度慢,但是信息断电不丢
脱机存储器:
速度非常慢,但是保存的信息量非常大
32Whatisaphysicaldatamodel?
Whylearnphysicaldatamodelconcepts?
1)、执行逻辑数据模型的理论基础,使用现有的构件在一个有效容错的方式中
2)、选择合适的DBMS,某些DBMS不支持空间索引;
使DBMS运行的更加有效率。
33UML的作用?
了解UML的主要符号。
UML是用于面向对象软件设计的概念层建模的新兴标准之一,它是一种标准化语言,用于在概念层对结构化模式和董涛行为进行建模。
34举例说明用象形符号扩展ER图,对于空间数据建模有何好处?
用象形符号扩展ER图,以便专门处理空间数据类型。
这将减少ER图以及所产生的关系模式的复杂度,同时改进空间建模的质量。
空间联系(例如Road-Crosses-River)就可以从ER图中省略,用隐式的方式表示。
关系模式中的表达多值空间属性的关系和M:
N空间联系也就不需要了
35外码的概念是什么?
外码是一个关系的属性集,这个关系被复制到另外一个关系中。
主码与外部码提供了一个实现关系间联系的手段。
36数据库设计的三个步骤及其主要内容。
首先,采用高层次的概念数据模型来组织所有与应用相关的可用信息;
然后,逻辑建模阶段,与概念数据模型在商用DBMS上的具体实现有关
最后,数据库设计的第三个步骤是物理设计的建模,它解决数据库营养在计算机中具体实现是方方面面的细节。
37OGIS提出的关于空间几何体的基本构件有哪些?
38基于场模型的操作有哪些,举例说明区基于场模型的局部操作、聚焦(focal)和区域操作?
基于对象模型的操作有哪些?
基于场模型:
局部操作:
空间框架内一个给定位置的新场的取值只依赖于同一个位置场的输入值。
聚焦操作:
在指定位置的结果场的值依赖于同一位置的一个假定小领域输入场的值。
极限、高程场的梯度
区域操作:
与聚集运算符或微积分中的积分运算有关。
计算每个树种的平均高度。
基于对象模型:
面向集合、拓扑、方位、度量空间
39查询优化和数据挖掘的概念。
查询优化:
基于数据集的特点对查询中的操作进行排序,为每一步操作选择有效策略数据挖掘:
即进行系统的搜索,找出隐藏在电子信息中潜在的有用信息。
40平面扫描(planesweep)技术主要解决什么问题?
其主要步骤?
主要解决的是如何在过滤阶段中尽可能多的淘汰不符合条件的对,从而减少几何计算的计算代价。
Step1:
从左至右移动一条扫描线(例如,垂直于x轴的线),停在R∪S的第一个元素处。
这就是具有最小T.xl值的矩形T,例子为是矩形R4。
Step2:
搜索S中已排序的矩形,直到抵达第一个矩形Sf,这里有Sf.xl>
T.xu。
显然,对于所有1≤j
<
f,关系[t.xl,t.xu]∩[sj.xl,sj.xu]存在(非空),在本例中sf就是s1。
r4,s2>
Step3:
如果对任意l≤j≤f,关系[T.yl,T.yu]∩[Sj.yl,Sj.yu]存在,则Sj与T相交。
因此,这一步就确定了R4与S2的确是交叠的,并且<
R4,S2>
是连接结果的一部分。
记录所有这样的信息,然后将矩形T(R4)从集合R∪S中去掉,它不再需要参与结果集中的其他相交对。
Step4:
继续移动扫描线来穿过集合R∪S,直至碰到下一个矩形,在本例中是S2。
这时进行步骤2和3。
Step5:
当R∪S=∅时,处理结束;
41空间数据库主要涉及哪些内容?
数据模型、查询语句、查询处理与优化、文件组织和索引、数据挖掘
42用传统数据库系统管理空间数据,存在什么不足之处?
1)无法用递归和嵌套的方式来描述复杂关系的层次和网状结构,模拟和操作复杂地理
2)用关系模型描述本身具有复杂结构和涵义的地理对象时,需对地理实体进行不自然的分
3)由于概念模式和存储模式的相互独立性,及实现关系之间的联系需要执行系统开销较大的联接操作,运行效率不够高
4)空间数据通常是变长的,而一般RDBMS只允许记录的长度设定为固定长度,此外,通用DBMS难于存储和维护空间数据的拓扑关系。
5)一般RDBMS都难以实现对空间数据的关联、连通、包含、叠加等基本操作。
6)一般DBMS不能支持GIS需要的一些复杂图形功能。
7)一般RDBMS难以支持复杂的地理信息,因为单个地理实体的表达需要多个文件、多条记录,包括大地网、特征坐标、拓扑关系、属性数据和非空间专题属性等方面信息。
8)GIS管理的是具有高度内部联系的数据,为了保证地理数据库的完整性,需要复杂的安全维护系统,而这些完整性约束条件必须与空间数据一起存储,由地理数据库来维护系统数据的完整性。
否则,一条记录的改变会导致错误、相互矛盾的数据存在,而一般RDBMS难以实现这一功能。
43什么是GIS,什么是SDBMS?
请阐述二者的区别和联系
1、GIS是一个利用空间分析功能进行可视化和空间数据分析的软件。
它的主要功能有:
搜索、定位分析、地形分析、流分析、分布、空间分析/统计、度量G.IS可以利用SDBMS来存储、搜索、查询、分享大量的空间数据集
2、SDBMS是一个软件模块。
②、支持多种空间数据模型、相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言
③、支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规则
3、区别与联系:
①、利用GIS可以对某些对象和图层进行操作,而利用SDBMS则可以对更多的对象集和图层进行更加简单的操作
②、SDBMS可以在GIS不能使用的某些领域进行使用,例如基因组学、天文学、多媒体信息系统等
③、GIS可以作为SDBMS的前端,利用一个高效的SDBMS可以大大提高GIS的效率和生产率。