第4章 数据库设计基础.docx
《第4章 数据库设计基础.docx》由会员分享,可在线阅读,更多相关《第4章 数据库设计基础.docx(13页珍藏版)》请在冰豆网上搜索。
第4章数据库设计基础
第4章数据库设计基础
经过对部分考生的调查以及对近年真题的总结分析,笔试部分经常考查的是数据库管理系统,数据库基本特点,数据库系统的三级模式及二级映射,E-R模型,关系模型和关系代数,读者应对此部分进行重点学习。
详细重点学习知识点:
1.数据的概念、数据库管理系统提供的数据语言、数据管理员的主要工作、数据库系统阶段的特点、数据的物理独立性及逻辑独立性、数据统一管理与控制、三级模式及两级映射的概念
2.数据模型3个描述内容、E-R模型的概念及其E-R图表示法、关系操纵、关系模型三类数据约束
3.关系模型的基本操作、关系代数中的扩充运算
4.数据库设计生命周期法的4个阶段
4.1数据库系统的基本概念
考点1数据、数据库、数据库管理系统
考试链接:
考点1在笔试考试中,是一个经常考查的内容,在笔试考试中出现的机率为70%,主要是以选择题的形式出现,分值为2分,此考点为重点识记内容,读者还应该识记数据语言所包括的数据定义语言、数据操纵语言和数据控制语言。
数据是数据库中存储的基本对象,描述事物的符号记录。
数据库是长期储存在计算机内、有组织的、可共享的大量数据的集合,它具有统一的结构形式并存放于统一的存储介质内,是多种应用数据的集成,并可被各个应用程序所共享。
数据库管理系统(DBMS,DatabaseManagementSystem)是数据库的机构,它是一种系统软件,负责数据库中的数据组织、数据操作、数据维护、控制及保护和数据服务等。
数据库管理系统是数据系统的核心,主要有如下功能:
数据模式定义、数据存取的物理构建、数据操纵、数据的完整性、安全性定义和检查、数据库的并发控制与故障恢复、数据的服务。
为完成数据库管理系统的功能,数据库管理系统提供相应的数据语言:
数据定义语言、数据操纵语言、数据控制语言。
数据库管理员的主要工作如下:
数据库设计、数据库维护、改善系统性能,提高系统效率。
考点2数据库系统的发展
考试链接:
考点2在笔试考试中出现的机率为30%,主要是以选择题的形式出现,分值为2分,此考点为识记内容,读者还应该注意各个阶段的特点。
数据管理技术的发展经历了3个阶段,见表4-1:
表4-1各阶段特点的详细说明
考点3数据库系统的基本特点
考试链接:
考点3在笔试考试中出现的机率为30%,主要是以填空题的形式出现,分值为2分,此考点为识记内容,读者还应该理解物理独立性和逻辑独立性的定义。
数据独立性是数据与程序间的互不依赖性,即数据库中的数据独立于应用程序而不依赖于应用程序。
数据的独立性一般分为物理独立性与逻辑独立性两种。
(1)物理独立性:
指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。
当数据的物理结构(包括存储结构、存取方式等)改变时,如存储设备的更换、物理存储的更换、存取方式改变等,应用程序都不用改变。
(2)逻辑独立性:
指用户的应用程序与数据库的逻辑结构是相互独立的。
数据的逻辑结构改变了,如修改数据模式、增加新的数据类型、改变数据间联系等,用户程序都可以不变。
数据统一管理与控制主要包括以下3个方面:
数据的完整性检查、数据的安全性保护和并发控制。
考点4数据库系统的内部结构体系
考试链接:
考点4在笔试考试中出现的机率为30%,主要是以选择题的形式出现,分值为2分,此考点为识记内容,读者还应该理解三级模式及两级映射的定义。
误区警示:
一个数据库只有一个概念模式。
一个概念模式可以有若干个外模式。
三级模式都有几种名称,读者应该熟记每个模式的另一些名称。
1.数据统系统的3级模式
(1)概念模式,也称逻辑模式,是对数据库系统中全局数据逻辑结构的描述,是全体用户(应用)公共数据视图。
一个数据库只有一个概念模式。
(2)外模式,外模式也称子模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,它是由概念模式推导而出来的,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
一个概念模式可以有若干个外模式。
(3)内模式,内模式又称物理模式,它给出了数据库物理存储结构与物理存取方法。
内模式处于最底层,它反映了数据在计算机物理结构中的实际存储形式,概念模式处于中间层,它反映了设计者的数据全局逻辑要求,而外模式处于最外层,它反映了用户对数据的要求。
小提示:
内模式处于最底层,它反映了数据在计算机物理结构中的实际存储形式,概念模式处于中间层,它反映了设计者的数据全局逻辑要求,而外模式处于最外层,它反映了用户对数据的要求。
2.数据库系统的两级映射
两级映射保证了数据库系统中数据的独立性。
(1)概念模式到内模式的映射。
该映射给出了概念模式中数据的全局逻辑结构到数据的物理存储结构间的对应关系;
(2)外模式到概念模式的映射。
概念模式是一个全局模式而外模式是用户的局部模式。
一个概念模式中可以定义多个外模式,而每个外模式是概念模式的一个基本视图。
疑难解答:
数据库应用系统的结构是什么样的?
数据库应用系统的7个部分以一定的逻辑层次结构方式组成一个有机的整体,它们的结构关系是:
应用系统工、应用开发工具软件、数据库管理系统、操作系统、硬件。
4.2数据模型
考点5数据模型的基本概念
考试链接:
考点5在笔试考试中是一个经常考查的内容,出现的机率为70%,主要是以填空形式出现,分值为2分,此考点为重点识记内容,读者应该识记数据模型的3个部分。
数据模型用来抽象、表示和处理现实世界中的数据和信息。
分为两个阶段:
把现实世界中的客观对象抽象为概念模型;把概念模型转换为某一DBMS支持的数据模型。
数据模型所描述的内容有3个部分,它们是数据结构、数据操作与数据约束。
考点6E-R模型
考试链接:
考点6在笔试考试中出现的机率为30%,主要是以选择题的形式出现,分值为4分,此考点为理解内容,读者应该理解实体间三种函数关系,识记实体、属性、联系各用什么图形来表示。
1.E-R模型的基本概念
(1)实体:
现实世界中的事物可以抽象成为实体,实体是概念世界中的基本单位,它们是客观存在的且又能相互区别的事物。
(2)属性:
现实世界中事物均有一些特性,这些特性可以用属性来表示。
(3)码:
唯一标识实体的属性集称为码。
(4)域:
属性的取值范围称为该属性的域。
(5)联系:
在现实世界中事物间的关联称为联系。
两个实体集间的联系实际上是实体集间的函数关系,这种函数关系可以有下面几种:
一对一的联系、一对多或多对一联系、多对多。
2.E-R模型的图示法
E-R模型用E-R图来表示。
(1)实体表示法:
在E-R图中用矩形表示实体集,在矩形内写上该实体集的名字。
(2)属性表示法:
在E-R图中用椭圆形表示属性,在椭圆形内写上该属性的名称。
(3)联系表示法:
在E-R图中用菱形表示联系,菱形内写上联系名。
考点7层次模型
考试链接:
考点7在笔试考试中出现的机率为30%,主要是以选择题的形式出现,分值为2分,此考点为识记内容,读者应该理解层次模型的定义。
它的基本结构是树形结构。
满足下面两个条件的基本层次联系的集合为层次模型。
(1)有且只有一个结点没有双亲结点,这个结点称为根结点;
(2)除根结点以外的其他结点有且仅有一个双亲结点。
考点8关系模型
考试链接:
考点8笔试考试中,是一个经常考查的内容,在笔试考试中出现的机率为70%,主要是以选择题的形式出现,分值为2分,此考点重点掌握为理解内容,读者应该理解二维表的7个性质,识记三类数据约束。
误区警示:
当对关系模型进行查询运算,涉及到多种运算时,应当注意它们之间的先后顺序,因为有可能进行投影运算时,把符合条件的记录过滤,产生错误的结果。
关系模型采用二维表来表示,二维表一般满足下面7个性质:
(1)二维表中元组个数是有限的--元组个数有限性;
(2)二维表中元组均不相同--元组的唯一性;
(3)二维表中元组的次序可以任意交换--元组的次序无关性;
(4)二维表中元组的分量是不可分割的基本数据项--元组分量的原子性;
(5)二维表中属性名各不相同--属性名唯一性;
(6)二维表中属性与次序无关,可任意交换--属性的次序无关性;
(7)二维表属性的分量具有与该属性相同的值域--分量值域的统一性。
在二维表中惟一标识元组的最小属性值称为该表的键或码。
二维表中可能有若干个健,它们称为表的侯选码或侯选健。
从二维表的所有侯选键选取一个作为用户使用的键称为主键或主码。
表A中的某属性集是某表B的键,则称该属性值为A的外键或外码。
关系操纵:
数据查询、数据删除、数据插入、数据修改。
关系模型允许定义三类数据约束,它们是实体完整性约束、参照完整性约束以及用户定义的完整性约束。
小提示:
关系模式采用二维表来表示,一个关系对应一张二维表。
可以这么说,一个关系就是一个二维表,但是一个二维表不一定是一个关系。
疑难解答:
E-R图是如何向关系模式转换的?
从E-R图到关系模式的转换是比较直接的,实体与联系都可以表示成关系,E-R图中属性也可以转换成关系的属性。
实体集也可以转换成关系。
4.3关系代数
考点9关系代数
考试链接:
考点9在笔试考试中出现的机率为30%,主要是以选择题的形式出现,分值为2分,此考点重点掌握理解内容,读者应该理解关系模型的基本操作以及关系代数的几种运算。
误区警示:
当对关系模型进行查询运算,涉及到多种运算时,应当注意它们之间的先后顺序,因为有可能进行投影运算时,把符合条件的记录过滤,产生错误的结果。
1.关系模型的基本操作
关系模型的基本操作:
插入、删除、修改和查询。
其中查询包含如下运算:
①投影运算。
从R中选择出若干属性列组成新的关系。
②选择运算。
选择运算是一个一元运算,关系R通过选择运算(并由该运算给出所选择的逻辑条件)后仍为一个关系。
设关系的逻辑条件为F,则R满足F的选择运算可写成:
σF(R)
③笛卡尔积运算。
设有n元关系R及m元关系S,它们分别有p、q个元组,则关系R与S经笛卡尔积记为R×S,该关系是一个n+m元关系,元组个数是p×q,由R与S的有序组组合而成。
小提示:
当关系模式进行笛卡尔积运算时,读者应该注意运算后的结果是n+m元关系,元组个数是p×q,这是经常混淆的。
2.关系代数中的扩充运算
(1)交运算:
关系R与S经交运算后所得到的关系是由那些既在R内又在S内的有序组所组成,记为R∩S。
(2)除运算
如果将笛卡尔积运算看作乘运算的话,除运算就是它的逆运算。
当关系T=R×S时,则可将除运算写成:
T÷R=S或T/R=S
S称为T除以R的商。
除法运算不是基本运算,它可以由基本运算推导而出。
(3)连接与自然连接运算
连接运算又可称为θ运算,这是一种二元运算,通过它可以将两个关系合并成一个大关系。
设有关系R、S以及比较式iθj,其中i为R中的域,j为S中的域,θ含义同前。
则可以将R、S在域i,j上的θ连接记为:
R|×|S
iθj
在θ连接中如果θ为"=",就称此连接为等值连接,否则称为不等值连接;如θ为"<"时称为小于连接;如θ为">"时称为大于连接。
自然连接(naturaljoin)是一种特殊的等值连接,它满足下面的条件:
①两关系间有公共域;
②通过公共域的等值进行连接。
设有关系R、S,R有域A1,A2,…,An,S有域B1,B2,…,Bm,并且,Ai1,Ai2,…,Aij,与B1,B2,…,Bj分别为相同域,此时它们自然连接可记为:
R|×|S
自然连接的含义可用下式表示:
R|×|S=πA1,A2,……An,Bj+1,……Bm(σAi1=B1^Ai2=B2^…^Aij=,Bj(R×S))
疑难解答:
连接与自然连接的不同之处在什么?
一般的连接操作是从行的角度进行运算,但自然连接还需要取消重复列,所以是同时从行和列的角度进行运算。
4.4数据库设计与管理
考点10数据库设计概述
考试链接:
考点10在笔试考试中出现的机率为30%,主要是以选择题的形式出现,分值为2分,此考点为识记内容,读者还应识记数据库设计的前4个阶段以及它们相应的任务。
数据库设计中有两种方法,面向数据的方法和面向过程的方法:
面向数据的方法是以信息需求为主,兼顾处理需求;面向过程的方法是以处理需求为主,兼顾信息需求。
由于数据在系统中稳定性高,数据已成为系统的核心,因此面向数据的设计方法已成为主流。
数据库设计目前一般采用生命周期法,即将整个数据库应用系统的开发分解成目标独立的若干阶段。
它们是:
需求分析阶段、概念设计阶段、逻辑设计阶段、物理设计阶段、编码阶段、测试阶段、运行阶段和进一步修改阶段。
在数据库设计中采用前4个阶段。
疑难解答:
数据库设计的前4个阶段的成果分别是什么?
数据库设计中一般采用前4个阶段,它们的成果分别是需求说明书、概念数据模型、逻辑数据模型和数据库内模式。
4.4例题详解
一、选择题
【例1】对于数据库系统,负责定义数据库内容,决定存储结构和存取策略及安全授权等工作的是_______。
(考点1)
A)应用程序员B)用户
C)数据库管理员D)数据库管理系统的软件设计员
解析:
数据库管理员(简称DBA),具有如下的职能:
设计、定义数据库系统;帮助用户使用数据库系统;监督与控制数据库系统的使用和运行;改进和重组数据库系统;转储和恢复数据库;重构数据库。
所以,定义数据库内容,决定存储结构和存取策略及安全授权等是数据库管理员(DBA)的职责。
答案:
C)
【例2】在数据库管理技术的发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。
在这几个阶段中,数据独立性最高的是_______。
(考点2)
A)数据库系统B)文件系统
C)人工管理D)数据项管理
解析:
在人工管理阶段,数据无法共享,冗余度大,不独立,完全依赖于程序。
在文件系统阶段,数据共享性差,冗余度大,独立性也较差。
所以B)选项和C)选项均是错误的。
答案:
A)
【例3】在数据库系统中,当总体逻辑结构改变时,通过改变_______,使局部逻辑结构不变,从而使建立在局部逻辑结构之上的应用程序也保持不变,称之为数据和程序的逻辑独立性。
(考点3)
A)应用程序B)逻辑结构和物理结构之间的映射
C)存储结构D)局部逻辑结构到总体逻辑结构的映射
解析:
模式描述的是数据的全局逻辑结构,外模式描述的是数据的局部逻辑结构。
当模式改变时,由数据库管理员对外模式/模式映射做相应改变,可以使外模式保持不变。
应用程序是依据数据的外模式编写的,从而应用程序也不必改变。
保证了数据与程序的逻辑独立性,即数据的逻辑独立性。
答案:
D)
【例4】数据库系统依靠_______支持数据的独立性。
(考点4)
A)具有封装机制
B)定义完整性约束条件
C)模式分级,各级模式之间的映射
D)DDL语言和DML语言互相独立
解析:
。
数据库的三级模式结构指数据库系统由外模式、模式和内模式3级构成。
数据库管理系统在这3级模式之间提供了两层映射:
外模式/模式映射,模式/内模式映射。
这两层映射保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。
答案:
C)
【例5】将E-R图转换到关系模式时,实体与联系都可以表示成_______。
(考点6)
A)属性B)关系
C)键D)域
解析:
E-R图由实体、实体的属性和实体之间的联系3个要素组成,关系模型的逻辑结构是一组关系模式的集合,将E-R图转换为关系模型:
将实体、实体的属性和实体之间的联系转化为关系模式。
答案:
B)
【例6】用树形结构来表示实体之间联系的模型称为_______。
(考点7)
A)关系模型B)层次模型
C)网状模型D)数据模型
解析:
满足下面两个条件的基本层次联系的集合为层次模型:
(1)有且只有一个结点没有双亲结点,这个结点称为根结点;
(2)根以外的其它结点有且仅有一个双亲结点。
层次模型的特点:
(1)结点的双亲是惟一的;
(2)只能直接处理一对多的实体联系;
(3)每个记录类型定义一个排序字段,也称为码字段;
(4)任何记录值只有按其路径查看时,才能显出它的全部意义;
(5)没有一个子女记录值能够脱离双亲记录值而独立存在。
答案:
B)
【例7】对数据库中的数据可以进行查询、插入、删除、修改(更新),这是因为数据库管理系统提供了_______。
(考点8)
A)数据定义功能B)数据操纵功能
C)数据维护功能D)数据控制功能
解析:
数据库管理系统包括如下功能:
(1)数据定义功能:
DBMS提供数据定义语言(DDL),用户可以通过它方便地对数据库中的数据对象进行定义;
(2)数据操纵功能:
DBMS还提供数据操作语言(DML),用户可以通过它操纵数据,实现对数据库的基本操作,如查询、插入、删除和修改;
(3)数据库的运行管理:
数据库在建立、运用和维护时由数据库管理系统统一管理,统一控制以保证数据的安全性、完整性、多用户对数据的并发使用及发生故障后的系统恢复;
(4)数据库的建立和维护功能:
它包括数据库初始数据的输入、转换功能,数据库的转储、恢复功能,数据库的重组、功能和性能监视等等。
答案:
B)
【例8】设关系R和关系S的属性元数分别是3和4,关系T是R与S的笛卡儿积,即T=R×S,则关系T的属性元数是__(r+s)_____(考点9)
A)7B)9
C)12D)16
解析:
笛卡儿积的定义是设关系R和S的元数分别是r和s,R和S的笛卡儿积是一个(r+s)元属性的集合,每一个元组的前r个分量来自R的一个元组,后s个分量来自s的一个元组。
所以关系T的属性元数是3+4=7。
答案:
A)
【例9】下述_______不属于数据库设计的内容。
(考点10)
A)数据库管理系统B)数据库概念结构
C)数据库逻辑结构D)数据库物理结构
解析:
数据库设计是确定系统所需要的数据库结构。
数据库设计包括概念设计、逻辑设计和建立数据库(又称物理设计)。
答案:
A)
二、填空题
【例1】一个数据库的数据模型至少应该包括以下3个组成部分,__数据结构_____、数据操作和数据的完整性约束条件。
(考点5)
解析:
数据模型是严格定义的一组概念的集合。
这些概念精确地描述了系统的静态特性、动态特性和完整性约束条件。
因此,数据模型通常由数据结构、数据操作和完整性约束3部分组成。
其中,数据结构是对系统静态特性的描述,数据操作是对系统动态特性的描述,数据的完整性约束用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确性、有效性和相容性。
答案:
数据结构
【例2】在关系数据模型中,二维表的列称为属性,二维表的行称为_____。
(考点8)
解析:
一个关系是一张二维表。
表中的行称为元组,一行对应一个元组,一个元组对应存储在文件中的一个记录值。
答案:
元组