数据库系统版自考.docx
《数据库系统版自考.docx》由会员分享,可在线阅读,更多相关《数据库系统版自考.docx(16页珍藏版)》请在冰豆网上搜索。
数据库系统版自考
数据库系统原理(复习资料)
第一章数据库系统概述
一、识记:
1)数据(Data):
是描述事物的符号记录,是指用物理符号记录下来的、可以鉴别的信息。
(P27)
2)数据库(DataBase,DB):
通俗的被称作存储数据的仓库。
3)数据库管理系统(DBMS):
是专门用于建立和管理数据库的一套软件,介于应用程序和操作系统之间。
4)数据库系统(DBS):
是指在计算机中引入数据库技术之后的系统。
2、数据管理技术发展阶段:
1)人工管理阶段、2)文件系统阶段、3)数据库系统阶段
数据库系统阶段,与人工管理、文件系统管理相比有如下特点:
数据集成、数据共享性高、数据冗余度小、数据一致性、数据独立性高P32
3、数据库系统的三级模式结构:
是指数据库系统是由模式、外模式和内模式三级构成(P34)
模式:
也称为概念模式或逻辑模式,它是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图;
外模式:
也成为子模式或用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是与某一应用有关的逻辑表示;
内模式:
也称储存模式,它是对数据库中数据物理结构和储存方式的描述,是数据在数据库内部的表示形式;
三级模式结构的两层映像与数据独立性:
(1)外模式/模式映像
(2)模式/内模式映像:
定义了数据库全局逻辑结构与物理储存之间的对应关系(3)实现概念模式(模式)不受内模式变化影响,正是这两层映像保证了数据库系统中数据能够具有较高的逻辑独立性和物理独立性,使得数据的定义和描述可以从应用程序中分离出去,从而简化了数据库应用程序的开发。
(P36)
四、数据库系统的运行与应用结构:
目前两种,客户/服务器结构、浏览器/服务器结构
五、数据模型:
通常由数据结构、数据操作和数据约束三个要素组成;
数据模型分类:
第一类:
概念层数据模型,第二类:
逻辑层数据模型和物理层数据模型。
概念层数据模型:
是数据抽象级别的最高层,其目的是按用户的观点来对世界建模,通常用来抽象、表示现实世界的各种事物及其联系;
信息世界设计的基本概念如下:
实体、属性、码或键、域、实体性、实体集、联系;
概念模型表示方法:
实体性(矩形表示)、属性(椭圆形表示)、联系(菱形表示)
逻辑层数据模型:
逻辑层是数据抽象的中间层,描述数据整体的逻辑结构。
包括层次模型、网状模型、关系模型、面向对象模型;这里给予关系模型的数据库。
(P41)
物理层数据模型:
其描述数据在储存介质上的组织结构,是逻辑模型的物理实现。
第二章关系数据库
一、关系数据库的基本特征是使用关系数据模型组织数据,这种思想源于数学。
二、关系数据模型:
关系模型三个组成要素,关系数据结构、关系操作集合和关系完整性约束。
以二维表格为例,介绍关系数据库的基本术语:
表、关系、列、属性、行、元组、分量、码或键、超码和超键、候选码和候选键、主码和主键、全码和全键、主属性、外码或外键、参照关系和被参照关系、域、数据类型、关系模式、关系数据库。
(P44)
4、关系操作集合:
常用操作包括查询操作和插入、删除、修改操作两大部分。
关系数据语言的分类:
关系代数语言、关系演算语言、以及兼两种特点的结构化查询语言SQL(将在第四章详细讲解);
5、关系代数:
是关系操作语言的一种传统表示方式,它是集合代数为基础发展起来的。
操作包括三大要素:
操作对象、操作符、操作结果;(IBM公司研制ISBL的纯代数数据操作语言。
)
A:
传统的集合运算:
是二目运算,具有并、差、交、笛卡尔积4种运算(P51看书理解)
B:
专门的关系运算:
不仅涉及行,还涉及列,它可分为一元专门关系操作和二元专门关系操作;其中,一元专门关系操作包括对单个关系进行垂直分解的投影运算和进行水平分解选择运算;二元专门关系操作则是对两个关系进行操作,包括连接运算和除运算。
专门的关系运算有:
选择、投影、连接、除;
6、关系的完整性约束:
有三类完整性约束,实体完整性约束、参照完整性约束、用户定义完整性约束。
关系模型完整性约束的检验:
为了维护关系数据库中的数据的完整性,在对关系数据库执行插入、删除和更新操作时,需要检验是否满足上述三类完整性约束。
(P56,看书进行补充)
7、关系数据库的规范化理论:
关系模型中可能存在的冗余和异常问题:
数据冗余、更新异常、插入异常、删除异常;
现在人们提出许多种类型的数据依赖,其中最重要的是函数依赖FD,多值依赖MVD;
8、函数依赖和关键字:
(P57)
函数依赖:
是指关系中属性间的对应关系。
根据不同性质可分完全函数依赖、部分函数依赖、传递函数依赖;
关键字:
设R为任意给定关系,U为其所含的全部属性集合,X为U的子集,若有完全函数依赖X→U,则X为R的一个候选关键字。
九、范式与关系规范化过程:
关系数据库中的关系需要满足一定的要求,不同程度的要求称为不同的范式(NF)。
满足最低要求的称为第一范式(1NF),这是最基本的范式;在第一范式的基础上进一步满足一些新要求的称为第二范式(2NF);以此类推,再进一步的范式成为第三范式(3NF)。
第一范式:
设定R为任一给定关系,如果R中每个列与行的交点处的取值都是不可再分的基本元素,则R为第一范式。
第二范式:
设定R为任一给定关系,若R为1NF,且其所有非主属性都完全函数依赖于候选关键字,则R为第二范式。
第三范式:
设定R为任一给定关系,若R为2NF,且其每一个非主属性都不传递函数依赖于候选关键字,则R为第三范式。
BCNF:
为了解决3NF有时会出现的插入及删除操作异常等问题,R.F.Boyce和E.F.Cold提出了第3范式的改进形式BCNF。
第3章数据库设计(P64)
1、数据库设计概述
数据库生命周期:
分两个阶段,数据库分析与设计阶段、数据库实现与操作阶段。
数据库设计的目标:
满足应用功能需求和良好的数据库性能。
数据库设计的内容:
1)数据库结构设计:
是针对给定的应用环境进行数据库的模式或子模式设计,包括数据库的概念结构设计、逻辑结构设计或物理结构设计。
模式定义并给出各应用程序共享的结构,是静态的。
2)数据库行为设计:
是确定数据库用户的行为和动作,它们通常是通过应用程序来实现的,由于用户行为会是数据库的内容发生变化,所以行为设计是动态的。
数据库设计的方法:
(1)直观设计法;
(2)规范设计法:
{新奥尔良设计方法,四个阶段:
需求分析、概念结构设计、逻辑结构设计、物理结构设计}{基于E-R模型的数据库设计方法:
1976年由P.P.S.Chen提出}{基于第三范式的设计方法}
二、数据库设计的过程:
将数据库设计分为这样几个阶段:
需求分析阶段;结构设计阶段、其中包括概念结构设计、逻辑结构设计和物理结构设计;行为设计阶段,其包括功能设计、事务设计和程序设计;数据库实施阶段,其包括加载数据库数据和调试运行应用程序;数据库运行和维护阶段。
三、数据库设计的基本步骤:
(P67)
需求分析:
是数据库设计的起点,一般分为四个步骤,确定数据库范围、分析数据应用过程、收集与分析数据、编写需求分析报告;
编写需求分析报告:
1)数据库的应用功能目标
2)标明不同用户视图范围
3)应用处理过程需求说明
i:
数据流程图,其主要反映应用部门原始业务处理的工作流程
ii:
任务分类表,其标明不同任务的功能及使用情况
iii:
数据操作特征表,标明任务和数据间的联系及不同数据的不同操作特征与执行频率
iv:
操作过程说明书,其根据数据流程图、任务分类表和各类原始资料
4)数据字典(DD),是数据库系统中存储三级结构定义的数据库,通常指的是数据库系统中各类数据详细描述的集合。
5)数据量:
根据数据分类表中的静态数据量和操作特征表中的动态数据量,进行统计计算,求出数据总量。
6)数据约束
四、概念结构设计
设计任务是在需求分析报告的基础上,按照特定的方法设计满足应用需求的用户信息结构,该信息结构通常称为概念模型。
5、逻辑结构设计的目标是将概念模型转换为等价的、并为特定DBMS所支持数据模型的结构。
数据库逻辑模型一般由层次、网状、关系数据模型表示。
(P71)
(1)逻辑结构设计的输入与输出信息
(2)逻辑结构设计的步骤
六、物理设计
是指对于一个给定的数据库逻辑结构,研究并构造物理结构的过程,其具体任务主要是确定数据库在存储设备上的存储结构及存取方法,因DBMS的不同还可能包括建立索引和聚焦,以及物理块大小、缓冲区个数和大小、数据压缩的选择等。
6、数据库实施
实施阶段主要包括:
加载数据、应用程序设计和数据库试运行。
(P72)
七、数据库运行和维护
系统维护中最困难的工作是数据库重组和重构。
重组适当空间利用率和存取效率下降时进行的,它并不改变数据库的逻辑结构和物理结构,只是利用DBMS提供的设施调整数据库中的数据的存储位置。
重构是指部分修改数据库的逻辑结构或物理结构。
第三节关系数据库设计方法
一、关系数据库:
是一类采用关系模型作为逻辑数据模型的数据库系统,它的设计过程遵从数据库设计基本步骤:
需求分析、概念结构设计、逻辑结构设计、物理结构设计、数据库实施、数据库的运行和维护。
二、关系数据库设计过程与各级模式:
在逻辑设计阶段采用E-R图转换成具体数据库产品支持的关系数据模型,形成数据库逻辑模式,然后根据用户处理的要求、安全性的考虑,在基本表的基础上再建立必要的视图,形成数据的外模式;在物理结构的设计阶段,根据关系数据库管理系统的特点和处理的需要,进行物理存储安排、建立索引,形成数据库内模式,关系数据库各级模式如图:
2、概念结构设计方法:
通常采用自顶向下法,通过两个步骤完成概念设计,即首先建立局部信息结构,然后将局部信息结构合成为全局信息结构并优化。
1、E-R图的表示方法i)实体性,用矩形表示;ii)属性,用椭圆形表示;iii)联系,用菱形表示。
2、两个实体型之间的联系:
①一对一联系(1:
1);②一对多联系(1:
N)③多对多联系(M:
N)
3、两个以上的实体型之间的联系:
(P75)也存在一对一;一对多;多对多;
4、单个实体型内的联系:
同一个实体集内各实体之间也可以存在一对一,一对多,多对多的联系。
5、局部信息结构设计:
根据需求分析报告中标明的不同用户视图范围所建立的满足该范围内用户需求的信息结构称为局部信息结构。
局部信息结构设计步骤如下:
(P77看实例演示)
(1)确定局部范围
(2)选择实体(3)选择实体的关键字属性(4)确定实体间联系(5)确定实体的属性
6、全局信息结构设计:
是将上述产生的所有局部信息结构合并成为一个全局信息结构。
合并过程是一个不断发现和解决冲突的过程,通常,各局部E-R图之间的冲突主要表现在三个方面:
属性冲突、命名冲突、结构冲突。
(P79看具体理解)
(1)属性冲突:
属性域冲突和属性取值单位冲突;
(2)命名冲突:
同名异义和异名同义;
(3)结构冲突:
i)同一对象在一个局部E-R图中作为实体,而在另一个局部E-R图中作为属性
ii)同一个实体在不同的E-R图中属性个数和类型不同
iii)实体之间的联系在不同的E-R图中是不同的类型
三、逻辑结构设计方法
逻辑结构设计任务是把概念结构设计产生的概念模型转换为具体的DBMS所支持的逻辑数据模型,也就是导出特定的DBMS可以处理的数据库逻辑结构(数据库的模式和外模式),这些模式在功能、性能、完整性和一致性约束方面满足应用要求。
那么在关系数据库设计中,逻辑结构设计的任务就是把概念结构设计阶段已设计好的E-R图转换为关系数据库管理系统所支持的关系模型,通常包括以下三项工作:
1.E-R图向关系模型的转换
2.数据模型的优化
3.设计用户子模式
四、物理设计方法(P81看实例讲解)
物理设计的主要任务是通过对关系建立索引和聚集来实现与应用相关数据的逻辑连接和物理聚集,以改善对数据