数据库原理复习资料.docx
《数据库原理复习资料.docx》由会员分享,可在线阅读,更多相关《数据库原理复习资料.docx(6页珍藏版)》请在冰豆网上搜索。
数据库原理复习资料
1、数据库、数据库系统、数据库管理系统的概念及他们之间的关系。
数据库(DB):
是长期存储在计算机内,有组织的、大量的、可共享的数据结合。
特征:
(1)按照一定的数据模型组织、描述和存储;
(2)具有较小的冗余度;(3)较高的数据独立性和易拓展性;(4)可为各种用户共享。
数据库系统(DBS):
是指在计算机系统中引入数据库后的系统,一般由数据库、数据库管理系统(及其开发工具)、应用系统和数据库管理员(DBA)构成。
数据库管理系统(DBMS):
是位于用户与操作系统之间的一层数据管理软件。
功能:
数据定义、数据库的运行管理、数据库的建立与维护。
2、数据管理技术的三个阶段
人工管理阶段(20世纪50年代中期以前)
特点:
数据不保存;应用程序管理数据;数据不共享;数据不具有独立性
文件系统阶段(20世纪50年代后期到60年代中期)
特点:
数据可以长期保存;由文件系统管理数据库;数据共享性差,冗余度大;数据独立性差
数据库技术阶段(20世纪60年代后期以来)
3、数据库系统的特点:
(1)数据结构化;
(2)数据的共享性高,冗余度低,易扩充;(3)数据独立性高;(4)数据由DBMS统一管理和控制:
数据的安全性保护;数据的完整性检查;并发控制;数据库恢复
4、数据库系统结构:
单用户结构、主从式结构、分布式结构、客户/服务器结构等
5、模式:
是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
它仅仅涉及到型(结构和属性)的描述,不涉及到具体的值(具体赋值)。
6、外模式:
也称子模式或用户模式。
模式与外模式的关系:
一对多。
7、内模式:
内模式也称存储模式。
模式与内模式的关系:
一对一。
8、两级映像:
外模式/模式映像。
模式/内模式映像
独立性:
外模式/模式映像——逻辑独立性
模式/内模式映像——物理独立性
9、DBA:
(1)决定数据库中的信息内容和结构;
(2)决定数据库的存储结构和存取策略;
(3)定义数据的安全性要求和完整性约束;
(4)监控数据库的使用和运行;
(5)数据库的改进和重组结构。
第二章数据模型
1、两大类数据模型:
概念模型:
主要用于数据库设计
逻辑模型和物理模型:
包括层次模型、网状模型和关系模型等。
主要用于DBMS的实现。
2、数据模型的组成要素:
数据结构;数据操作;完整性约束。
3、关系模型
关系:
一个关系对应通常说的一个表;
元祖:
表中的一行即为一个元祖;
属性:
表中一列即为一个属性;
码:
也称为码键;
域:
属性的取值范围;
分量:
元组中的一个属性值;
关系模式:
关系名(属性1,属性2,…,属性n)
4、关系数据模型的操作主要包括:
查询、插入、删除和更新数据。
5、关系的完整性约束条件包括3大类:
实体完整性、参照完整性和用户定义的完整性。
第三章关系数据库
1、域是一组具有相同数据类型的值的集合。
2、笛卡尔积是没有实际意义的,只有它的某个子集才有实际意义。
3、关系是笛卡尔积的有限子集。
4、关系可以有三种类型:
基本关系(通常又称为基本表和基表)、查询表和是图表。
5、基本关系具有以下6条性质:
(1)列是同质的
(2)不同的列可以出自同一个域
(3)列的顺序无所谓
(4)任意两个元组不能完全相同
(5)行的顺序无所谓
(6)分量必须去取原子值
6、关系的描述称为关系模式。
R(U,D,dom,F)
R为关系名,U为组成该关系的的属性名集合,D为属性组U中属性来自的域,dom为属性向域的映像集合,F为属性间数据的依赖关系的集合。
7、关系数据库模式:
(1)若干域的定义;
(2)在这些域上定义的若干关系模式。
8、关系模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。
9、关系模型中常用的关系操作:
查询操作和插入、删除、修改操作
10、查询操作:
选择、投影、连接、除、并、差、交、笛卡尔积等。
11、关系的三类完整性约束:
实体完整性、参照完整性、用户定义的完整性。
第四章关系数据库标准语言SQL
1、SQL的组成:
数据定义、数据操纵、数据控制、嵌入式SQL
2、SQL的特点:
(1)综合统一;
(2)高度非过程化;(3)面向集合的操作方式;(4)以同一种语法结构提供多种使用方式;(5)语言简洁、易学易用。
3、SQL语言动词:
SELECTCREATEDROPALTERINSERTUPDDATEDELETEGRANTREVOKE
第五章数据库安全性
1、数据库的安全性是指保护数据库以防止不合法的使用所造成的数据泄露、更改或破坏。
2、用户标识用一个用户名或者用户标识号来标明用户身份。
3、口令为了进一步核实用户,系统常常要求用户输入口令。
4、存取控制:
(1)定义用户权限,并将用户权限登记到数据字典中;
(2)合法权限检查
5、用户权限由两个要素组成:
数据对象和操作类型。
6、系统级审计职能由DBA设置;AUDIT语句用来设置审计功能,NOAUDIT用来取消审计功能;审计设置以及审计内容一般都存放在数据字典中。
第六章数据库完整性
1、数据库的完整性是指数据的正确性和相容性。
2、为了维护数据库的完整性,RDBMS必须能够:
(1)提供定义完整性约束条件的机制;
(2)提供完整性检查的方法;(3)违约处理
3、SQL标准使用了一系列概念唉描述完整性,包括关系模型的实体完整性、参照完整性和用户定义完整性。
第七章数据库恢复技术
1、事务是恢复和并发控制的基本单位。
2、定义事务控制的语句主要有:
BEGINTRANSACTION;COMMIT;ROLLBACK。
3、事务的特性:
原子性、一致性、隔离性、持续性。
4、故障的种类:
事务故障、系统故障、介质故障、计算机病毒。
5、建立冗余数据最常用的技术是数据转储和登记日及文件。
6、转储可分为静态转储和动态转储。
转储方式有海量转储和增量转储。
第八章并发控制
1、并发操作带来的数据不一致性包括三类:
丢失修改、不可重复读和读“脏”数据。
2、并发控制的主要技术是封锁。
3、基本的封锁类型有两种:
排它锁(X锁)和共享锁(S锁)。
4、一级封锁协议可防止丢失修改,并保证事务T是可恢复的。
在一级封锁协议中,如果仅仅是读数据,不对数据进行修改,是不需要加锁的,所以它不可能保证可重复读和不“读”脏数据。
5、二级封锁协议除防止了丢失修改,还可进一步防止读“脏”数据。
在二级封锁协议中,由于读写完数据后即可释放S锁,所以它不能保证可重复读。
6、三级封锁协议除防止了丢失修改和不读“脏”数据外,还进一步防止了不可重复读。
7、避免活锁的简单方法是才用先来先服务的策略。
8、目前在数据库中解决死锁问题的主要有两类方法,一类方法是采取一定措施来预防死锁的发生,另一类方法是允许发生死锁,才用一定手段定期诊断系统中有无死锁,若有则解除之。
9、死锁的预防:
(1)一次封锁法;
(2)顺序封锁法。
10、死锁的诊断与解除:
(1)超时法;
(2)等待图法。
11、两段锁协议(2PL)就是保证并发调度可串行性的封锁协议。
12、两段锁协议:
是指所有事务必须分成两个阶段对数据项加锁和解锁。
第一阶段是获得封锁,也称为扩展阶段;第二阶段是释放封锁,也称为收缩阶段。
13、事务遵守两段锁协议是可串行化调度的充分条件,而不是必要条件。
14、封锁对象的大小称为封锁粒度。
在DBMS中封锁对象可以是逻辑单元,也可以是物理单元。
15、“三分技术,七分管理,十二分基础数据”是数据库设计的特点之一。
16、数据库设计方法:
手工设计法(新奥尔良方法);基于E-R模型的数据库设计方法;3NF(第三范式)的设计方法;ODL方法;
17、数据库的生命周期可分为两个阶段:
一是数据库需求分析和设计阶段;需求分析,概念设计,逻辑设计,物理设计。
二是数据库实现和运行阶段;数据库的实现,运行与监督,修改与调整。
18、数据库设计步骤:
(1)需求分析阶段;
(2)概念结构设计阶段;(3)逻辑结构设计阶段;(4)物理结构设计阶段;(5)数据库实施阶段;(6)数据库运行和维护阶段。
第十章概念模型与E-R方法
1、数据模型是数据库系统的核心和基础。
2、概念模型特点:
(1)真实性;
(2)易理解性;(3)易修改性;(4)易转换性。
3、概念模型涉及的概念主要有:
(1)实体;
(2)属性;(3)码;(4)域;(5)实体型;(6)实体集;(7)联系
4、两个实体型之间的联系
一对一联系;一对多联系;多对多联。
5、实体型:
用矩形表示;属性:
用椭圆表示;联系:
用菱形表示;
第十一章关系数据库设计理论
1、数据依赖中最重要的是函数依赖(FD)和多值依赖(MVD)。
2、范式
第一范式:
如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF;
第二范式:
若关系模式R∈1NF,并且每一个非主属性都完全函数依赖于R的码,则R∈2NF;
第三范式:
关系模式RY),使得X→Y,Y→Z,成立,Y→X不成立,则称R中若不存在这样的码X、属性组Y及非主属性Z(Z∈3NF。
若R∈3NF,则R的每一个非主属性既不部分函数依赖于候选码也不传递函数依赖于候选码。
如果R∈3NF,则R也是2NF。
BC范式:
设关系模式R∈1NF,如果对于R的每个函数依赖X→Y,若Y不属于X,则X必含有候选码,那么R∈BCNF。
BC范式的关系模式的三个性质:
(1)所有非主属性对每一个码都是完全函数依赖。
(2)所有的主属性对每一个不包含它的码,也是完全函数依赖。
(3)没有任何属性完全函数依赖于非码的任何一组属性。
由于R∈BCNF,按定义排除了任何属性对码的传递依赖与部分依赖,所以R∈3NF。
但是若R∈3NF,则R未必属于BCNF。
多值依赖:
设R(U)是属性集U上的一个关系模式。
X,Y,Z是U的子集,并且Z=U-X-Y。
关系模式R(U)中多值依赖X→→Y成立,当且仅当对R(U)的任一关系r,给定的一对(x,z)值有一组Y的值,这组值仅仅决定于x值而与z值无关。
性质:
(1)对称性;
(2)函数依赖可以看做是多值依赖的特殊情况;
第四范式:
关系模式RX),X都含有候选码,则R∈4NF。
∈1NF,如果对于R的每个非平凡多值依赖X→→Y(Y不包含于X),X都含有候选码,则R∈4NF。
显然,如果R∈4NF,则R∈BCNF。
第十二章数据库设计步骤