自考数据库系统原理完整版文档格式.docx

资源描述

自考数据库系统原理完整版文档格式.docx

《自考数据库系统原理完整版文档格式.docx》由会员分享，可在线阅读，更多相关《自考数据库系统原理完整版文档格式.docx（54页珍藏版）》请在冰豆网上搜索。

自考数据库系统原理完整版文档格式.docx

总结了当时各式各样的数据库，提出网状模型，尔后于1971年4月正式通过。

　　３）1970年美国IBM公司的E.F.Codd连续发表论文，提出关系模型，奠定了关系数据库的理论基础。

数据库管理阶段特点：

　　1）采用数据模型表示复杂的数据结构；

　　2）有较高的数据独立性；

　　3）数据库系统为用户提供了方便的用户接口。

　　4）数据库系统提供以下四个方面的数据控制功能：

　　①数据库的恢复；

　　②数据库的并发控制；

　　③数据库的完整性；

　　④数据库的安全性；

　　5）增加了系统的灵活性。

　　增加了系统的灵活性对数据的操作不一定以记录为单位，可以以数据项为单位。

数据库技术中的四个名词:

DB、DBMS、DBS、数据库技术。

其概念是不同的，要分清。

DB：

数据库（Database）长期存储在计算机、有组织的、统一管理的相关数据的集合。

DBMS：

数据库管理系统（DatabaseManagementSystem），DBMS是位于用户与操作系统之间的一层数据管理软件，为用户或应用程序提供访问DB的方法，包括DB的建立、查询、更新及各种数据控制。

DBMS总是基于某种数据模型，可以分为层次型、网状型、关系型、面向对象型DBMS。

DBS：

数据库系统（DatabaseSystem）,DBS是实现有组织地、动态地存储大量关联数据，方便多用户访问的计算机软件、硬件和数据资源组成的系统，即采用了数据库技术的计算机系统。

　　数据库技术：

是一门研究数据库结构、存储、管理和使用的一门软件学科。

4.高级数据库阶段：

１）面向对象的概念建模

２）开放数据库互连技术

1.2　数据描述

在数据处理中，数据描述将涉及不同的畴。

从事物的特性到计算机中的具体表示，数据描述经历了三个阶段———概念设计、逻辑设计和物理设计。

1.概念设计中的的数据描述

１）实体

２）实体集

３）属性

４）实体标识符

2.逻辑设计中的数据描述

１）字段

２）记录

３）文件

４）关键码

3.物理设计中的数据描述

物理存储介质层次

１）高速缓冲存储器

２）主存储器

３）快擦写存储器

４）磁盘存储器

５）光盘存储器

６）磁带

物理存储中的数据描述

位、字节、字、块、桶和卷

4.数据联系的描述

联系及元数定义：

　　二元联系有以下三种类型：

　　1：

1联系：

如果实体集E1中的每个实体最多只能和实体集E2中的一个实体有联系，反之亦然，好么实体集E1对E2的联系称为“一对一联系”，记为“1：

1”。

N联系：

如果实体集E1中每个实体与实体集E2中任意个（零个或多个）实体有联系，而E2中每个实体至多和E1中的一个实体有联系，那么E1对E2的联系是“一对多联系”，记为“1：

N”。

　　M：

如果实体集E1中每个实体与实体集E2中任意个（零个或多个）实体有联系，反之亦然，那么E1对E2的联系是“多对多联系”，记为“M：

1.3　数据抽象的级别

1.数据抽象的过程

根据抽象的级别定义了四种模型：

１）概念数据模型

２）逻辑数据模型

３）外部数据模型

４）部数据模型

2.概念模型

１）四种模型中，概念模型的抽象级别最高。

２）概念模型的特点:

（p12）

3.逻辑模型

逻辑模型的特点:

（p13）

（1）~（4）

逻辑模型的分类：

１）层次模型

２）网状模型

３）关系模型

三种逻辑数据模型的比较？

如P17图

4.外部模型

　　外部模型的特点:

（p17）

　　从整个系统考察，外部模型的优点。

　　5.部模型

　　是数据库最底的抽象，它描述数据在磁盘或磁带上的存储方式、存取设备和存取方法。

6.三层模式和两级映象

　　三层模式体系结构

　　１）外模式：

是用户与数据库系统的接口，是用户用到的那部分数据的描述。

　　２）逻辑模式：

是数据库中全部数据的整体逻辑结构的描述。

　　３）模式：

是数据库在物理存储方面的描述，定义所有部记录类型、索引和文件的组织方式，以及数据控制方面的细节。

　　两级映象

　　外模式/逻辑模式映象：

用于定义概念模式和模式之间的对应性。

一般在模式中描述。

　　逻辑模式/模式映象：

用于定义外模式和概念模式间的对应性。

一般在外模式中描述。

7.高度的数据独立性

　　什么叫数据独立性？

是指应用程序和数据库的数据结构之间相互独立，不受影响。

在修改数据结构时，尽可能不修改应用程序，则称系统达到了数据独立性目标。

　　数据独立性分为物理数据独立性和逻辑数据独立性：

　　物理数据独立性：

修改模式时尽量不影响概念模式及外模式，则达到物理数据独立性。

　　逻辑数据独立性：

修改概念模式时尽量不影响外模式和应用程序。

1.4　数据库管理系统（DBMS）

1.DBMS的目标与任务：

　　数据库管理系统的主要任务是完成用户对数据库的存取请求，即检索、插入、更新或删除等操作。

　　DBMS的目标：

用户界面友好、功能完善、结构清晰、高效率、开放性

2.DBMS的工作模式（p20图）

3.DBMS的主要功能：

１）数据库的定义功能

２）数据库的操纵功能

３）数据库的保护功能（数据库恢复、数据库并发控制、数据库完整性和数据库安全性）

４）数据库的维护功能

５）数据字典

1.5　数据库系统（DBS）

1.DBS由四部分组成：

数据库、硬件、软件、数据库管理员。

2.数据库管理员定义及职责。

（素质+职责）

3.DBS的全局结构及DBS的效益。

（数据库用户+界面+DBMS+磁盘+DBS的效益）

第二章　数据库设计和ER模型

　　本章总的目的要了解和掌握数据库应用系统设计的全过程。

首先掌握ER模型和关系模型的基本概念，然后掌握概念设计中ER模型的设计方法，逻辑设计中ER模型向关系模型转换方法。

2.1数据库系统生存期（领会）

2.2ER模型的基本概念（综合应用）

2.3关系模型的基本概念（综合应用）

2.4ER模型到关系模型的转换规则（综合应用）

2.5ER模型实例分析（简单应用）

2.6增强ER模型（简单应用）

从软件生存期谈起

　　软件生存期：

是指从软件的规划、研制、实现、投入运行后的维护、直到它被新的软件所取代而停止使用的整个期间。

它包括六个阶段：

（规需设编试运维）

（1）规划阶段

（2）需求分析阶段

　　（3）设计阶段

　　（4）程序编制阶段

　　（5）调试阶段

　　（6）运行维护阶段

2.1　数据系统生存期

1.什么叫数据库系统生存期？

　　我们把数据库应用系统从开始规划、设计、实现、维护到最后被新的系统取代而停止使用的整个期间，称为数据库系统生存期。

　　2.这个生存期一般可划分成以下七个阶段：

　　规划、需求分析、概念设计、逻辑设计、物理设计、实现、运行维护。

２.2　ER模型的基本概念

1.ER模型的基本元素

实体、联系和属性

2.属性的分类（简单属性和复合属性、单值属性和多值属性、存储属性和派生属性）

3.联系的设计

4.ER模型的操作（分裂、合并和增删）

5.采用ER模型的数据库概念设计步骤

采用ER方法进行数据库概念设计分成三步进行：

首先设计局部ER模式

然后把各局部ER模式综合成全局ER模式

最后对全局ER模式进行优化

2.3　关系模型的基本概念

１.关系模型定义：

用二维表格结构表示实体集、外键表示实体间联系的数据模型称为关系模型。

2.基本术语有：

字段（属性）、字段值（属性值）、记录（元组）、二维表格（元组集合、关系或实例）。

在这里，括号中的表述为关系模型中的术语。

它与表格中术语可以一一对应。

还有，关系中属性个数称为元数，元组个数为基数。

3.键：

由一个或几个属性组成。

（注意键不一定是唯一的一个属性）。

　　1）超键：

在关系中能唯一标识元组的属性集称为关系模式的超键。

（注意，超键也是一个属性集，不一定只是一个属性）　　

　　2）候选键：

不含有多余属性的超键称为候选键。

　　3）主键：

用户选作元组标识的一个候选键为主键。

　　4）外键：

某个关系的主键相应的属性在另一关系中出现，此时该主键在就是另一关系的外键，如有两个关系S和SC,其中S#是关系S的主键，相应的属性S#在关系SC中也出现，此时S#就是关系SC的外键。

４.关系的定义和性质

１）关系定义：

关系是一个属性数目相同的元组的集合。

２）关系性质（p53）

5.三类完整性规则

　　１）实体完整性规则：

要求关系中组成主键的属性上不能有空值。

　　２）参照完整性规则：

要求不引用不存在的实体。

　　３）用户定义完整性规则：

由具体应用环境决定，系统提供定义和检验这类完整性的机制。

2.4　E-R模型向关系模型的转换

E-R模型可以向现有的各种数据库模型转换，对不同的数据库模型有不同的转换规则。

这里只讨论E-R模型向关系模型的转换方法。

　　1.E-R模型向关系模型的转换规则：

（1）实体类型的转换

　　将每个实体类型转换成一个关系模式，实体的属性即为关系的属性，实体标识符即为关系的键。

（2）联系类型的转换

　　1）实体间的联系是1:

可以在两个实体类型转换成两个关系模式中的任意一个关系模式的属性中加入另一个关系模式的键和联系类型的属性。

2）如实体间的联系是1:

　　则在N端实体类型转换成的关系模式中加入1端实体类型转换成的关系模式的键和联系类型的属性。

3）如实体间的联系是M:

则将联系类型也转换成关系模式，其属性为两端实体类型的键加上联系类型的属性，而键为两端实体键的组合。

以上各转换规则，给出了一般情况下E-R模型向关系模型的转换方法。

但在实际应用中往往还需要根具实际情况进行具体处理。

下面以图书借阅系统的E-R模型转换为关系模型为例。

该例中，由于允许同一本书在不同的时间借给多个读者，特别是一个读者在不同的时间可以借同一本书。

因而，在多对多联系“借阅”转换为关系模式时，仅有读者的编号和图书的编号是不能构成码的。

　　例如：

　　（0406010，F33.33,2006-10-10:

10:

10,2007-02-20:

00）（0406010,F33.33,2007-5-26：

4：

00,NULL）

说明，按照上述介绍的转换方法得到的关系模型不一定是最好的。

实际应用中，往往还要对得到的关系模型进行规化。

2.5和2.6

实例分析，同学们多看书！

1.库存管理系统的ER模型及转换

2.人事管理信息系统的ER模型

3.住院管理信息系统的ER模型

4.公司车队信息系统的ER模型

更多优质自考资料尽在XX贴吧自考乐园俱乐部

（tieba.baidu./club/5346389）欢迎❤加入...欢迎❤交流...止不住的惊喜等着你.........

第三章　关系模式设计理论

　　本章特点是理论性较强，学习者应从概念着手，搞清概念间的联系和作用。

　　本章总的要：

了解关系数据库规化理论及其在数据库设计中的作用。

　　本章的重点是函数依赖、无损分解、保持依赖和式。

掌握这些概念并能运用它们分析模式分解的特点。

3.1关系模式的设计准则（简单应用）

　　3.2函数依赖（FD）（简单应用）

　　3.3关系模式的分解特性（简单应用）

　　3.4式

　　1NF、2NF、3NF（简单应用）BCNF（领会）

　　分解成BCNF模式集的“分解算法”（识记）

　　分解成3NF模式集的“合成算法”（综合应用）

　　模式设计方法小结（领会）

　　3.5多值依赖和第四式（识记）

3.1　关系模式的设计准则

1.关系模式的冗余和异常问题

１）数据冗余

２）操作异常（修改异常、插入异常和删除异常）

2.关系模式的非形式化设计准则

　　１）关系模式的设计应尽可能只包含有直接联系的属性，不包括有间接联系的属性

　　２）关系模式的设计应尽可能使得相应关系中不出现插入、删除和修改异常。

　　３）关系模式的设计应尽可能使得相应关系中避免放置经常为空值的属性。

　　４）关系模式的设计应尽可能使得关系的等值连接在主键和外键的属性上进行，并且保证连接以后不会生成额外的元组。

3.2　函数依赖

1.函数依赖的定义

　　设有关系模式R（A1，A2，...An）或简记为R（U），X，Y是U的子集，r是R的任一具体关系，如果对r的任意两个元组t1,t2,由t1[X]=t2[X]导致t1[Y]=t2[Y]，则称X函数决定Y，或Y函数依赖于X，记为X→Y。

X→Y为模式R的一个函数依赖。

　　这个定义可以这样理解：

有一设计好的二维表，X，Y是表的某些列（可以是一列，也可以是多列），若在表中的第t1行，和第t2行上的X值相等，那么必有t1行和t2行上的Y值也相等，这就是说Y函数依赖于X。

2.函数依赖的逻辑蕴涵

　　设F是关系模式R的一个函数依赖集，X,Y是R的属性子集，如果从F中的函数依赖能够推出X→Y，则称F逻辑蕴涵X→Y，记为F|=X→Y。

　　而函数依赖的闭包F+是指被F逻辑蕴涵的函数依赖的全体构成的集合。

3.键和FD的关系

　　键是唯一标识实体的属性集。

对于键和函数依赖的关系：

有两个条件：

设关系模式R（A1,A2...An），F是R上的函数依赖集，X是R的一个子集：

　　1X→A1A2...An∈F+（它的意思是X能够决定唯一的一个元组）

　　2不存在X的真子集Y，使得Y也能决定唯一的一个元组，则X就是R的一个候选键。

（它的意思是X能决定唯一的一个元组但又没有多余的属性集）

　　包含在任何一个候选键中的属性称为主属性，不包含在任何键中的属性为非主属性（非键属性），（注意）主属性应当包含在候选键中。

4.函数依赖（FD）的推理规则

　　前面我们举的例子中是以实际经验来确定一个函数依赖的逻辑蕴涵，但是我们需要一个推理规则才能完全确定F或F+的所有函数依赖。

　　设有关系模式R（U），X，Y，Z，W均是U的子集，F是R上只涉及到U中属性的函数依赖集，推理规则如下：

　　A1自反性：

如果YXU,则X→Y在R上成立。

　　A2增广性：

如果X→Y为F所蕴涵，ZU，则XZ→YZ在R上成立。

（XZ表示X∪Z，下同）

　　A3传递性：

如果X→Y和Y→Z在R上成立，则X→Z在R上成立。

A4合并性：

如果X→Y和X→Z成立，那么X→YZ成立。

A6分解性：

如果X→Y和ZY成立，那么X→Z成立。

A5伪传性：

如果X→Y和WY→Z成立，那么WX→Z成立。

A7复合性：

{X→Y，W→Z}|=XW→YZ。

A8通用一致性定理：

{X→Y，W→Z}|=x∪（X-Y）→YZ。

5.函数依赖推理规则的完备性

　　函数依赖推理规则系统（自反性、增广性和传递性）是完备的。

由推理规则的完备性可得到两个重要结论：

　　1属性集X+中的每个属性A，都有X→A被F逻辑蕴涵，即X+是所有由F逻辑蕴含X→A的属性A的集合。

　　2F+是所有利用Amstrong推理规则从F导出的函数依赖的集合。

6.函数依赖集的等价和覆盖

　　在关系模式R（U）上的两个函数依赖集F和G，如果满足F+=G+，则称F和G是等价的，称F和G等价也称F覆盖G或G覆盖F。

　　每个函数依赖集F都可以被一个右部只有单属性的函数依赖集G所覆盖。

　　如果函数依赖集合F满足：

（1）F中每一个函数依赖的右部都是单属性；

（2）F中的任一函数依赖X→A，其F-{X→A}是不等价的；

　　（3）F中的任一函数依赖X→A，Z为X的子集。

（F-{X→A}）∪{Z→A}与F不等价。

　　则称F为最小函数依赖集合。

如果函数依赖集F和G等价，并且G是最小集，那么称G是F的一个最小覆盖。

　　这一段并不要求掌握最小集的求法，但是应当通过其求法理解最小集的概念。

3.3　关系模式分解特性

1.模式分解中存在的问题

　　模式分解

　　就是将一个泛关系模式R分解成数据库模式ρ，以ρ代替R的过程。

它不仅仅是属性集合的分解，它是对关系模式上的函数依赖集、以及关系模式的当前值分解的具体表现。

　　分解一个模式有很多方法，但是有的分解会出现失去函数依赖、或出现插入、删除异常等情况，而有的分解则不出现相关问题。

　　衡量一个分解的标准有三种：

分解具有无损联接；

分解要保持函数依赖；

分解既要保持依赖，又要具有无损联接。

　　那么什么是无损联接呢?

什么又是保持依赖?

2.无损联接的定义和性质

　　设R是一关系模式，分解成ρ={R1,R2，...,Rk}，F是R上的一个函数依赖集。

无损联接就是指R中每一个满足F的关系r（也就是一个关系实例）都有r=πR1（r）|X|πR2（r）...|X|πR3（r），即r为它在Ri上的投影的自然联接。

　　最简单的理解，也就是说，分解后的关系自然连接后完全等于分解前的关系，则这个分解相对于F是无损联接分解。

设R的分解为ρ={R1,R2},F为R所满足的函数依赖集，则分解ρ具有无损联接性的充分必要条件是：

　　R1∩R2→（R1-R2）

　　R1∩R2→（R2-R1）

　　也就是说，分解后的两个模式的交能决定这两个模式的差集，即R1、R2的公共属性能够函数决定R1或R2中的其他属性，这样的分解就必定是无损联接分解。

3.保持函数依赖的分解

　　在分解过程中，要求模式分解的无损联接是必要的，只有无损联接分解才能保证任何一个关系能由它的那些投影进行自然联接得到恢复。

　　同时，分解关系模式时还应保证关系模式的函数依赖集在分解后仍在数据库模式中保持不变，这就是保持函数依赖的问题。

也就是所有分解出的模式所满足的函数依赖的全体应当等价于原模式的函数依赖集。

只有这样才能确保整个数据库中数据的语义完整性不受破坏。

3.4　式

1.1NF、2NF、3NF、BCNF的定义：

　　1NF：

第一式

　　即关系模式中的属性的值域中每一个值都是不可再分解的值。

如果某个数据库模式都是第一式的，则称该数据库模式是属于第一式的数据库模式。

　　2NF：

第二式

　　如果关系模式R为第一式，并且R中每一个非主属性完全函数依赖于R的某个候选键，则称为第二式模式。

非主属性、完全函数依赖、候选键

　　三个名词的含义。

　　候选键就是指可以唯一决定关系模式R中某元组值且不含有多余属性的属性集。

　　非主属性也就是非键属性，指关系模式R中不包含在任何建中的属性。

　　设有函数依赖W→A，若存在X⊂W，有X→A成立，那么称W→A是局部依赖，否则就称W→A是完全函数依赖。

在分析是否为第2式时，应首先确定候选键，然后把关系模式中的非主属性与键的依赖关系进行考察，是否都为完全函数依赖，如是，则此关系模式为2NF。

如果数据库模式中每个关系模式都是2NF的，则此数据库模式属于2NF的数据库模式。

3NF：

第三式

　　如果关系模式R是第二式，且每个非主属性都不传递依赖于R的候选键，则称R为第三式的模式。

　　这里首先要了解传递依赖的含义：

在关系模式中，如果Y→X，X→A，且X不决定Y和A不属于X，那么Y→A是传递依赖。

　　注意的是，这里要求非主属性都不传递依赖于候选键。

BCNF：

　　这个式和第三式有联系，它是3NF的改进形式。

若关系模式R是第一式，且每个属性都不传递依赖于R的候选键。

这种关系模式就是BCNF模式。

纵观四种式，可以发现它们之间存在如下关系：

5.分解成BCNF模式集的算法

　　对于任一关系模式，可找到一个分解达到3NF，且具有无损联接和保持函数依赖性。

而对于BCNF分解，则可以保证无损联接但不一定能保证保持函数依赖集。

无损联接分解成BCNF模式集的算法：

（1）置初值ρ={R};

（2）如果ρ中所有关系模式都是BCNF，则转（4）;

　　（3）如果ρ中有一个关系模式S不是BCNF，则S中必能找到一个函数依赖集X→A有X不是S的键，且A不属于X，设S1=XA，S2=S-A，用分解S1,S2代替S，转

（2）；

　　（4）分解结束。

输出ρ。

　　在这个过程中，重点在于（3）步，判断哪个关系不是BCNF，并找到X和A。

这里，S的判断用BCNF的定义，而X不是S的键则依靠分析。

6.分解成3NF模式集

　　算法：

（1）如果R中的某些属性在F的所有依赖的左边和右边都不出现，那么这些属性可以从R中分出去，单独构成一个关系模式。

（2）如果F中有一个依赖X→A有XA→R，则ρ={R}，转（4）

　　（3）对于F中每一个X→A，构成一个关系模式XA，如果F有有X→A1，X→A2...X→An,则可以用模式XA1A2...An代替n个模式XA1,XA2...XAn;

　　（4）w分解结束，输入ρ。

　　这个过程的重点是这一句“对于F中每一个X→A，构成一个关系模式XA”，这使我们的分解十分容易，然后依据合并律（合并律：

如果X→Y和X→Z成立，那么X→YZ成立）将有关模式合并即得到所需3NF模式。

7.模式设计方法的原则

　　关系模式R相对于函数依赖集F分解成数据库模式ρ={R1,R2...Rk}，一般具有下面四项特性：

　　ρ中每个关系模式Ri上应具有某种式性质（3NF或BCNF）

　　无损联接性。

　　保持函数

展开阅读全文