关系数据库的规范化设计.pptx
《关系数据库的规范化设计.pptx》由会员分享,可在线阅读,更多相关《关系数据库的规范化设计.pptx(80页珍藏版)》请在冰豆网上搜索。
2022/10/14,1,本章重要概念,
(1)关系模式的冗余和异常问题。
(2)FD的定义、逻辑蕴涵、闭包、推理规则、与关键码的联系;平凡的FD;属性集的闭包;推理规则的正确性和完备性;FD集的等价;最小依赖集。
(3)无损分解的定义、性质、测试;保持依赖集的分解。
(4)关系模式的范式:
1NF,2NF,3NF,BCNF。
分解成2NF、3NF模式集的算法。
2022/10/14,2,前言,关系数据库的规范化设计是指面对一个现实问题,如何选择一个比较好的关系模式集合。
规范化设计理论主要包括三个方面的内容:
数据依赖、范式和模式设计方法。
其中数据依赖起着核心的作用。
数据依赖研究数据之间的联系,范式是关系模式的标准,模式设计方法是自动化设计的基础。
规范化设计理论对关系数据库结构的设计起着重要的作用。
2022/10/14,3,4.1.1关系模型的外延和内涵,外延就是通常所说的关系、表或当前值,它的基本性质已在前面介绍过。
由于用户经常对关系进行插入、删除和修改操作,因此外延是与时间有关的,随着时间的推移在不断变化。
内涵是与时间独立的,是对数据的定义以及数据完整性约束的定义。
对数据的定义包括对关系、属性、域的定义和说明。
对数据完整性约束的定义涉及面较广,主要包括以下几个方面:
静态约束,涉及到数据之间联系(称为“数据依赖,datadependences)、主键和值域的设计。
动态约束,定义各种操作(插入、删除、修改)对关系值的影响。
2022/10/14,4,4.1.2关系模式的冗余和异常问题
(一),例4.1,图4.1关系模式R的实例,2022/10/14,5,4.1.2关系模式的冗余和异常问题
(二),数据冗余如果一个教师教几门课程,那么这个教师的地址就要重复几次存储。
操作异常由于数据的冗余,在对数据操作时会引起各种异常:
修改异常。
例如教师t1教三门课程,在关系中就会有三个元组。
如果他的地址变了,这三个元组中的地址都要改变。
若有一个元组中的地址未更改,就会造成这个教师的地址不惟一,产生不一致现象。
插入异常。
如果一个教师刚调来,尚未分派教学任务,那么要将教师的姓名和地址存储到关系中去时,在属性C#和CNAME上就没有值(空值)。
在数据库技术中空值的语义是非常复杂的,对带空值元组的检索和操作也十分麻烦。
删除异常。
如果在图4.1中要取消教师t3的教学任务,那么就要把这个教师的元组删去,同时也把t3的地址信息从表中删去了。
这是一种不合适的现象。
2022/10/14,6,4.1.2关系模式的冗余和异常问题(三),2022/10/14,7,4.2.1函数依赖的定义
(一),定义4.1设有关系模式R(U),X和Y是属性集U的子集,函数依赖(FunctionalDependency,简记为FD)是形为XY的一个命题,只要r是R的当前关系,对r中任意两个元组t和s,都有tX=sX蕴涵tY=sY,那么称FDXY在关系模式R(U)中成立。
2022/10/14,8,4.2.1函数依赖的定义
(二),例4.2,图4.3关系模式R的两个关系,2022/10/14,9,4.2.1函数依赖的定义(三),例4.3有一个关于学生选课、教师任课的关系模式:
R(S#,SNAME,C#,GRADE,CNAME,TNAME,TAGE)属性分别表示学生学号、姓名、选修课程的课程号、成绩、课程名、任课教师姓名和年龄等意义。
如果规定,每个学号只能有一个学生姓名,每个课程号只能决定一门课程,那么可写成下列FD形式:
S#SNAMEC#CNAME每个学生每学一门课程,有一个成绩,那么可写出下列FD:
(S#,C#)GRADE还可以写出其他一些FD:
C#(CNAME,TNAME,TAGE)TNAMETAGE,2022/10/14,10,4.2.2FD的逻辑蕴涵,定义4.2设F是在关系模式R上成立的函数依赖的集合,XY是一个函数依赖。
如果对于R的每个满足F的关系r也满足XY,那么称F逻辑蕴涵XY,记为FXY。
定义4.3设F是函数依赖集,被F逻辑蕴涵的函数依赖全体构成的集合,称为函数依赖集F的闭包(closure),记为F+。
即F+=XY|记为FXY。
2022/10/14,11,4.2.3FD的推理规则
(一),设U是关系模式R的属性集,F是R上成立的只涉及到U中属性的函数依赖集。
FD的推理规则有以下三条:
A1(自反性,Reflexivity):
若YXU,则XY在R上成立。
A2(增广性,Augmentation):
若XY在R上成立,且ZU,则XZYZ在R上成立。
A3(传递性,Transitivity):
若XY和YZ在R上成立,则XZ在R上成立。
2022/10/14,12,4.2.3FD的推理规则
(二),定理4.1FD推理规则A1、A2和A3是正确的。
也就是,如果XY是从F用推理规则导出,那么XY在F+中。
定理4.2FD的其他五条推理规则:
(1)A4(合并性,Union):
XY,XZXYZ。
(2)A5(分解性,Decomposition):
XY,ZYXZ。
(3)A6(伪传递性):
XY,WYZWXZ。
(4)A7(复合性,Composition):
XY,WZXWYZ。
(5)A8XY,WZX(WY)YZ。
2022/10/14,13,4.2.3FD的推理规则(三),例4.5已知关系模式R(ABC),F=AB,BC,求F+。
根据FD的推理规则,可推出F的F+有43个FD。
例如,据规则A1可推出A(表示空属性集),AA,。
据已知的AB及规则A2可推出ACBC,ABB,AAB,。
据已知条件及规则A3可推出AC等。
有兴趣的同学可推出这43个FD。
2022/10/14,14,4.2.3FD的推理规则(四),定义4.4对于FDXY,如果YX,那么称XY是一个“平凡的FD”,否则称为“非平凡的FD”。
定理4.3如果A1An是关系模式R的属性集,那么XA1An成立的充分必要条件是XAi(i=1,n)成立。
2022/10/14,15,4.2.4FD和关键码的联系,定义4.5设关系模式R的属性集是U,X是U的一个子集。
如果XU在R上成立,那么称X是R的一个超键。
如果XU在R上成立,但对于X的任一真子集X1都有X1U不成立,那么称X是R上的一个候选键。
本章的键都是指候选键。
例4.6在学生选课、教师任课的关系模式中:
R(S#,SNAME,C#,GRADE,CNAME,TNAME,TAGE)如果规定:
每个学生每学一门课只有一个成绩;每个学生只有一个姓名;每个课程号只有一个课程名;每门课程只有一个任课教师。
根据这些规则,可以知道(S#,C#)能函数决定R的全部属性,并且是一个候选键。
虽然(S#,SNAME,C#,TNAME)也能函数决定R的全部属性,但相比之下,只能说是一个超键,而不能说是候选键,因为其中含有多余属性。
2022/10/14,16,4.2.5属性集的闭包,定义4.6设F是属性集U上的FD集,X是U的子集,那么(相对于F)属性集X的闭包用X+表示,它是一个从F集使用FD推理规则推出的所有满足XA的属性A的集合:
X+=属性A|XA在F+中定理4.4XY能用FD推理规则推出的充分必要条件是YX+。
例4.7属性集U为ABCD,FD集为AB,BC,DB。
则用上述算法,可求出A+=ABC,(AD)+=ABCD,(BD)+=BCD,等等。
2022/10/14,17,4.2.5FD推理规则的完备性,推理规则的正确性是指“从FD集F使用推理规则集推出的FD必定在F+中”,完备性是指“F+中的FD都能从F集使用推理规则集导出”。
也就是正确性保证了推出的所有FD是正确的,完备性保证了可以推出所有被蕴涵的FD。
这就保证了推导的有效性和可靠性。
定理4.5FD推理规则A1,A2,A3是完备的。
2022/10/14,18,4.2.6FD集的最小依赖集
(一),定义4.7如果关系模式R(U)上的两个函数依赖集F和G,有F+=G+,则称F和G是等价的函数依赖集。
定义4.8设F是属性集U上的FD集。
如果Fmin是F的一个最小依赖集,那么Fmin应满足下列四个条件:
F+min=F+;每个FD的右边都是单属性;Fmin中没有冗余的FD(即F中不存在这样的函数依赖XY,使得F与FXY等价);每个FD的左边没有冗余的属性(即F中不存在这样的函数依赖XY,X有真子集W使得FXYWY与F等价)。
2022/10/14,19,4.2.6FD集的最小依赖集
(二),例4.8设F是关系模式R(ABC)的FD集,F=ABC,BC,AB,ABC,试求Fmin。
先把F中的FD写成右边是单属性形式:
F=AB,AC,BC,AB,ABC显然多了一个AB,可删去。
得F=AB,AC,BC,ABCF中AC可从AB和BC推出,因此AC是冗余的,可删去。
得F=AB,BC,ABCF中ABC可从AB和BC推出,因此ABC也可删去。
最后得F=AB,BC,即所求的Fmin。
2022/10/14,20,4.3关系模式的分解4.3.1模式分解问题
(一),定义4.9设有关系模式R(U),属性集为U,R1、Rk都是U的子集,并且有R1R2RkU。
关系模式R1、Rk的集合用表示,=R1,Rk。
用代替R的过程称为关系模式的分解。
这里称为R的一个分解,也称为数据库模式。
2022/10/14,21,4.3.1模式分解问题
(二),图4.5模式分解示意图,2022/10/14,22,4.3.2无损分解
(一),例4.9,r,C,C,4,3,4,3,2022/10/14,23,4.3.2无损分解
(二),定义4.10设R是一个关系模式,F是R上的一个FD集。
R分解成数据库模式=R1,Rk。
如果对R中满足F的每一个关系r,都有r=R1(r)R2(r)Rk(r)那么称分解相对于F是“无损联接分解”(losslessjoindecomposition),简称为“无损分解”,否则称为“损失分解”(lossydecomposition)。
2022/10/14,24,4.3.2无损分解(三),定理4.6设=R1,Rk是关系模式R的一个分解,r是R的任一关系,ri=Ri(r)(1ik),那么有下列性质:
rm(r);若s=m(r),则Ri(s)=ri;m(m(r)=m(r),这个性质称为幂等性(Idempotent)。
2022/10/14,25,4.3.2无损分解(四),R,=,R,1,,,R,2,,,,,R,k,r,r,1,,,r,2,,,,,r,k,s,s,1,,,s,2,,,,,s,k,图中:
r,i,=,Ri,(,r,)(,1,i,k,),s,i,=,Ri,(,r,)(,1,i,k,),据性质,1.,有,r,m,(,r,),据性质,2.,有,s,i,=,r,i,(,1,i,k,),图4.8r的投影连接变换示意图,2022/10/14,26,4.3.2无损分解(五),图4.9泛关系假设下的示意图,图4.9泛关系假设时的示意图,2022/10/14,27,4.3.2无损分解(六),例4.10设关系模式R(ABC)分解成=AB,BC。
(a)和(b)分别是模式AB和BC上的值r1和r2,(c)是r1r2的值。
显然BC(r1r2)r2。
这里r2中元组(b2c2)就是一个悬挂元组,由于它的存在,使得r1和r2不存在泛关系r。
r,2022/10/14,28,4.3.3无损分解的测试方法
(一),算法4.3无损分解的测试构造一张k行n列的表格,每列对应一个属性Aj(1jn),每行对应一个模式Ri(1ik)。
如果Aj在Ri中,那么在表格的第i行第j列处填上符号aj,否则填上bij。
把表格看成模式R的一个关系,反复检查F中每个FD在表格中是否成立,若不成立,则修改表格中的值。
修改方法如下:
对于F中一个FDXY,如果表格中有两行在X值上相等,在Y值上不相等,那么把这两行在Y值上也改成相等的值。
如果Y值中有一个是aj,那么另一个也改成aj;如果没有aj,那么