1、数据库系统概论复习资料王珊版数据库系统概论笔记数据(Data):是数据库中存储的基本对象数据的定义:描述事物的符号记录数据的种类:文字、图形、图象、声音等数据的特点:数据与其语义是不可分的数据库(Database,简称DB):是长期储存在计算机内、有组织的、可共享的大量数据集合数据库的特征:数据按一定的数据模型组织、描述和储存可为各种用户共享冗余度较小数据独立性较高易扩展数据库管理系统(Database Management System,简称DBMS):是位于用户与操作系统之间的一层数据管理软件。DBMS的用途:科学地组织和存储数据、高效地获取和维护数据DBMS的主要功能:数据库的运行管理
2、保证数据的安全性、完整性、 多用户对数据的并发使用 发生故障后的系统恢复数据库的建立和维护功能(实用程序) 数据库数据批量装载 数据库转储 介质故障恢复 数据库的重组织 性能监视等数据库系统(Database System,简称DBS)是指在计算机系统中引入数据库后的系统构成。数据库系统的构成由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(和用户)构成。数据管理对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。数据模型应满足三方面要求能比较真实地模拟现实世界容易为人所理解便于在计算机上实现数据模型分成两
3、个不同的层次(1) 概念模型 也称信息模型,它是按用户的观点来对数据和信息建模。 (2) 数据模型 主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模。 客观对象的抽象过程-两步抽象现实世界中的客观对象抽象为概念模型;把概念模型转换为某一DBMS支持的数据模型。数据结构对象类型的集合数据结构是对系统静态特性的描述两类对象与数据类型、内容、性质有关的对象与数据之间联系有关的对象数据操作对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则数据操作的类型检索更新(包括插入、删除、修改)数据模型对操作的定义操作的确切含义操作符号操作规则(如优先级)实现操作的语言数据
4、操作是对系统动态特性的描述。数据模型对约束条件的定义反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。信息世界中的基本概念(1) 实体(Entity) 客观存在并可相互区别的事物称为实体。 (2) 属性(Attribute) 实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。 (3) 码(Key) 唯一标识实体的属性集称为码。 (4) 域(Domain) 属性的取值范围称为该属性的域。 (5) 实体型(Entity Type) 用实体名及其属性名集合来抽象和刻画同类实体称为实体型(6) 实
5、体集(Entity Set) 同型实体的集合称为实体集联系(Relationship) 现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系和实体之间的联系实体型间联系 两个实体型 一对一联系(1:1) 三个实体型 一对多联系(1:n) 一个实体型 多对多联系(m:n) 两个实体型间的联系 一对一联系 如果对于实体集A中的每一个实体,实体集B中至多有一个实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系。记为1:1。 一对多联系如果对于实体集A中的每一个实体,实体集B中有n个实体(n0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则
6、称实体集A与实体集B有一对多联系 记为1:n多对多联系(m:n)如果对于实体集A中的每一个实体,实体集B中有n个实体(n0)与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m0)与之联系,则称实体集A与实体B具有多对多联系。记为m:n概念模型的表示方法实体联系方法(E-R方法)用E-R图来描述现实世界的概念模型E-R方法也称为E-R模型常用数据模型非关系模型层次模型(Hierarchical Model)网状模型(Network Model )数据结构:以基本层次联系为基本单位 基本层次联系:两个记录以及它们之间的一对多(包括一对一)的联系关系模型(Relational M
7、odel) 数据结构:表面向对象模型(Object Oriented Model)数据结构:对象层次模型 满足下面两个条件的基本层次联系的集合为层次模型。1. 有且只有一个结点没有双亲结点,这个结点称为根 结点2. 根以外的其它结点有且只有一个双亲结点表示方法实体型:用记录类型描述。 每个结点表示一个记录类型。属性:用字段描述。每个记录类型可包含若干个字段。联系:用结点之间的连线表示记录(类)型之间的 一对多的联系网状数据模型的数据结构网状模型满足下面两个条件的基本层次联系的集合为网状模型。1. 允许一个以上的结点无双亲;2. 一个结点可以有多于一个的双亲。表示方法(与层次数据模型相同)实体型
8、:用记录类型描述。 每个结点表示一个记录类型。属性:用字段描述。 每个记录类型可包含若干个字段。联系:用结点之间的连线表示记录(类)型之 间的一对多的父子联系。关系模型的基本概念关系(Relation)一个关系对应通常说的一张表。元组(Tuple)表中的一行即为一个元组。属性(Attribute)表中的一列即为一个属性,给每一个属性起一个名称即属性名。关系必须是规范化的,满足一定的规范条件最基本的规范条件:关系的每一个分量必须是一个不可分的数据项。查询、插入、删除、更新数据操作是集合操作,操作对象和操作结果都是关系,即若干元组的集合存取路径对用户隐蔽,用户只要指出“干什么”,不必详细说明“怎么
9、干”关系模型的完整性约束实体完整性参照完整性用户定义的完整性关系数据模型的存储结构表以文件形式存储有的DBMS一个表对应一个操作系统文件有的DBMS自己设计文件结构关系模型的优缺点优点建立在严格的数学概念的基础上概念单一。数据结构简单、清晰,用户易懂易用实体和各类联系都用关系来表示。对数据的检索结果也是关系。关系模型的存取路径对用户透明具有更高的数据独立性,更好的安全保密性简化了程序员的工作和数据库开发建立的工作缺点存取路径对用户透明导致查询效率往往不如非关系数据模型为提高性能,必须对用户的查询请求进行优化增加了开发数据库管理系统的难度数据库系统外部的体系结构单用户结构主从式结构分布式结构客户
10、/服务器结构浏览器/应用服务器/数据库服务器结构分布式结构的数据库系统数据库中的数据在逻辑上是一个整体,但物理地分布在计算机网络的不同结点上。网络中的每个结点都可以独立处理本地数据库中的数据,执行局部应用同时也可以同时存取和处理多个异地数据库中的数据,执行全局应用优点适应了地理上分散的公司、团体和组织对于数据库应用的需求。缺点数据的分布存放给数据的处理、管理与维护带来困难。当用户需要经常访问远程数据时,系统效率会明显地受到网络传输的制约数据库管理员(DBA)决定数据库中的信息内容和结构决定数据库的存储结构和存取策略定义数据的安全性要求和完整性约束条件关系数据库关系模型的组成关系数据结构关系操作
11、集合关系完整性约束1) 常用的关系操作查询选择、投影、连接、除、并、交、差数据更新插入、删除、修改查询的表达能力是其中最主要的部分2) 关系操作的特点集合操作方式,即操作的对象和结果都是集合。非关系数据模型的数据操作方式:一次一记录文件系统的数据操作方式3) 关系数据语言的种类关系代数语言 用对关系的运算来表达查询要求4) 关系数据语言的特点关系语言是一种高度非过程化的语言存取路径的选择由DBMS的优化机制来完成用户不必用循环结构就可以完成数据操作能够嵌入高级语言中使用关系代数、元组关系演算和域关系演算三种语言在表达能力上完全等价关系 域(Domain) 2. 笛卡尔积(Cartesian P
12、roduct) 3. 关系(Relation)域是一组具有相同数据类型的值的集合。例:整数实数介于某个取值范围的整数长度指定长度的字符串集合男,女介于某个取值范围的日期笛卡尔积给定一组域D1,D2,Dn,这些域中可以有相同的。D1,D2,Dn的笛卡尔积为:D1D2Dn(d1,d2,dn)diDi,i1,2,n所有域的所有取值的一个组合不能重复2) 元组(Tuple)笛卡尔积中每一个元素(d1,d2,dn)叫作一个n元组(n-tuple)或简称元组。 3) 分量(Component)笛卡尔积元素(d1,d2,dn)中的每一个值di叫作一个分量。4) 基数(Cardinal number)若Di(
13、i1,2,n)为有限集,其基数为mi(i1,2,n),则D1D2Dn的基数M为:5)笛卡尔积的表示方法笛卡尔积可表示为一个二维表。表中的每行对应一个元组,表中的每列对应一个域。关系(Relation)1) 关系D1D2Dn的子集叫作在域D1,D2,Dn上的关系,表示为 R(D1,D2,Dn) R:关系名 n:关系的目或度(Degree)2) 元组关系中的每个元素是关系中的元组,通常用t表示。3) 单元关系与二元关系当n=1时,称该关系为单元关系(Unary relation)。当n=2时,称该关系为二元关系(Binary relation)4) 关系的表示关系也是一个二维表,表的每行对应一个元
14、组,表的每列对应一个域。5) 属性关系中不同列可以对应相同的域,为了加以区分,必须对每列起一个名字,称为属性(Attribute)。n目关系必有n个属性。6) 码候选码(Candidate key)若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码在最简单的情况下,候选码只包含一个属性。称为全码(All-key)在最极端的情况下,关系模式的所有属性组是这个关系模式的候选码,称为全码(All-key)主码若一个关系有多个候选码,则选定其中一个为主码(Primary key)主码的诸属性称为主属性(Prime attribute)。不包含在任何侯选码中的属性称为非码属性(Non-k
15、ey attribute) 7) 三类关系基本关系(基本表或基表)实际存在的表,是实际存储数据的逻辑表示查询表查询结果对应的表视图表由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据基本关系的性质 列是同质的(Homogeneous)每一列中的分量是同一类型的数据,来自同一个域 不同的列可出自同一个域其中的每一列称为一个属性不同的属性要给予不同的属性名 列的顺序无所谓列的次序可以任意交换遵循这一性质的数据库产品(如ORACLE),增加新属性时,永远是插至最后一列但也有许多关系数据库产品没有遵循这一性质,例如FoxPro仍然区分了属性顺序 任意两个元组不能完全相同由笛卡尔积的性质决定但许
16、多关系数据库产品没有遵循这一性质。例如:Oracle,FoxPro等都允许关系表中存在两个完全相同的元组,除非用户特别定义了相应的约束条件。 行的顺序无所谓行的次序可以任意交换遵循这一性质的数据库产品(如ORACLE),插入一个元组时永远插至最后一行但也有许多关系数据库产品没有遵循这一性质,例如FoxPro仍然区分了元组的顺序 分量必须取原子值每一个分量都必须是不可分的数据项。这是规范条件中最基本的一条关系模式(Relation Schema)是型关系是值关系模式是对关系的描述元组集合的结构属性构成属性来自的域 属性与域之间的映象关系元组语义以及完整性约束条件属性间的数据依赖关系集合 定义关系
17、模式关系模式可以形式化地表示为: R(U,D,dom,F) R 关系名 U 组成该关系的属性名集合 D 属性组U中属性所来自的域 dom 属性向域的映象集合 F 属性间的数据依赖关系集合关系模式通常可以简记为 R (U) 或 R (A1,A2,An) R 关系名A1,A2,An 属性名注:域名及属性向域的映象常常直接说明为 属性的类型、长度关系模式对关系的描述静态的、稳定的关系关系模式在某一时刻的状态或内容动态的、随时间不断变化的关系模式和关系往往统称为关系通过上下文加以区别1. 关系数据库在一个给定的应用领域中,所有实体及实体之间联系的关系的集合构成一个关系数据库。2. 关系数据库的型与值关
18、系数据库也有型和值之分关系数据库的型称为关系数据库模式,是对关系数据库的描述若干域的定义在这些域上定义的若干关系模式关系数据库的值是这些关系模式在某一时刻对应的关系的集合,通常简称为关系数据库3 关系的完整性关系模型的完整性规则是对关系的某种约束条件。关系模型中三类完整性约束:实体完整性参照完整性用户定义的完整性实体完整性和参照完整性是关系模型必须满足的完整性约束条件,被称作是关系的两个不变性,应该由关系系统自动支持。实体完整性实体完整性规则(Entity Integrity)若属性A是基本关系R的主属性,则属性A不能取空值关系模型必须遵守实体完整性规则的原因(1) 实体完整性规则是针对基本关
19、系而言的。一个基本表通常对应现实世界的一个实体集或多对多联系。(2) 现实世界中的实体和实体间的联系都是可区分的,即它们具有某种唯一性标识。(3) 相应地,关系模型中以主码作为唯一性标识。关系模型必须遵守实体完整性规则的原因(续)(4) 主码中的属性即主属性不能取空值。 空值就是“不知道”或“无意义”的值。 主属性取空值,就说明存在某个不可标识的实体,即存在不可区分的实体,这与第(2)点相矛盾,因此这个规则称为实体完整性。注意实体完整性规则规定基本关系的所有主属性都不能取空值参照完整性1. 关系间的引用2. 外码3. 参照完整性规则1. 关系间的引用在关系模型中实体及实体间的联系都是用关系来描
20、述的,因此可能存在着关系与关系间的引用。2外码(Foreign Key)设F是基本关系R的一个或一组属性,但不是关系R的码。如果F与基本关系S的主码Ks相对应,则称F是基本关系R的外码基本关系R称为参照关系(Referencing Relation)基本关系S称为被参照关系(ReferencedRelation)或目标关系(Target Relation)。说明关系R和S不一定是不同的关系目标关系S的主码Ks 和参照关系的外码F必须定义在同一个(或一组)域上外码并不一定要与相应的主码同名 当外码与相应的主码属于不同关系时,往往 取相同的名字,以便于识别3. 参照完整性规则若属性(或属性组)F是
21、基本关系R的外码它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为: 或者取空值(F的每个属性值均为空值) 或者等于S中某个元组的主码值。2.3.3 用户定义的完整性用户定义的完整性是针对某一具体关系数据库的约束条件,反映某一具体应用所涉及的数据必须满足的语义要求。关系模型应提供定义和检验这类完整性的机制,以便用统一的系统的方法处理它们,而不要由应用程序承担这一功能。Operation 运算,操作Operator 算子Operand 操作数1.关系代数 一种抽象的查询语言 用对关系的运算来表达查询2关系代数运算的三个要素运算对象:关系运算结果
22、:关系运算符:四类关系代数运算符 集合运算符-并差交广义笛卡尔积比较运算符 大于大于等于小于小于等于等于不等于专门的关系运算符 选择投影连接除逻辑运算符 非与或4关系代数运算的分类 传统的集合运算 并、差、交、广义笛卡尔积 专门的关系运算 选择、投影、连接、除5表示记号 (1) R,tR,tAi 设关系模式为R(A1,A2,An)它的一个关系设为R。tR表示t是R的一个元组tAi则表示元组t中相应于属性Ai的一个分量 (2) A,tA, A 若A=Ai1,Ai2,Aik,其中Ai1,Ai2,Aik是A1,A2,An中的一部分,则A称为属性列或域列。tA=(tAi1,tAi2,tAik)表示元组
23、t在属性列A上诸分量的集合。A则表示A1,A2,An中去掉Ai1,Ai2,Aik后剩余的属性组。 (3) tr ts R为n目关系,S为m目关系。tr R,tsS, tr ts称为元组的连接。它是一个n + m列的元组,前n个分量为R中的一个n元组,后m个分量为S中的一个m元组。 4)象集Zx 给定一个关系R(X,Z),X和Z为属性组。当tX=x时,x在R中的象集(Images Set)为: Zx=tZ|t R,tX=x 它表示R中属性组X上值为x的诸元组在Z上分量的集合。 1. 并(Union)R和S具有相同的目n(即两个关系都有n个属性)相应的属性取自同一个域RS 仍为n目关系,由属于R或
24、属于S的元组组成 RS = t|t Rt S R和S具有相同的目n相应的属性取自同一个域R - S 仍为n目关系,由属于R而不属于S的所有元组组成 R -S = t|tRtS R和S具有相同的目n相应的属性取自同一个域RS仍为n目关系,由既属于R又属于S的元组组成 RS = t|t Rt S RS = R (R-S)4. 广义笛卡尔积(Extended Cartesian Product)Rn目关系,k1个元组Sm目关系,k2个元组RS 列:(n+m)列的元组的集合元组的前n列是关系R的一个元组后m列是关系S的一个元组行:k1k2个元组RS = tr ts |tr R tsS 专门的关系运算1
25、. 选择(Selection) 1) 选择又称为限制(Restriction)2) 选择运算符的含义在关系R中选择满足给定条件的诸元组 F(R) = t|tRF(t)= 真F:选择条件,是一个逻辑表达式,基本形式为: ( X1Y1 ) ( X2Y2 ):比较运算符(,或)X1,Y1等:属性名、常量、简单函数;属性名也可以用它的序号来代替;:逻辑运算符(或) :表示任选项:表示上述格式可以重复下去3) 选择运算是从行的角度进行的运算 2. 投影(Projection) 1)投影运算符的含义从R中选择出若干属性列组成新的关系 A(R) = tA | t R A:R中的属性列2)投影操作主要是从列的
26、角度进行运算但投影之后不仅取消了原关系中的某些列,而且还可能取消某些元组(避免重复行)3. 连接(Join) 1)连接也称为连接2)连接运算的含义从两个关系的笛卡尔积中选取属性间满足一定条件的元组 R S = | tr Rts StrAtsB A和B:分别为R和S上度数相等且可比的属性组:比较运算符 连接运算从R和S的广义笛卡尔积RS中选取(R关系)在A属性组上的值与(S关系)在B属性组上值满足比较关系的元组。 3)两类常用连接运算等值连接(equijoin) 什么是等值连接为“”的连接运算称为等值连接 等值连接的含义从关系R与S的广义笛卡尔积中选取A、B属性值相等的那些元组,即等值连接为:
27、R S = | tr Rts StrA = tsB 4)一般的连接操作是从行的角度进行运算。自然连接还需要取消重复列,所以是同时从行和列的角度进行运算。 4)象集Z给定一个关系R(X,Z),X和Z为属性组。当tX=x时,x在R中的象集(Images Set)为: Zx=tZ|t R,tX=x 它表示R中属性组X上值为x的诸元组在Z上分量的集合。 4. 除(Division) 给定关系R (X,Y) 和S (Y,Z),其中X,Y,Z为属性组。R中的Y与S中的Y可以有不同的属性名,但必须出自相同的域集。R与S的除运算得到一个新的关系P(X),P是R中满足下列条件的元组在X属性列上的投影:元组在X上分量值x的象集Yx包含S在Y上投影的集合。 RS = tr X | tr RY (S) Yx Yx:x在R中的象集,x = trX2)除操作是同时从行和列角度进行运算第三章 关系数据库标准语言SQL3.1 SQL概述SQL的特点1. 综合统一2. 高度非过程化3. 面向集合的操作方式4. 以同一种语法结构提供两种使用方法5. 语言简洁,易学易用5. 语言简捷,易学易用3.2 数 据 定 义 3.2.1 定义语句格式CREATE TABLE (
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1