1、自考数据库系统原理4735复习资料数据库系统原理复习重点第一章 数据库系统基本概念要求、目标:了解和掌握数据管理技术的发展阶段,数据描述的术语,数据抽象的四个级别,数据库管理系统的功能,数据库系统的组成。一、数据管理技术的发展1分为四个阶段:人工管理阶段、文件系统阶段、数据库阶段和高级数据库阶段。2数据库阶段数据管理的特点:1)采用数据模型表示复杂的数据结构。2)有较高的数据独立性。3)数据库系统为用户提供了方便的用户接口。4)提供四方面的数据控制功能:数据库的恢复、数据库的并发控制、数据的完整性、数据安全性。5)增加了系统的灵活性。3数据库(DB):是长期存储在计算机内、有组织的、统一管理的
2、相关数据的集合。4数据库管理系统(DBMS):是位于用户与操作系统之间的一层数据管理软件,它为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。5数据库系统(DBS):是实现有组织地、动态地存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源组成的系统,即它是采用数据库技术的计算机系统。二、数据描述1分为三个阶段:概念设计、逻辑设计和物理设计。2概念设计中的术语:1)实体:客观存在,可以相互区别的事物称为实体。2)实体集:性质相同的同类实体的集合。3)属性:实体有很多特性,每一个特性称为属性。4)实体标识符(关键码或键):能惟一标识实体的属性或属性集。以上概念
3、均有类型和值之分。3逻辑设计中的术语:1)字段(数据项):标记实体属性的命名单位称为字段或数据项。2)记录:字段的有序集合。3)文件:同一类记录的集合。4)关键码:能惟一标识文件中每个记录的字段或字段集。以上概念均有类型和值之分。4概念设计和逻辑设计中术语的对应关系:概念设计 逻辑设计 实体 记录属性 字段(数据项)实体集 文件实体标识符 关键码5实体之间联系的元数:与一个联系有关的实体集个数。常用二元联系。二元联系的类型有三种:一对一联系、一对多联系、多对多联系。6一对一联系:如果实体集E1中每个实体至多和实体集E2中的一个实体有联系,反之亦然,那么实体集E1和E2的联系称为“一对一联系”,
4、记为“1:1”。7一对多联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体间有联系,而E2中每个实体至多和E1中一个实体有联系,那么称E1对E2的联系是“一对多联系”,记为“1:N”。8多对多联系:如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)实体间有联系,反之亦然,那么称E1和E2的联系是“多对多联系”,记为“M:N”。三、数据抽象的级别1数据模型:描述数据库的结构和定义,对现实世界的数据进行抽象。2从现实世界的信息到数据库存储的数据以及用户使用的数据是一个逐步抽象过程,根据数据抽象的级别定义了四种模型:概念模型、逻辑模型、外部模型和内部模型。3概念模型:表
5、达用户需求观点的数据全局逻辑结构的模型。4逻辑模型:表达计算机实现观点的DB全局逻辑结构的模型。5外部模型:表达用户使用观点的DB局部逻辑结构的模型。6内部模型:表达DB物理结构的模型。7数据抽象的过程、即数据库设计的过程具体步骤:1)根据用户需求,设计数据库的概念模型;2)根据转换规则,把概念模型转换成数据库的逻辑模型;3)根据用户的业务特点,设计不同的外部模型,给程序员使用;4)数据库实现时,要根据逻辑模型设计其内部模型。通常分为概念设计、逻辑设计(2和3步)和物理设计三个阶段。8常用的概念模型是实体联系(ER)模型,ER模型主要用ER图来表示。9逻辑模型的分类:层次模型、网状模型、关系模
6、型等。10层次模型:用树型(层次)结构表示实体及实体间联系的数据模型。111969年,美国IBM公司的IMS系统是典型的层次模型系统。12网状模型:用有向图结构表示实体及实体间联系的数据模型。131969年,CODASYL组织提出DBTG报告中的数据模型是网状模型的主要代表。14关系模型:是由若干个关系模式组成的集合。关系模式即记录类型,它的实例称为关系,每个关系实际上是一张二维表格。151970年,美国IBM公司的E.F.Codd连续发表论文,提出关系模型,奠定了关系数据库的理论基础。关系数据库是目前的主流数据库。16外部模型中的模式称为视图。17三级模式:从用户(或应用程序)到数据库之间,
7、DB的数据结构描述有三个层次:1)外模式:用户与数据库系统的接口,是用户用到的那部分数据的描述。外模式由若干个记录类型组成。2)逻辑模式:是数据库中全部数据的整体逻辑结构的描述。3)内模式:是数据库在物理存储方面的描述。注意:外模式是逻辑模式的子集。18两级映像:1)外模式/逻辑模式映像:存在于外模式和逻辑模式之间,用于定义外模式和逻辑模式之间的对应性。2)逻辑模式/内模式映像:存在于逻辑模式和内模式之间,用于定义逻辑模式和内模式之间的对应性。19数据库系统的三级模式、两级映像结构使数据库系统达到了高度的数据独立性。20数据独立性:是指应用程序与数据库的数据结构之间相互独立,在修改数据结构时,
8、尽可能不修改应用程序。分为逻辑数据独立性和物理数据独立性。21逻辑数据独立性:如果数据库的逻辑模式要修改,那么只要对外模式/逻辑模式映像作相应的修改,可以使外模式和应用程序尽可能保持不变。这样就认为数据库达到了逻辑数据独立性。22物理数据独立性:如果数据库的内模式要修改,即数据库的物理结构有所变化,那么只要对逻辑模式/内模式映像作相应的修改,可以使逻辑模式尽可能保持不变。也就是对内模式的修改尽量不影响逻辑模式,当然对外模式和应用程序的影响更小,这样就认为数据库达到了物理数据独立性。四、数据库管理系统(DBMS)1DBMS的主要功能:数据库的定义功能(DBMS提供DDL定义数据库的三级模式、两级
9、映像等)、数据库的操纵功能(DBMS提供DML实现对数据的操作,基本的数据操作有检索和更新两类)、数据库的保护功能、数据库的维护功能、数据字典。五、数据库系统(DBS)1DBS的组成:是数据库、硬件、软件和数据库管理员的集合体。2软件包括DBMS、OS、各种主语言和应用开发支撑软件等程序。其中,DBMS是DBS的核心软件,要在OS支持下才能工作。3数据库管理员(DBA):是控制数据整体结构的一组人员,负责DBS的正常运行,承担创建、监控和维护数据库结构的责任。第二章 数据库设计和ER模型要求、目标:了解和掌握数据库应用系统设计的全过程,掌握ER模型和关系模型的基本概念,掌握概念设计中ER模型的
10、设计方法,掌握逻辑设计中ER模型向关系模型转换的方法。一、数据库系统生存期1数据库系统生存期:数据库应用系统从开始规划、设计、实现、维护到最后被新的系统取代而停止使用的整个期间。2数据库系统生存期分七个阶段:规划、需求分析、概念设计、逻辑设计、物理设计、实现、运行维护。3规划阶段三个步骤:系统调查、可行性分析、确定数据库系统总目标。4需求分析阶段:主要任务是系统分析员和用户双方共同收集数据库系统所需要的信息内容和用户对处理的需求,并以需求说明书的形式确定下来。5概念设计阶段:产生反映用户单位信息需求的概念模型。与硬件和DBMS无关。6逻辑设计阶段:将概念模型转换成DBMS能处理的逻辑模型。外模
11、型也将在此阶段完成。7物理设计阶段:对于给定的基本数据模型选取一个最适合应用环境的物理结构的过程。数据库的物理结构主要指数据库的存储记录格式、存储记录安排和存取方法。8数据库的实现:包括定义数据库结构、数据装载、编制与调试应用程序、数据库试运行。二、ER模型的基本概念 1ER模型的基本元素是:实体、联系和属性。2实体:是一个数据对象,指应用中可以区别的客观存在的事物。实体集:是指同一类实体构成的集合。实体类型:是对实体集中实体的定义。一般将实体、实体集、实体类型统称为实体。3联系:表示一个或多个实体之间的关联关系。联系集:是指同一类联系构成的集合。联系类型:是对联系集中联系的定义。一般将联系、
12、联系集、联系类型统称为联系。4同一个实体集内部实体之间的联系,称为一元联系;两个不同实体集实体之间的联系,称为二元联系,以此类推。5属性:实体的某一特性称为属性。在一个实体中,能够惟一标识实体的属性或属性集称为实体标识符。6ER模型中,方框表示实体、菱形框表示联系、椭圆形框表示属性、实体与联系、实体与其属性、联系与其属性之间用直线连接。实体标识符下画横线。联系的类型要在直线上标注。注意:联系也有可能存在属性,但联系本身没有标识符。例:假设一个学生可选多门课程,而一门课程又有多个学生选修,一个教师可讲多门课程,一门课程至多只有一个教师讲授。ER图如下:7概念设计三个步骤:设计局部ER模型、设计全
13、局ER模型和全局ER模型的优化。三、关系模型的基本概念1关系模型的定义:用二维表格表示实体集,用关键码表示实体之间联系的数据模型。2在关系模型中,字段称为属性,字段值称为属性值,记录类型称为关系模式。记录称为元组,元组的集合称为关系或实例。有时习惯称关系为表或表格,元组为行,属性为列。关系中属性个数称为元数,元组个数称为基数。3关键码(简称键):由一个或多个属性组成。4超键:在关系中能惟一标识元组的属性集称为关系模式的超键。5候选键:不含有多余属性的超键。6主键:用户选作元组标识的候选键。一般如不加说明,键是指主键。7外键:如果模式R中属性集K是其他模式的主键,那么K在模式R中称为外键。8值域
14、:关系中每一个属性都有一个取值范围,称为属性的值域。每一个属性对应一个值域,不同的属性可对应于同一值域。9关系的定义:关系是一个属性数目相同的元组的集合。10关系的性质:关系是一种规范化了的二维表格。 1)关系中每一个属性值都是不可分解的; 2)关系中不允许出现重复元组; 3)关系没有行序; 4)元组中的属性在理论上也是无序的,但使用时按习惯考虑列的顺序。11关系数据库中的数据与更新操作必须遵循三类完整性规则:实体完整性规则、参照完整性规则、用户定义的完整性规则。12实体完整性规则:要求关系中元组在组成主键的属性上不能有空值。13参照完整性规则:如果属性集K是关系模式R1的主键,K也是关系模式
15、R2的外键,那么在R2关系中,K的取值只允许两种可能,或者为空值,或者等于R1关系中某个主键值。这条规则的实质是“不允许引用不存在的实体”。其中,R1称为参照关系;R2称为依赖关系。注意:这条规则在具体使用时,有三点变通: 1)外键和相应的主键可以不同名,只要定义在相同值域上即可; 2)R1和R2可以是同一个关系模式,此时表示了同一个关系中不同元组之间的联系; 3)外键值是否允许空,应视具体问题而定。14用户定义的完整性规则:用户针对具体的数据约束,设置的完整性规则,由系统来检验实施。四、ER模型到关系模型的转换1ER图转换成关系模式集的算法: 1)实体类型的转换:将每个实体类型转换成一个关系模式,实体的属性即为关系模式的属性,实体标识符即为关系模式的键。 2)联系类型的转换:主要掌握二元联系类型的转换。a)若实体间联系是1:1,可以在两个实体类型转换成的关系模式中任意一个关系模式的属性中加入另一个关系模式的键(作为外键)和联系类型的属性。b)若实体间联系是1:N,则在N端实体类型转换
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1