数据库原理复习资料.docx
《数据库原理复习资料.docx》由会员分享,可在线阅读,更多相关《数据库原理复习资料.docx(63页珍藏版)》请在冰豆网上搜索。
数据库原理复习资料
数据库原理复习资料
杰哥一郎
知识点部分
1,数据的定义:
数据是由用来记录信息的可识别的符号组合。
1,数据管理阶段:
人工管理,文件系统,数据库系统。
1、数据库管理系统(DBMS)的主要功能:
数据定义功能、数据操纵功能、数据库运行管理功能、数据的建立和维护功能、数据通讯接口、数据组织存储和管理。
2、数据模型的组成要素:
数据结构、数据操作、数据的完整性约束。
3、三个世界:
现实世界、信息世界、计算机世界。
4、信息世界的相关概念:
(1)实体:
客观存在并且可以相互区别的“事物”称为实体。
(2)属性:
实体所具有的某一特性称为属性。
(3)实体型:
具有相同属性的实体必然具有共同的特性。
所以,用实体名及其属性名集合来抽象和描述同类实体,称为实体型。
(4)实体集:
同型实体的集合称为实体集。
(5)码(Key):
在实体型中,能唯一标识一个实体的属性或属性集称为实体的码。
(6)域:
属性的取值范围称为该属性的域。
(7)联系:
实体内部和实体之间的联系。
实体之间的联系有一对一,一对多、多对多三种。
概念模型的一种表示方法:
实体-联系方法,E-R图:
提供了表示实体型、属性和联系的方法:
实体型:
用矩形表示,矩形框内写实体名;属性:
用椭圆表示,并用无向边将其与对应的实体型连接起来;联系:
用菱形表示,框内写明联系名,并用无向边与有关实体型连接起来,同时在无向边上标上联系的类型(1:
1,1:
n,m:
n)。
联系也可以有属性。
两个实体型之间的联系:
一对一,一对多,多对多。
5、概念模型E-R表示实体型用矩形框表示、属性用椭圆形框表示、联系用菱形框表示。
6、四种数据模型:
层次模型(树)、网状模型(有向图)、关系模型(表)、面向对象模型。
7、关系模型的基本概念:
(1)关系与关系实例:
对应由行和列组成的一张二维表。
(2)元组:
元组是二维表格中的一行。
(3)属性:
二维表中的一列,给每一个属性起一个名称即属性名。
(4)域:
属性的取值范围。
(5)分量:
每一行元组对应的列的属性,即为元组中的一个属性值。
(6)候选键:
如果一个属性或若干属性的组合且该属性的组合中不包含多余的属性,能够唯一标识一个关系的元组。
(7)主键:
当一个关系有多个候选键时,可以从中选择一个作为主键。
一个关系只能有一个主键。
(8)主属性和非主属性:
包含在候选键中的属性为主属性,不包含的为非主属性。
(9)关系模式:
实体用关系来表示的。
(10)实例关系:
是关系模式的“值”,是关系的数据。
8、试述数据库系统的三级模式结构及每级模式的作用?
答:
数据库的三级模式是指逻辑模式、外模式(子模式)、内模式(物理模式)。
逻辑模式是对数据库中数据的整体逻辑结构和特征的描述。
外模式是对各个用户或程序所涉及到的数据的逻辑结构和数据特征的描述。
内模式是数据的内部表示或底层描述。
逻辑模式是系统为了减小数据冗余、实现数据共享的目标,并对所有用户的数据进行综合抽象而得到的统一的全局数据视图。
通过外模式,可以方便用户使用和增强数据的安全性。
通过设计内模式,可以将系统的模式(全局逻辑模式)组织成最优的物理模式,以提高数据的存取效率。
改善系统的性能指标。
9、关系的完整性:
实体完整型、参照完整性、用户自定义完整性,其中实体完整性和参照完整性是关系模型必须满足的完整性约束条件,被称作关系的两个不变特性。
10、关系模型由数据结构、关系操作和关系完整性约束组成。
11、数据字典是指对数据的数据项、数据结构、数据流、数据存储、处理逻辑、外部实体等进行定义和描述,其目的是对数据流程图中的各个元素做出详细的说明。
数据字典最重要的作用是作为分析阶段的工具。
任何字典最重要的用途都是供人查询对不了解的条目的解释,在结构化分析中,数据字典的作用是给数据流图上每个成分加以定义和说明。
换句话说,数据流图上所有的成分的定义和解释的文字集合就是数据字典,而且在数据字典中建立的一组严密一致的定义很有助于改进分析员和用户的通信
12、数据库的结构:
数据文件、事务日志文件、文件组。
13、用SQL创建数据库:
CREATEDATABASEdatabase-name使用gouse
14、创建数据表及约束:
建表CREATETABLE<表名>,空、不能为空约束NULL/NOTNULL,唯一约束UNIQUE,主键约束PRIMARYKEY,外键约束FORMIGNKEY,字段值允许范围CHECK约束
15、删除表、删除约束DROPTABLE<表名>
16、查询语句:
SELECT---FROM----WHERE
17、常用库函数:
AVG平均值,SUM总和,MAX最大值,MIN最小值,COUNT统计个数
18、分组查询GROUPBY,排序使用ORDERBY,DESC降序,ASC升序
19、修改UPDATE,添加INSERTINTO,删除数据DELETE.
20、SQL功能:
数据查询、数据操纵、数据定义、数据控制。
21、DBMS必须包括以下功能:
1.数据的安全性保护;2.数据的完整性检查;3.并发控制;4.数据库恢复。
数据模型构成:
数据结构、数据操作、完整性约束。
22、域是一组具有相同数据类型的值的集合。
笛卡尔积是域上面的一种集合运算。
关系是一张二维表。
基本表是实际存在的表,它是实际存储数据的逻辑表示。
视图表式由基本表或其他视图表到处的表,是虚表,不对应实际存储的数据。
23、SQL功能:
数据查询、数据操纵、数据定义、数据控制。
24、SQL特点:
1.综合统一;2.高度非过程化;3.面向集合的操作方式;4.以同一种语法结构提供多种使用方式;语言简洁、易学易用
25、E-R模型的基本概念
(1)实体:
现实世界中的事物;
(2)属性:
事物的特性;(3)联系:
现实世界中事物间的关系。
实体集的关系有一对一、一对多、多对多的联系。
E-R模型三个基本概念之间的联接关系;实体是概念世界中的基本单位,属性有属性域,每个实体可取属性域内的值。
一个实体的所有属性值叫元组。
E-R模型的图示法:
(1)实体集表示法;
(2)属性表法;(3)联系表示法
什么是数据?
什么是信息?
数据和信息有什么区别和联系?
数据(Data)是数据库中存储的基本对象
数据的定义描述事物的符号记录
数据的种类文本、图形、图像、音频、视频、学生的档案记录、货物的运输情况等
信息与数据之间存在着固有联系:
数据是信息的符号表示或称为载体;信息则是数据的内涵,是对数据语义的解释。
数据库是长期储存在计算机内、有组织的、可共享的大量数据的集合。
数据库的基本特征数据按一定的数据模型组织、描述和储存可为各种用户共享冗余度较小
数据独立性较高易扩展
DBMS位于用户与操作系统之间的一层数据管理软件。
是基础软件,是一个大型复杂的软件系统
DBMS的用途科学地组织和存储数据、高效地获取和维护数据
DBMS的主要功能
▪数据定义功能
提供数据定义语言(DDL)
定义数据库中的数据对象
▪数据组织、存储和管理
分类组织、存储和管理各种数据
确定组织数据的文件结构和存取方式
实现数据之间的联系
提供多种存取方法提高存取效率
▪数据操纵功能
提供数据操纵语言(DML)
实现对数据库的基本操作(查询、插入、删除和修改)
▪数据库的事务管理和运行管理
数据库在建立、运行和维护时由DBMS统一管理和控制
保证数据的安全性、完整性、多用户对数据的并发使用
发生故障后的系统恢复
▪数据库的建立和维护功能(实用程序)
数据库初始数据装载转换
数据库转储
介质故障恢复
数据库的重组织
性能监视分析等
▪其它功能
DBMS与网络中其它软件系统的通信
两个DBMS系统的数据转换
异构数据库之间的互访和互操作
v什么是数据库系统(DatabaseSystem,DBS)
v数据库系统的构成
▪数据库
▪数据库管理系统(及其开发工具)
▪应用系统
▪数据库管理员
什么是数据处理?
围绕着数据所做的工作都可称为数据处理。
即对各种数据进行收集、管理、加工和传播的一系列活动的总和。
如:
对全班学生信息进行收集、存储和查询。
数据处理包括哪些工作?
v1)数据管理:
收集信息、将信息用数据表示并按类别组织保存;
▪收集和整理数据;
▪组织和保存数据;
▪进行数据维护;
▪提供数据查询和数据统计功能。
v2)数据加工:
对数据进行变换、抽取和运算;
v3)数据传播:
在空间或时间上以各种形式传播信息,而不改变数据的结构、性质和内容;
数据管理技术
v什么是数据管理技术
▪对数据进行分类、组织、编码、存储、检索和维护
▪数据处理的中心问题
数据管理和数据处理的关系是什么?
v数据管理是数据处理业务的基本环节,而且是任何数据处理业务中必不可少的共有部分。
v数据处理是与数据管理相联系的,数据管理技术的优劣,将直接影响数据处理的效率。
v应研制有效的数据管理软件,以减少程序员的负担。
数据管理技术的产生和发展(续)
v数据管理技术的发展动力
▪应用需求的推动
▪计算机硬件的发展
▪计算机软件的发展
一、人工管理阶段
二、文件系统阶段
三、数据库系统阶段
数据库系统的特点是什么?
数据结构化数据的共享性高,冗余度低,易扩充
数据独立性高数据由DBMS统一管理和控制
数据独立性高
物理独立性指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。
当数据的物理存储改变了,应用程序不用改变。
逻辑独立性指用户的应用程序与数据库的逻辑结构是相互独立的。
数据的逻辑结构改变了,用户程序也可以不变。
数据独立性是由DBMS的二级映像功能来保证的
DBMS提供的数据控制功能
▪
(1)数据的安全性(Security)保护
保护数据,以防止不合法的使用造成的数据的泄密和破坏。
▪
(2)数据的完整性(Integrity)检查
将数据控制在有效的范围内,或保证数据之间满足一定的关系。
▪(3)并发(Concurrency)控制
对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。
▪(4)数据库恢复(Recovery)
将数据库从错误状态恢复到某一已知的正确状态。
应用程序与数据的对应关系(数据库系统)
数据模型在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。
通俗地讲数据模型就是现实世界的模拟。
数据模型应满足三方面要求能比较真实地模拟现实世界容易为人所理解便于在计算机上实现
数据模型分为两类(分属两个不同的层次)
(1)概念模型也称信息模型,它是按用户的观点来对数据和信息建模,用于数据库设计。
(2)逻辑模型和物理模型
逻辑模型主要包括网状模型、层次模型、关系模型、面向对象模型等,按计算机系统的观点对数据建模,用于DBMS实现。
物理模型是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法。
什么是数据结构?
描述数据库的组成对象,以及对象之间的联系
数据操作对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则
数据操作的类型查询更新(包括插入、删除、修改)
E-R图
关系数据库系统采用关系模型作为数据的组织方式
关系(Relation)一个关系对应通常说的一张表
元组(Tuple)表中的一行即为一个元组
属性(Attribute)表中的一列即为一个属性,给每一个属性起一个名称即属性名
关系的完整性约束条件
▪实体完整性
▪参照完整性
▪用户定义的完整性
模式(Schema)数据库逻辑结构和特征的描述是型的描述反映的是数据的结构及其联系模式是相对稳定的
数据库系统模式的概念数据库系统的三级模式结构数据库的二级映像功能与数据独立性数据库系统的三级模式结构模式(Schema)外模式(ExternalSchema)内模式(InternalSchema)
模式(也称逻辑模式)数据库中全体数据的逻辑结构和特征的描述所有用户的公共数据视图,综合了所有用户的需求一个数据库只有一个模式模式的地位:
是数据库系统模式结构的中间层与数据的物理存储细节和硬件环境无关与具体的应用程序、开发工具及高级程序设计语言无关
外模式(也称子模式或用户模式)
▪数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述
▪数据库用户的数据视图,是与某一应用有关的数据的逻辑表示
Ø一个数据库可以有多个外模式。
但一个应用程序只能使用一个外模式
外模式(续)
内模式(也称存储模式)是数据物理结构和存储方式的描述是数据在数据库内部的表示方式一个数据库只有一个内模式
二级映象在DBMS内部实现这三个抽象层次的联系和转换
▪外模式/模式映像
▪模式/内模式映像
一、外模式/模式映象
v模式:
描述的是数据的全局逻辑结构
v外模式:
描述的是数据的局部逻辑结构
v同一个模式可以有任意多个外模式
v每一个外模式,数据库系统都有一个外模式/模式映象,定义外模式与模式之间的对应关系
二、模式/内模式映象
v模式/内模式映象定义了数据全局逻辑结构与存储结构之间的对应关系。
▪例如,说明逻辑记录和字段在内部是如何表示的
v数据库中模式/内模式映象是唯一的
v该映象定义通常包含在模式描述中
数据库的内模式
▪依赖于它的全局逻辑结构
▪独立于数据库的用户视图,即外模式
▪独立于具体的存储设备
▪将全局逻辑结构中所定义的数据结构及其联系按照一定的物理存储策略进行组织,以达到较好的时间与空间效率
数据库的外模式
▪面向具体的应用程序
▪定义在逻辑模式之上
▪独立于存储模式和存储设备
▪当应用需求发生较大变化,相应外模式不能满足其视图要求时,该外模式就得做相应改动
设计外模式时应充分考虑到应用的扩充性
题库部分
一、填空题
1.数据库系统一般由(数据库)、应用系统、(数据库管理系统)、(数据库管理员)和用户构成。
2.数据模型通常由(数据结构)、(数据操作)、(数据的约束条件)三部分组成。
3.实体之间的联系可抽象为三类,它们是(一对一)、(一对多)、(多对多)。
4.在数据库设计中,(数据字典)是系统中各类数据描述的集合,是进行详细的数据收集和数据分析所获得的主要成果。
5.(事务)是用户定义的一个数据库操作序列,这些操作要么全做要么全不做,是一个不可分割的工作单位。
6.数据库系统在运行过程中,可能会发生故障。
故障主要有(事务故障)、系统故障、(介质故障)和计算机病毒四类。
7.并发控制的主要方法是采用(封锁)机制,其类型有(共享锁)和(排它锁)两种。
8.数据库的完整性是指数据的(正确性)和(相容性)。
9.在SQL语言中,为了数据库的安全性,设置了对数据的存取进行控制的语句,对用户授权使用(GRANT)语句,收回所授的权限使用(REVOKE)语句。
10.(数据库)是长期存储在计算机内的、有组织、可共享的数据集合。
11.数据库系统的三级模式结构是指数据库系统是由(模式)、(外模式)、(内模式)三级构成的。
12.在一个关系R中,若每个数据项都是不可再分割的,那么R一定属于(第一(1NF))范式。
E-R图一般在数据库设计的(概念结构设计)阶段使用。
13.(事务)是用户定义的一个数据库操作序列,是一个不可分割的工作单位,它具有(原子性)、(一致性)、(隔离性)、(持续性)四个特性。
14.数据库系统中,系统故障通常称为(软故障),介质故障称为(硬故障)。
15.关系操作的特点是(集合)操作。
16.若事务T对数据对象A加了S锁,则其他事务只能对数据A再加(S)锁,不能加(X)锁,直到事务T释放A上的锁。
17.信息处理的方式而言,在文件系统阶段,(程序设计)处于主导地位,(数据)只起着服从程序设计需要的作用;而在数据库方式下,(数据)占据了中心位置。
18.现实世界进行第一层抽象的模型,称为(概念)模型;对现实世界进行第二层抽象的模型,称为(数据)模型。
19.数据库的三级模式结构是对(数据)的三个抽象级别。
21.层次、网状的DML属于(过程性)语言,而关系型DML属于(非过程性)语言。
22.关系模式的操作异常问题往往是由(数据冗余)引起的。
23.消除了非主属性对侯选键局部依赖的关系模式,称为(2NF)模式。
24.消除了非主属性对侯选键传递依赖的关系模式,称为(3NF)模式。
26.恢复的基本原则是(冗余)。
要使数据库具有可恢复性,在平时要做好两件事:
(转储(备份))和(记“日志”)。
27.如果对数据库的并发操作不加以控制,则会带来四类问题:
(丢失更新)、(读“脏数据”)和(不可重复读)。
28.事务的执行次序称为(调度)。
29.判断一个并发调度是否正确,可以用(可串行化)概念来解决。
30.封锁能避免错误的发生,但会引起(活锁和死锁)问题。
31.S封锁增加了并发度,但缺点是(容易发生死锁)。
32.两段式封锁是可串行化的(充分)条件。
33.数据库的完整性是指数据的(正确性)和(相容性)。
34.SQL中的安全性机制,主要有两个:
(视图)和(授权)。
35.SQL的授权语句中的关键字PUBLIC表示(全体用户)。
36.在数据管理技术的发展过程中,经历了人工管理阶段,文件系统阶段和数据库系统阶段,在这几个阶段中,数据的独立性是(数据库系统)阶段实现的。
37.数据库是在计算机系统中按照数据模型组织、储存和应用的(数据的集合),支持数据库各种操作的软件系统叫(数据库管理系统),由计算机、操作系统、DBMS、数据库应用程序及用户等组成的一个整体叫做(数据库系统)。
38.数据库的基本特点是(数据可以共享(或数据结构化)、数据独立性、数据冗余度小,易扩充、统一管理和控制)。
39.(数据库)是存储在计算机内组织的结构化的相关数据的集合。
40.在数据库中存储的是(数据以及数据之间的联系)。
41.数据库的特点之一是数据的共享。
严格的讲,这里的数据共享是指(多种应用,多种语言,多个用户相互覆盖所用的数据集合)。
42.数据库系统的核心是(数据库管理系统)。
43.数据库技术中采取分级方法将数据库的结构划分成多个层次,是为了提高数据库的(逻辑独立性)和(物理独立性)。
44.数据库系统的特点是(数据共享),数据独立,减少数据剩余,避免数据不一致和加强了数据保护。
45.数据库管理系统能实现对数据库中数据的查询,插入,修改和删除等操作,这种功能称为(数据操纵功能)
46.在数据库的三级模式结构中,描述数据库中的全体数据的全局逻辑结构和特征的是(模式)
48.数据管理技术经历了(人工管理),(文件管理)和(数据库系统)三个阶段
49.数据库是长期存储在计算机内,有(组织)的,可(共享)的数据集合
50.DBMS是指(数据库管理系统)它是位于(用户)和(操作系统)之间的一层管理软件
51.数据库管理系统的主要功能有(数据定义功能),(数据操作功能),数据库的运行管理和数据库的建立以及维护等4个方面。
52.数据独立性又可为(逻辑数据独立性)和(物理数据独立性)。
53.当数据的存储结构改变了,应用程序不变,而由DBMS处理这种改变。
这是指数据的(物理独立性)
54.根据数据模型的应用目的不同,数据模型可分为(概念模型)和(数据模型)
55.数据模型是由(数据结构),(数据操作)和(完整性约束)三部分组成的
56.按照数据结构的类型来命名,数据模型分为(层次模型),(网状模型)和(关系模型)。
57.现实世界的事物反映到人的头脑中经过思维加工是数据,这一过程要经历三个领域,依次是(现实世界),(信息世界)和(计算机世界)。
58.实体之间的联系可抽象为三类它们是(1:
1),(1:
m)和(m:
n)
59.按所使用的数据模型来分,数据库可分为(层次)、(关系)和(网状)三种类型。
60.关系数据库规范化是为解决关系数据库中(插入、删除和数据冗余)问题而引入的。
61.关系规范中的删除操作异常是指(不该删除的数据被删除),插入操作异常是指(应该插入的数据未被插入)。
62.设计性能较优的关系模式称为规范化,规范化主要的理论依据是(关系规范化理论)。
63.规范化理论是关系数据库进行逻辑设计的理论依据。
根据这个理论,关系数据库中的关系必须满足:
其每一属性都是(不可分解的)。
64.数据模型的三要素是(数据结构),(数据操作)和(数据约束条件)。
65.对于数据库系统,负责定义数据库内容,决定存储结构和存储策略及安全授权等工作的是(数据库管理员)。
66.关系模型是把实体之间的联系用(二维表格)表示。
67.在关系数据库中,当关系的类型改变时,用户程序也可以不变,这是(数据的逻辑独立性)。
68.当数据库的存储结构改变时,可相应修改(模式/内模式映像),从而保持模式不变。
69.在数据库系统的三级模式体系结构中,描述数据在数据库中的物理结构或存储方式的是(内模式)。
70.在数据库系统的三级组织结构中,DBA视图是(概念模式),系统程序员视图是(内模式),用户视图是(外模式)。
71.表示实体及其联系的方法为(E-R图),基本图素包括(实体)、(属性)和(联系)。
习惯上实体用(矩形)表示,实体属性用(椭圆形)表示,联系用(菱形)表示。
72.层次模型是用(树型)结构表示记录类型及其联系,其中上一层记录型和下一层记录型的联系是(1:
M),层次模型不能直接支持(M:
N)联系。
73.在数据库的三级模式体系结构中,模式与内模式之间的映象(模式/内模式),实现了数据库的(物理)独立性。
71.在关系模型中,若属性A是关系R的主码,则在R的任何元组中,属性A的取值都不允许为空,这种约束称为(实体完整性)规则。
72.描述概念模型常用的方法是(实体--联系方法)。
73.消除了部分函数依赖的1NF的关系模式,必定是(2NF)。
74.关系模式中R的属性全部是主属性,则R的最高范式必定是(3NF)。
75.在关系A(S,SN,D)和B(D,CN,NM)中,A的主键是S,B的主键是D,则D在S中称为(外码)。
76.对于非规范化的模式,经过(将每一个分量化分为不可分的数据项)转变为1NF,将1NF经过(消除每一个非主属性对码的部分函数依赖,)转变为2NF,将2NF经过(消除非主属性对码的传递函数依赖)转变为3NF。
77.关系模型中的关系模式至少是(1NF)。
78.关系模式中,满足2NF的模式必定是(1NF)。
79.在关系模式R中,若其函数依赖集中所有候选键都是决定因素,则R最高范式是(4NF)。
80.候选关键字中的属性称为(主属性)。
81.在数据库设计中,将E-R图转换成关系数据模型的过程属于(逻辑设计阶段)。
82.在数据库设计的4个阶段中,每个阶段都有自己的设计内容。
“在哪些表、在哪些属性上、建什么样的索引”,这一内容应该属于(物理)设计阶段。
83.在数据库设计的需求分析阶段,数据字典通常由(数据项)、(数据结构)、(数据流)、(数据存储)和(处理过程)5部分组成。
84.在关系数据库设计中,使每个关系达到3NF,这是(逻