华南师范大学数据库系统复习.docx
《华南师范大学数据库系统复习.docx》由会员分享,可在线阅读,更多相关《华南师范大学数据库系统复习.docx(26页珍藏版)》请在冰豆网上搜索。
华南师范大学数据库系统复习
华南师范大学数据库系统复习
作者:
日期:
考试范围:
第一到第七章。
包括教材、课件、实验
“熟记”部分,一定要熟记
“查询习题讲解”课件中的题型及方法掌握蓝色部分的应用题型和解题方法
1、
2、
3、
4、
第
1.
(基本内容,只要做过实验就没问题)
(跟第二次实验讲评一起的方法
(对应章节的课件中有)
PPT)
•章数据库系统概述
四个概念:
什么是数据?
什么是数据库?
什么是数据库管理系统(D
数据库系统(DBS)?
答:
数据:
以描述事物属性的符号;数据库:
一个相互联系的数据的集合统DBMS:
存取和管理这些数据的一套程序;数据库系统DBS:
由数据库、
统、计算机系统组成。
BMS)?
什么是
;数据库管理系数据库管理系
熟记数据库系统的组成。
数据库、硬件、软件(DBMSOS,数据库应用程序,应用程序开发工具),人员(数据库管理员,应用程序员,最终用户)
DBS=数据库+数据库管理系统+计算机系统
理解数据库管理员DBA是对数据库进行集中控制和管理的最重要人员。
4.实例和模式的对比(内容/状态vs结构,变化vs稳定)模式:
数据库中表的结构(属性),相对稳定。
实例:
数据库中表的具体内容(元组),时时变化。
5.三级模式:
物理模式(又称内模式),逻辑模式(又称模式),和子模式(又称外模式)的含
义是什么?
一个数据库有几个物理模式,逻辑模式和子模式?
三级模式间的两极映射,
以及是由谁(DMBS)完成这种映射功能的?
两级映射的作用(好处)是带来以下两种数据独立性。
物理模式:
整体数据库的物理结构,描述全体数据在硬盘等介质上如何存储。
一个数据库
只有一个内模式。
逻辑模式:
整体数据库的逻辑结构,描述所有数据的结构和数据间联系,屏蔽了向下的
物理模式,即与数据的物理存储细节和硬件环境无关。
一个数据库只有一个模式。
子模式:
一部分数据库的逻辑结构(特定用户能看到的部分),一部分数据库的逻辑结
构(特定用户能看到的部分)。
外模式=用户视图=(逻辑)模式的子集
两级映射:
内模式/模式映像,外模式/模式映像
6.两种数据独立性:
什么是逻辑数据独立性?
什么是物理数据独立性?
用户或者应用程序
面向的到底是哪一级数据库模式?
物理数据独立性:
当数据库的物理存储结构改变时(如存储位置改变),应用程序不必
变化。
内模式/模式映射保证了物理数据独立性。
逻辑数据独立性:
当数据库的整体逻辑结构改变时(如字段的增减,字段名修改),应用
程序不一定要改变。
外模式/模式映射保证了逻辑数据独立性。
用户/应用程序面向的是:
外模式
7.熟记数据模型的定义,组成部分(三要素):
数据结构,数据操作,数据完整性约束数据模型是用于描述数据、数据联系、数据语义和数据约束的一套工具与方法。
8.概念数据模型用于数据库设计,是对客观世界的第一层抽象。
常见例子是E-R模型。
9.例举各种用于数据库的数据模型:
层次、网状、关系、对象、半结构化等。
第二章关系模型与关系运算
1.数据模型的三要素?
关系模型的三要素?
数据模型三要素:
数据结构、数据操作、数据完整性约束
关系模型三要素:
关系、关系操作、关系完整性约束
2.关系的组成:
什么是属性?
什么是元组?
什么是分量?
属性:
关系的一列元组:
关系的一行分量:
行和列的交叉(某个元组的某个属性值)
3.理解关系有哪些基本性质?
列的同质性:
同一列中的分量(值)必须具有相同的类型,因为它们来自同一个域。
异列同域性:
不同列可以来自同一个域,但属性名不能相同
元组相异性:
关系里的任意两行不能相同,因为关系是一个元组集合行列无序性:
关系的行或列是顺序无关的。
属性值原子性:
每一个属性值(分量)都必须是原子的(不可分),不允许出现组合数据,更不允许"表中有表”。
4.关系有哪四种键?
数量(是否有多个)?
什么是外部键?
外部键的属性名可以和所对应
的主键不同。
外部键可以指向同一个关系的主键。
例如:
学生(学号,姓名,班长学号•..)。
外部键从E—R图的什么概念转化而来?
超键:
关系中能够唯一标识每个元组的属性或者属性组,数量可能有多个。
候选键:
把超键中多余的属性去掉后,剩余的就是候选键,数量可能有多个。
主键:
从候选键选出一个作为主键,数量只能一个。
外部键:
关系R1中的单个属性或属性集合,对应关系R2的主键,可能有多个。
5.关系模式和关系实例的对比。
关系模式比较稳定。
而关系实例随时间而变化,原因是元组不断被插入/删除/更新
6.查询语言分类:
过程化和非过程化语言的区分和理解一一看课件。
过程化:
用户要指定①what:
查询什么②how:
怎么查询,用什么方法、过程?
非过程化:
用户只要指定查询什么,而“怎么查询”的问题留给系统处理一一系统会自
动寻找(近似)最优的查询方法/查询执行计划,即查询优化。
关系代数是过程化的,SQL和关系演算是非过程化的
7.关系操作分为查询和更新操作。
表示关系操作的语言:
关系代数,关系演算(又分为元
组关系演算和域关系演算)。
关系代数是过程化的,关系演算是非过程化的。
8.掌握关系代数的各种运算(包括符号)。
其中最基本的运算(不可替代)是哪些?
基本运算:
选择,投影,笛卡儿积X,集合并,集合差-,更名
附加运算:
集合交,自然连接(同名属性相等,去掉重复同名属性),除十“…所有…”的查询,一般用除运算表示),赋值
扩展运算:
广义投影(下标可有计算表达式),外连接,聚集运算
聚集函数:
avg,sum,count,max,min(-distinct)
聚集运算:
G1,G2,...,GnGF1(A1),F2(A2),…,Fm(Am)(E)
一元运算:
输入为一个关系
二元关系:
输入为两个关系
9.查询优化的三种技术:
物理优化,规则优化,代价估算优化。
规则优化的三种启发式规则:
选择优先,投影优先,笛卡尔积合并。
物理优化:
利用某些存储数据结构,如索引、聚簇、排序文件等进行优化
规则优化:
只考虑查询语句本身,根据某些启发式规则进行优化,例如“先选择、先投影
和后连接”
代价估算优化:
对多个候选查询计划,逐个进行代价估算(需要访问一些数据字典信息
如表的大小),从而选取代价最小的
10.应用题型:
用关系代数表达查询问题(查询习题课件)
第三章关系数据库语言SQL
1.SCL的全名(中英文)°SQL是非过程化的语言。
理解SQL的特点(基本功能特征)。
SQL的全名:
结构化查询语言StructuredQueryLanguage
特点:
综合统一性(功能的统一、操作过程的统一)、高度非过程化、面向集合的操作方式
2.熟记SQL的四种功能。
这些功能分别由哪些语句(动词)实现?
DDL(数据定义):
create,alter,drop
DML(数据操纵):
select(数据查询)insert、update、delete(数据修改)
DCL(数据控制):
grant,revoke
3.SQL对数据库三级模式的规定:
每级模式由什么组成?
物理模式:
描述所有数据是如何在硬盘等介质上存储的,存储文件。
(逻辑)模式:
描述所有数据的结构及所有数据间的联系,基表。
子模式:
描述某个特定用户能看到的那一部分数据的结构及它们之间的联系,视图。
4.理解SQL中的系统数据类型,char/varchar/numeric等。
char(n):
长度固定为n的字符串
varchar(n):
可变长度的字符串,最大长度为n
numeric(p,q):
总共不多于p位,小数点右边不多于q位的定点数
5.掌握SQL的各个数据定义语句(特别是新建表,建视图,修改表,删除表的语句)。
1)createtableStudent
(Snochar(8)notnull,
SNamevarchar(8)notnull,
Sexchar
(1)default‘M,
Primarykey(Sno,SName),
〃Foreignkey(Sno)referencesS(Sno)
Check(Sex='MorSex='F')
)
2)altertableStudentaddAgeintnotnulI
3)altertableStudentmodifyAgesmallint
4)droptableStudent
5)createindexindex_on_ageStudent(Age)
6)createviewBook_Not_Borrow(Book_Num,Book_Writer)as(selectBook.Name,Writer.Name
fromeBook,Writer,Borrow
where
)
6.掌握|SQL的Select数据查询语句。
1)计算次序:
From(笛卡儿积)tWhere(选择)宀Groupby宀HavingtSelect(投影)tOrderby
2)select姓名asname,0.05*工资astax
selectdistinct部门
select选修.姓名from选修,选修as王
3)where中可以出现:
<、<=、>、>=、=、v>、and、or、not、between下and上、in(集合)、notin(集合)、like(匹配串)
4)GroupBy属性1,属性2,…:
作用:
Where子句筛选元组后,对它们分组,分组依
据:
属性1,属性2。
用法:
出现统计词,比如“平均,最高,总和,…”的问题
Select子句的作用发生变化:
对分组进行统计,Select中出现的属性只能是:
分组属性、聚集函数
Select课程,Avg(成绩)as平均成绩,Max(成绩)as最高成绩
From选修
GroupBy课程
5)HavingQ(分组限定条件):
作用:
出现在groupby子句后面,不能单独使用,GroupBy分好组后,按条件Q作筛选,Q中出现的属性只能是:
分组属性、聚集函数(Having用于分组,Where用于元组)。
HavingAvg(成绩)>85
6)0rderBy属性1[asc|desc],属性2[asc|desc],…:
出现在最最后面,
作用:
在Select子句得出结果后,先按属性1的值,升序(asc)或降序(desc)排列,缺省是升序;属性1的值相等时,再按属性2值升序或降序排列…
OrderBy成绩desc,姓名
7)From子句中用子查询构造派生关系:
复杂的查询分解成若干步->把上一步的查询结果变成一个派生关系->在下一步查询中使用,例如求平均一间宿舍的人数?
(先求各间宿舍的人数,再求平均)
8)Where子句中用子查询构造条件:
a.whereA[not]in(子查询),意义:
A是否出现在子查询的结果中?
(是为真,
否则为假),可以多个元组,但只能有一个属性
Wlere课程in(Select课程From课程计划Where专业='网络')
b.whereA(比较运算,>,v,=,…)some|al1(子查询),意义:
so
me:
A与子查询结果中的一个值满足,比较时为真;all:
A与子查询结果中的所有值都
满足,比较时为真
Where年龄<=a1l(Select年龄From学生),可以多个元组,但只能有一个属性
c.whereA[not]exists(子查询),意义:
子查询结果存在(至少一条)记录,可包含多个属性。
exists和in的差别:
exists可包含多个属性,in只能有一个属性,故in的Select语句只有一个属性。
Whereexists(Select*From选修Where姓名=学生.姓名and课程='物理’)
9)from子句中可以是连接运算A(inner)joinBon条件、Aleft/right
/ful1[outer]joinBon条件
From报名表rightouterjoin招工表on报名表.年龄<=招工表.年龄限制
From员工rightouterjoin部门on员工.部门=部门.部门
7.掌握SQL的各个数据修改语句:
Insert,Update,Delete。
InsertInto职员表(职工号,姓名,年龄)Values('E05','张明',30);#没有包含的属性则采用默认值或者nul1。
de1etefrom学生表Where姓名='刘芳’;#没有Where子句,则删除全部元组
(但表的结构如字段、主键等保留)。
Update员工Set经理=(select经理From部门Where部门=员工.部门);Update学生Set宿舍=‘203'Where姓名='黄大鹏’;#在关系中找到满足Where条件的(没有就是全部)记录,然后更新一一Set子句说明更新哪些字段,以及更新后的值(表达式的结果)
8.空值的意义;空值的运算规则(包括聚集函数忽略空值等)。
给出一个包含空值的式子,
能计算最终结果。
表示两种情况:
值未知,或值不存在
计算规则:
空值出现在算术运算中,其结果一定还是null;如:
2014-null=nul1
空值出现在比较运算中,结果一定是unknown(trueorfalse);女口:
not((Nu1l=
Null)and(Nul1v>Nu1l))=unknown=false(最后一步计算得到的结果是unkno
wn,那么就替换为false)
空值出现在布尔运算中,null替换为unknown后再计算;女口:
(unknownortrue)=true、(trueandunknown)=unknown、(notunknown)=unknown聚集函数忽略空值,但count(*)例外。
9.理解视图的本质:
命名的查询语句,只有这个才是真正存储在数据库里;表象:
虚拟表,
与真正的表基本表相比有相同也有不同;动态变化)。
理解视图的优点。
一个①命名、用②查询从基本表中导出的③虚拟表,物理上不存在,视图中的数据(记
录)平时并没有存储在数据库里,而是用到时候才执行查询算出来(动态变化)。
用户对视图的操作*(查询或更新),系统在执行时必须转化为对相关基本表的操作。
优点:
简化用户的操作、个性化服务、安全性、逻辑独立性
10.掌握定义视图的语句。
理解对视图的查询以及对视图的更新在后台是怎样进行的(视图
的查询:
展开视图一一替换视图为它所对应的查询。
视图的更新:
转化为对基本表的更新,这种转化可能因为缺少主键等原因失败,从而无法更新)。
CreateView物理成绩单as(Select姓名,课程,成绩From选修Where课
程='物理'withcheckoption课程='物理')
withcheckoption:
当对视图进行插入,更新时,要检查新元组是否满足视图对应的条件,否则拒绝。
如果展开一个视图后,(它定义中的)查询又还出现了其它视图,那么继续展开,直到没有任何视图为止。
11.嵌入式SQL不要求。
12.应用题型:
用SQL表达查询问题(查询习题课件)。
用SQL建表,建视图等定义语句。
第四章关系数据库模式设计
1.熟记关系模式设计不当可能产生的四种问题:
数据冗余和三种异常。
数据冗余、更新异常、插入异常、删除异常
2.理解函数依赖的概念。
三对特殊类型的函数依赖:
平凡/非平凡,部分/完全,传递/非传
递。
根据定义去理解和判定它们。
1)关系模式R上存在以下函数依赖,XY(X函数决定Y,或Y函数依赖X,X是Y的决定元素)条件是当且仅当:
两个元组如果在属性集X上相等,则它们在属性集Y上也相等。
特例:
XX/(X'X)?
2)平凡/非平凡:
函数依赖XY,当YX时是平凡的;否则是非平凡的。
平凡的函数依赖一定成立,平凡的函数依赖是没有实质意义的
3)部分/完全:
函数依赖XY是部分的,当存在X'X,使X'Y成立;函数依赖X
Y是完全的,当不存在X'X,使X'Y。
理解:
部分:
左边的一部分就可以决定(右
边);完全:
左边全部才可以决定右边;
4)传递/非传递:
函数依赖XY是传递的,当存在Z,使XZ,ZY同时成立,但
ZX不成立(Z不是X的等价因素);函数依赖XY是非传递的,当不存在乙使XZ,ZY同时成立,且ZX不成立。
理解:
传递:
左边与右边是间接的(决定)关系,存在
中间元素;非传递:
左边与右边是直接的(决定)关系,不存在中间元素。
5)对候选键的部分/传递函数依赖是”坏”的(KtA是部分函数依赖orKtA是传递函数依赖,其中K为候选键)。
3.用函数依赖判断一个属性集是否超键,或者是否候选键的方法。
该超键能否通过函数依赖推出整一个属性集?
该超键的子集能否推出整一个属性集?
//判断超键:
判断属性集是否在超键的闭包中;如果是,再判断属性集是否在超键的子
集的闭包中。
4.例举Armstrong公理系统的各条定律:
自反律…
YX,则XY(自反律);XY,则XZYZ(增广律);XY,且YZ,则XZ(传递律);XY,且X乙则XYZ(结合律);XYZ,则XY且XZ(分解律);XY,Y
Z,则XZ(伪传递律)
若ABC,贝yAB=AB(B)BC
5.掌握计算属性集闭包的算法。
以及由此判定一个函数依赖是否成立的方法。
属性集的闭包:
a所决定的全部属性的集合(包括a自身),例如F={AB,BC},(A)+=(ABC)
判断a是否成立,等价的方法判断是否在a+中。
证明候选键:
求它的闭包,看能
否包含U,且它的真子集均不是主键。
6.最小函数依赖集不要求。
4.3这一节不要求。
7.掌握1NF、2NF3NF、BCNF并能够进行判定。
1)4NFBCIF3NF2NF1NF
2)1NF:
关系模式的每个属性都是原子的。
判断:
逐个属性分析是否为原子属性(属性值
不可再分,注意复合属性:
如Parents;多值属性:
如phone-number)。
3)键属性(主属性):
出现在某个候选键中的属性;非键属性(非主属性):
不出现在任
何候选键中的属性。
4)2NF:
关系模式在1NF中,且每一个非键属性完全函数依赖于键。
判断:
检查键以外
每个属性A,且X是候选键的一部分,如有XA则违反2NF(存在部分键(<键)属性能推出非键属性:
NQ)。
简而言之,第二范式就是属性完全依赖于主键。
5)3NF:
关系在1NF中,每一个非键属性不传递函数依赖于键。
判断:
检查键以外每个
属性A,且X不包含键,如有XA,则违反3NF(存在非键属性能推出非键属性:
NO!
)。
简而言之,第三范式就是属性不依赖于其它非主属性。
6)BC范式:
关系在1NF中,每一个属性不传递函数依赖于键。
判断:
每一个非平凡函数依赖XiY,不管Y是什么,X必含键(=超键)(存在非键属性能推出其他任意属性:
NO!
)。
7)求R最高属于第几范式:
假设R最高属于第x范式,则证明R属于第x范式,而不属于第(x+1)范式。
证明R属于第x范式:
x=2:
假设候选键HS证明所有非键属性C、T、R都不在H+或者S+中;
x=3:
假设候选键HS,找不到非键属性能推出非键属性如CT,因为如果存在,则
HSCT,则存在非键属性对候选键的函数依赖是传递的。
8.掌握规范化到1NF,3NF,BCNF的相关方法。
关系模式应该至少规范化到3NF规范
化到3NF和规范化到BCNF相比,后者得到的关系模式属于更高级别,但是可能会丢失函数依赖。
规范化到1NF:
复合属性:
转化成相应的多个原子属性;多值属性:
移出去生成一个新关
系,同时还包含原来的主键
规范化到3NF:
对于每一个XY,如果XY在Ri中则什么都不做,否则看X是否为Ri的主键,是则把Y加到Ri中,否则新增加关系Ri+仁(XY),其中X为主键。
规范化到BCNF:
9.多值依赖不要求。
这个原来的有误。
10.应用题型:
给出关系和函数依赖
a)判断和证明某个属性(集合)是否候选键?
b)判断某个函数依赖是否成立?
c)判断关系所属的最高范式,并给出证明。
d)将关系规范化到3NF,或者BCNF
第五章数据库设计
1.理解E-R模型的三要素:
实体、属性和联系。
以及在E-R图中的表示。
E-R模型:
实体-联系模型。
实体:
客观存在且可以与其他物体相区分的某一物体(如学生、课程、公司等);
属性:
实体具有的描述作用的特征(例如人的姓名、身高等),有复合(如Parents)、
多值(如phone-numbers)、派生属性(如税收);
联系:
实体之间的相互联系(如雇佣关系),有同一实体集内部联系、实体集之间联系。
按照基数分类:
一对一、一对多、多对一、多对多联系、多元联系。
实体:
矩形表示;属性:
椭圆表示(双线椭圆表示多值属性,虚线属性表示派生属性);
联系:
菱形表示,如联系有属性,则用椭圆连接起来。
EE-R模型:
实体的属性是另一个实体(嵌套),在E-R图中表示:
实体A通过有向线段连接另一个实体B的属性;实体A是实体B的一个子集(继承),在E-R图中表示:
带圆圈的直线连接超类和子类。
2.能判断二元联系的类型:
一对一,一对多,多对多。
以及在E-R图中的表示。
判断:
如教师:
课程,则1个教师只有一门课程,则课程为“1”;而一门课程可以有多个
教师,则教师为“多”。
表示:
两个矩形之间连接同一个菱形,直线上标注1,m,n表示映射的基数。
3.能将E-R图转化为关系模型。
注意:
多值属性的处理;1对1,1对多,多对1,多对多,
三元以上联系各自的转化方式一一不要张冠李戴。
E-R模型关系模型:
从基本元素到基本元素,实体关系,属性属性,联系关系/
属性。
联系一对一:
将“一”方主键+联系的属性一同添加到另外“一”方里面(成为外