全国计算机四级考试复习资料数据库.docx

上传人:b****7 文档编号:9675945 上传时间:2023-02-05 格式:DOCX 页数:64 大小:72.90KB
下载 相关 举报
全国计算机四级考试复习资料数据库.docx_第1页
第1页 / 共64页
全国计算机四级考试复习资料数据库.docx_第2页
第2页 / 共64页
全国计算机四级考试复习资料数据库.docx_第3页
第3页 / 共64页
全国计算机四级考试复习资料数据库.docx_第4页
第4页 / 共64页
全国计算机四级考试复习资料数据库.docx_第5页
第5页 / 共64页
点击查看更多>>
下载资源
资源描述

全国计算机四级考试复习资料数据库.docx

《全国计算机四级考试复习资料数据库.docx》由会员分享,可在线阅读,更多相关《全国计算机四级考试复习资料数据库.docx(64页珍藏版)》请在冰豆网上搜索。

全国计算机四级考试复习资料数据库.docx

全国计算机四级考试复习资料数据库

一、数据模型

1.数据模型的三要素

(1)数据结构数据结构是所研究的对象类型(ObjectType)的集合。

这些对象和对象类型是数据库的组成成分。

一般可分为两类:

一类是与数据类型、内容和其它性质有关的对象;一类是与数据之间的联系有关的对象。

前者如网状模型中的数据项和记录,关系模型中的域、属性和关系等。

后者如网状模型中的关系模型(settype)。

在数据库领域中,通常按照数据结构的类型来命名数据模型,进而对数据库管理系统进行分类。

如层次结构、网状结构和关系结构的数据模型分别称作为层次模型、网状模型和关系模型。

相应地,数据库分别称作为层次数据库、网状数据库和关系数据库。

(2)数据操作数据操作是指对各种对象类型的实例(或值)所允许执行的操作的集合,包括操作及有关的操作规则。

在数据库中,主要的操作有检索和更新(包括插入、删除、修改)两大类。

数据模型定义了这些操作的定义、语法(即使用这些操作时所用的语言)。

数据结构是对系统静态特性的描述,而数据操作是对系统动态特性的描述。

两者既有联系,又有区别。

(3)数据的约束条件数据的约束条件是完整性规则的集合。

完整性规则是指在给定的数据模型中,数据及其联系所具有的制约条件和依存条件,用以限制符合数据模型的数据库的状态以及状态的变化,确保数据的正确性、有效性和一致性。

2.概念模型

数据模型是数据库系统的核心和基础。

每个DBMS软件都是基于某种数据模型的。

为了把现实世界中的具体事物或事物之间的联系表示成DBMS所支持的数据模型,人们首先必须将现实世界的事物及其之间的联系进行抽象,转换为信息世界的概念模型;然后将信息世界的概念模型转换为机器世界的数据模型。

也就是说,首先把现实世界中的客观对象抽象成一种信息结构。

这种信息结构并不依赖于具体的计算机系统和DBMS。

然后,再把概念模型转换为某一计算机系统上某一DBMS所支持的数据模型。

因此,概念模型是从现实世界到机器世界的一个中间层次。

现实世界的事物反映到人的大脑之中,然后人们开始认识这些事物,经过选择、命名、分类和组织等抽象工作之后形成概念模型,并进入到信息世界。

•用户(user)关心的是现实世界中的事物、事物的属性及其相互关系。

例如,用户可能关心他的顾客及其属性,如顾客地址、银行帐号等等。

用户也关心自己的定货帐目,如谁订的货、订的什么和订多少等等。

•系统分析员(analyst)同样也关心现实世界,但是系统分析员需要分析用户的信息需求。

作为需求分析的结果,分析员必须以文档的形式对需求进行结构化的描述;这个文档就是信息模型。

•实体(Entity)实体是构成数据库的基本元素。

实体是指一个存在的东西以区别这个东西所具有的属性和这个东西与其它东西的联系。

实体可以是人,也可以是物;可以是实际对象,也可以是概念;可以是事物本身,也可以是指事物之间的联系。

•属性(Attribute)一个实体可以由若干个属性来刻画。

属性是相对实体而言的,是实体所具有的特性。

•关键字(Key)能唯一地标识实体的属性的集合称为关键字(或码)。

•域(Domain)属性的取值范围称作域。

•实体型(EntityType)一类实体所具有的共同特征或属性的集合称为实体型。

一般用实体名及其属性来抽象地刻画一类实体的实体型。

•实体集(EntitySet)同型实体的集合叫实体集。

例如,学生就是一个实体集。

实体集的名即是实体型。

对于学生和(学号,姓名,年龄,系,年级)均是实体型,而学生是对实体型(学号,姓名,年龄,系,年级)所起的名称,两者是指同一客观对象。

但本科生和研究生可以为相同实体型,而实体集不同。

•联系(Relationship)现实世界的事物之间是有联系的。

一般存在两类联系:

一是实体内部的组成实体的属性之间的联系,二是实体之间的联系。

在考虑实体内部的联系时,是把属性看作为实体。

一般来说,两个实体之间的联系可分为三种:

(1)一对一(1∶1)联系若对于实体集A中的每一个实体,实体集B中至多有唯一的一个实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系,记作1∶1。

(2)一对多(1∶n)联系若对于实体集A中的每个实体,实体集B中有n个实体(n≥0)与之联系;反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系,记为1∶n。

相应地有多对一(n∶1)联系多对一联系,从本质上说,是一对多联系的逆转。

其定义同一对多联系类似,不再赘述。

(3)多对多(m∶n)联系若对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系;反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m≥0)与之对应,则称实体集A与实体集B具有多对多联系,记作m∶n。

实质上,多对多联系是任意一种联系。

另外,同一实体集内的各个实体间也可以有各种联系。

概念模型的表示方法最常用的是实体一联系方法(Entity-RelationshipApproach),简称E-R方法。

该方法是由P.P.S.Chen在1976年提出的。

E-R方法用E-R图来描述某一组织的概念模型。

在这里仅介绍E-R图的要点。

在E-R图中:

(1)长方形框表示实体集,框内写上实体型的名称。

(2)用椭圆框表示实体的属性,并用有向边把实体框及其属性框连接起来。

(3)用菱形框表示实体间的联系,框内写上联系名,用无向边把菱形框及其有关的实体框连接起来,在旁边标明联系的种类。

如果联系也具有属性,则把属性框和菱形框也用无向边连接上。

3.三种主要的数据模型

实际DBMS所支持的数据模型主要有三种:

•层次模型(HierarchicalModel)

•网状模型(NetworkModel)

•关系模型(RelationalModel)其中,关系模型是当前DBMS所支持的数据模型的主流。

90年代运行的DBMS几乎都是基于关系模型的。

层次模型和网状模型统称为非关系模型。

非关系模型的结构可以和图论中的图相对应,比较直观,但在理论上不完备,实现效率较低,故此目前很少用。

但是最近,层次模型在研究面向对象的DBMS中已得到重视。

在关系模型中,数据在用户的观点中(或在用户视图中)的逻辑结构是一张二维表(Table)。

•关系(Relation),对应于平常讲的一张表。

•元组(Tuple),表中的一行。

•属性(Attribute),表中的一列称为一个属性,给每一列起一个名,称为属性名。

这一列或这个属性所有可能取的值的集合称为这个属性的值域(Domain),值域中的一个元素叫做这个属性的值。

•主关键字(PrimaryKeyAttribute或PrimaryKey),是指能唯一标识一个元组的一个或一组属性。

•分量(Attributevalue),是指元组中的一个属性值。

•关系模式(RelationalSchema),是对关系的描述,一般用关系名(属性名1,属性名2,…,属性名n)来表示。

同层次模型和网状模型相比较,关系模型具有下列特点:

(1)概念单一在关系模型中,无论是实体还是实体之间的联系都用关系来表示。

在关系模型中,在用户的观点中,数据的逻辑结构就是表,也只有这唯一的概念。

在非关系模型中,用户要区分记录型与记录型之间的联系两个概念;当环境复杂时,数据结构异常复杂,难以掌握。

而关系模型,由于概念单一,可以变复杂为直观、简单,易学易用。

(2)规范化所谓关系规范化是指在关系模型中,每一个关系都要满足一定的条件要求。

这些条件被称为规范条件。

对于关系,一个最基本的规范条件是,要求关系中的每一个属性(或分量)均是不可分的数据项;也就是说不允许表中有表,表是不可嵌套的。

(3)在关系模型中,用户对数据的操作的输入和输出都是表,也就是说,用户通过操作旧表而得到一张新表。

总之,关系模型概念简单,结构清晰,用户易学易用,有严格的以数学为基础的关系理论作指导,便于DBMS的实现。

基于关系的DBMS简化了应用程序员的工作,便于数据库应用系统的设计和维护。

故此,关系模型自诞生以后就得到了迅速的发展,成为应用最为广泛的、唯一的数据模型。

二、数据库系统的结构

1.数据库系统的三级模式结构

数据库管理系统的三级模式结构由外模式、模式和内模式组成。

外模式(externalschema),或子模式(subschema)或用户模式(userschema),是指数据库用户所看到的数据结构,是用户看到的数据视图。

模式(schema)或逻辑模式(logicschema),是数据库中对全体数据的逻辑结构和特性的描述,是所有用户所见到的数据视图的总和。

外模式是模式的一部分。

内模式(internalschema),或存储模式(storageschema),或物理模式(physicalschema),是指数据在数据库系统内的存储介质上的表示,即对数据的物理结构和存取方式的描述。

模式描述的是数据的全局的逻辑结构,决定了DBMS的功能。

外模式涉及的仅是局部的逻辑结构,是模式的子集,是对模式的调用。

数据库系统的三级模式是对数据进行三个层次抽象的工具。

通过三级模式,把对数据的具体组织留给DBMS来完成,使得用户能在高层次上处理数据的逻辑结构,而不必关心数据的物理结构。

为了实现这三个层次这间的联系,DBMS在沟通三级模式中提供了两个映象:

外模式-模式映象模式-内模式映象

(1)模式模式规定了数据库中全部数据的一个逻辑表示或描述形式。

模式既不同于内模式,也不同于外模式。

它比内模式抽象,不涉及数据的物理结构和存储介质。

它与具体的应用程序或高级语言无关。

(2)外模式外模式是个别用户的数据视图,即与某一应用有关的数据的逻辑表示。

(3)内模式内模式是全部数据库的内部表示或底层描述,是用来定义数据的物理结构和存取方式的。

(4)二级映象对于同一个模式,可以有任意多个外模式。

外模式-模式的映象定义了某个外模式和模式之间的对应关系。

这些映象的定义通常包含在各自的外模式中。

当模式改变时,外模式-模式的映象要做相应的改变,以保证外模式的不变性。

这是数据库管理员(DBA)的责任。

模式-内模式的映象定义了数据逻辑结构和存储结构之间的对应关系。

例如,字段的内部表示等。

当数据库的存储结构改变时,模式-内模式的映象也须做相应的修改,以使得模式保持不变性。

这仍是DBA的责任。

正是由于上述二级映象的功能及其自动实现,使得数据库系统中的数据具有较高的逻辑独立性和物理独立性,从而大大地方便了用户的使用。

(5)概念模式与模式ANSI研究组于1975年2月提出一个临时报告。

1978年提出一个最终报告,称之为ANˉSI/SPARC报告,简称为SPARC报告。

SPARC报告中指出,数据库管理系统应具有三级模式的结构,即概念模式、外模式和内模式。

其中外模式和内模多与上面所讲的大致相当。

但SPARC报告中的概念模式是指一个组织或部门所对应的现实世界的真实模型,即概念模型。

概念模式仅描述实体及其属性和联系,不涉及机器世界的概念。

概念模型是信息世界范畴内的信息的结构,而模式是机器世界范畴内的概念模型的逻辑表示。

概念模型独立于具体的计算机系统,甚至是和计算机无关的,是一个组织或部门的模型。

常用的描述概念模式的方法是E-R方法。

模式是依赖于具体的计算机及其DBMS的。

模式通过三种具体模型:

层次模型、网状模型和关系模型来加以实现。

概念模式必须转换成具体的数据模型,然后才能在相应的DBMS上实现。

概念模型和模式都是描述信息或数据的整体结构的,然而它们是在不同的抽象层次上加以描述的。

概念模型离机器更远,形式化程度低。

从远离机器的观点看,概念模型更抽象些,但更接近现实世界。

而模式描述使用的是形式化的语言-模式DDL,而概念模型描述使用的是E-R图和一些自然语言。

2.使用数据库的计算机系统结构

广义地讲,实际上使用数据库的计算机系统由下列几个部分组成的:

(1)硬件部分包括主机、外部存储设备、网络设备和电源等。

(2)软件部分包括操作系统、DBMS、编译系统和应用开发工具软件等。

(3)人员包括数据库管理员(DataBaseAdministrator-DBA),系统分析员(SystemAnaˉlyst)、应用程序员(ApplicationProgrammer)和用户(User)。

3.数据库管理系统

数据库管理系统DBMS是数据库系统的核心。

DBMS是负责数据库的建立、使用和维护的软件。

DBMS建立在操作系统之上,实施对数据库的统一管理和控制。

用户使用的各种数据库命令以及应用程序的执行,最终都必须通过DBMS。

另外,DBMS还承担着数据库的安全保护工作,按照DBA所规定的要求,保证数据库的完整性和安全性。

DBMS的主要功能包括以下几个主要方面:

(1)数据库的定义功能DBMS通过提供数据描述语言(也称数据定义语言)(DataDescripˉtiveLanguage———DDL)来对外模式、模式和内模式加以描述。

然后模式翻译程序把用DDL写的各种模式的定义源码翻译成相应的内部表示,形成相应的目标形式,分别叫目标外模式、目标模式、目标内模式,这些目标模式是对数据库的描述,而不是数据本身。

(目标)模式只刻画了数据库的形式或框架,而不包括数据库的内容。

这些目标模式被保存在数据字典(或系统目标)之中,作为DBMS存取和管理数据的基本依据。

例如,DBMS根据这些模式定义,进行物理结构和逻辑结构的映象,进行逻辑结构和用户视图的映象,以导出用户要检索的数据的存取方式。

(2)数据操纵功能DBMS提供数据操纵语言(DataManipulationLanguage———DML)实现对数据库中数据的一些基本操作,如:

检索、插入、修改、删除和排序等等。

DML有两类:

一类是嵌入主语言的,如嵌入到C或COBOL等高级语言中。

这类DML语言本身不能单独使用,故此称为宿主型的DML或嵌入式DML。

另一类是非嵌入式语言(包括交互式命令语言和结构化语言),它的语法简单,可以独立使用,由单独的解释或编译系统来执行,所以一般称为自主型或自含型的DML。

命令语言是行结构语言,单条执行。

结构化语言是命令语言的扩充或发展,增加了程序结构描述或过程控制功能,如循环、分支等功能。

命令语言一般逐条解释执行。

结构化语言可以解释执行,也可以编译执行。

现在DBMS一般均提供命令语言的交互式环境和结构环境两种运行方式,供用户选择。

DBMS控制和执行DML语句(或DML程序),完成对数据库的操作。

对于自主型的结构化的DML,DBMS通常采用解释执行的方法,但也有编译执行的方法,而且编译执行的越来越多。

另外,很多系统同时设有解释和编译两种功能,由用户选其一。

对于嵌入型或缩主型DML,DBMS一种提供两种方法:

①预编译方法。

②修改和扩充主语言编译程序(亦称增强编译方法)。

预编译方法是,由DBMS提供一个预处理程序,对源程序进行语法扫描,识别出DML语句,并把这些语句转换成主语言中的特殊调用语句。

主语言必须和DML有调用接口。

这样在连接形成目标时和主语言语句一起形成可执行的目标。

(3)数据库运行管理数据库运行期间的动态管理是DBMS的核心部分,包括并发控制、存取控制(或安全性检查、完整性约束条件的检查)、数据库内部的维护(如索引、数据字典的自动维护等)、缓冲区大小的设置等等。

所有的数据库操作都是在这个控制部分的统一管理下,协同工作,以确保事务处理的正常运行,保证数据库的正确性、安全性和有效性。

(4)数据库的建立和维护功能数据库的建立和维护包括初始数据的装入、数据库的转储或后备功能、数据库恢复功能、数据库的重组织功能和性能分析等功能,这些功能一般都由各自对应的实用功能子程序来完成。

DBMS随软件产品和版本不同而有所差异。

通常大型机上的DBMS功能最全,小型机上的DBMS功能稍弱点,微机上的DBMS更弱些。

但是,目前,由于硬件性能和价格的改进,微机上的DBMS功能越来越全。

三、关系数据库的标准语言———SQL

1.SQL概述SQL的英语名称是结构查询语言(StructuredQueryLanguage)

实际上它的功能包括查询(Query)、操纵(Manipulation)、定义(Definition)和控制(Control)

四个方面,是一个综合的、通用的、功能极强的关系数据库语言。

SQL支持数据库的三级模式结构。

2.SQL的数据定义功能SQL的数据定义功能包括三部分:

定义基本表,定义视图和定义索引。

它们是:

CREATETABLECREATEVIEWCREATEINDEXDROPTABLEDROPVIEWDROPINDEXSQL的数据定义功能可用于定义和修改模式(如基本表),定义外模式(如视图)和内模式(如索引)。

3.基本表的定义与删除

定义基本表的语句格式为:

CREATETABLE表名(列名1类型[NOTNULL]

[,列名2类型[NOTNULL]]…)

[其他参数];

其中,任选项“其它参数”是与物理存储有关的参数。

根据具体系统的不同而不同。

删除基本表的语句为:

DROPTABLE表名;删除索引的语句为:

DROPINDEX索引名;删除索引的同时把有关索引的描述也从数据字典中删去。

但表的内涵仍存在且其数据外延内容不变。

把一个基本表的定义连同表上所有的记录、索引以及由此基本表导出的所有视图全部都删除,并释放相应的存储空间。

4.索引的建立与删除

对一个基本表,可以根据应用环境的需要建立若干索引,以提供多种存取方式。

通常,索引的建立和删除由DBA或表的主人(即建立表的人)负责。

用户不必也不能在存取数据时选择索引。

存取路径的选择由系统自动进行。

索引的描述存放在数据字典中。

建立索引的语句格式为:

CREATE[UNIQUE]INDEX索引名ON基本表名(列名[次序][,列名[次序]]…)[其他参数];这里的任选项———其他参数是与物理存储有关的参数。

索引可以建在一列或几列上。

圆括号内是索引列的顺序说明表。

其中的任选项———次序,指定了索引值排序的次序。

可取ASC(升序)或DESC(降序)。

缺省值为升序。

UNIQUE表示每一索引值只对应唯一的数据记录。

5.SQL的数据操纵功能

SQL的数据操纵功能包括SELECT,INSERT,DELETE和UPDATE四个语句,即检索和更新(包括增、删、改)两部分工能。

检索就是查询。

SQL更新语句SQL的更新语句

包括修改,删除和插入三类语句。

①修改(UPDATE)(亦称为更新)

修改语句的一般格式为:

UPDATE表名

SET字段=表达式[,字段=表达式]…

[WHERE谓词];

修改指定表中满足谓词(或条件)的元组,把这些元组按SET子句中的表达式修改相应属性或字段上的值。

②删除(DELETE)

删除语句一般格式为:

DELETEFROM表名

[WHERE谓词];

从指定表中删除满足谓词的那些记录。

没有WHERE子句时表示删去此表中的全部记录,但此表的定义仍在数据字典中,只是一个空表。

DELETE只对表外延操作,不对内涵操作。

③插入(INSERT)插入语句的一般格式为:

INSERTINTO表名[(字段名[,字段名]…)]

valueS(常量[,常量]…);

INSERT

INTO表名[(字段名[,字段名]…)]

子查询;

第一种格式把一个新记录插入指定的表中。

第二种格式把子查询的结果插入表中。

若表中有些字段在插入语句中没有出现,则这些字段上的值取空值NULL。

当然在表定义中说明了NOTNULL的字段在插入时不能取NULL。

若插入语句中没有指出字段名,则新记录必须在每个字段上均有值。

6.视图

视图是从一个或几个基本表(或视图)导出的表。

某一用户可以定义若干视图。

因此对某一用户而言,按ANSI/SPARC报告的观点,他的外模式是由若干基本表和若干视图组成的。

视图和基本表不同,视图是一个虚表,即视图所对应的数据不实际存储在数据库中,数据库中只存储视图的定义(存在数据字典中)。

视图一经定义就可以和基本表一样被查询、被删除(DROP),也可以用来定义新的视图,但更新(增、删、改)操作将有一定限制。

视图可以理解成一个数据库,只有内涵保存在数据库字典中,而无外延存储;其外延是在使用时动态地生成的或计算出来的。

(1)视图的定义与删除

SQL建立视图的语句格式为:

CREATEVIEW视图名[(字段名[,字段名]…)]

AS子查询

[WITHCHECKOPTION谓词];

视图可以删除,语句格式为:

DROPVIEW视图名;

视图的定义就从数据字典中删除。

由此视图导出的其它视图也将自动被删除。

若导出此视图的基本表删除了,则此视图也将自动删除。

(2)视图的查询语句

视图定义后,用户可以如同基本表那样对视图查询。

(3)视图的更新语句对视图的更新最终要转换成对基本表的更新(这里的更新,指INSERT,UPDATE和DELETE三类操作)。

在关系数据库中,并非所有的视图都是可更新的,也就是说,有些视图的更新不能唯一地有意义地转换成对基本表的更新。

(4)视图的优点视图的概念具有很多优点,主要有:

(1)视图对于数据库的重构造提供了一定程度的逻辑独立性;

(2)简化了用户观点;

(3)视图机制使不同的用户能以不同的方式看待同一数据;

(4)视图机制对机密数据提供了自动的安全保护功能。

7.SQL的数据控制功能

SQL数据控制功能是指控制用户对数据的存取权力。

某个用户对某类数据具有何种操作权力是由DBA决定的。

这是个政策问题而不是技术问题。

数据库管理系统的功能是保证这些决定的执行。

为此它必须能:

(1)把授权的决定告知系统,这是由SQL的GRANT和REVOKE语句来完成的。

(2)把授权的结果存入数据字典。

(3)当用户提出操作请求时,根据授权情况进行检查,以决定是执行操作请求还是拒绝之。

授权语句的一般格式为:

GRANT权力[,权力]…[ON对象类型对象名]TO用户[,用户]…,

[WITHGRANTOPTION];

对不同类型的操作对象可有不同的操作权力。

(1)对基本表、视图及其字段的操作权力有查询、插入、更新、删除以及它们的总和ALLPRIVILEGE。

(2)对基本表的操作权力还有修改(ALTER)和建立索引(INDEX)。

(3)对数据库的操作权力有建立表(CREATETAB)。

某用户有了此权力就可以使用Createtable建立基本表。

称他为表的主人,拥有对此表的一切操作权力。

(4)对表空间的权力有使用(USE)数据库空间存储基本表的权力。

(5)系统权力有建立新数据库(CREATEDBA)的权力。

GRANT语句中的任选项WITHGRANTOPTION的作用是使获得某种权力的用户可以把权力再授予别的用户。

8.嵌入式SQL

把SQL嵌入主语言使用时必须解决三个问题:

(1)区分SQL语句与主语言语句。

这是通过在所有的SQL语句前加前缀EXECSQL来解决的。

SQL语句结束标志随主语言不同而不同,如PL/1用分号(;),COBOL用EMD-EXEC来表示。

SQL语句首先由预编译程序加以处理,转换为主语言编译程序能够识别的形式,然后交主语言编译程序进一步处理。

(2)数据库工作单元和程序工作单元之间的通信。

SQL语句中可以使用主语言的程序变量(简称主变量),这些变量名前加冒号(:

)作标志,以区别地字段名,程序中使用的任何表(基本表或视图)都要用EXECSQLDECLARE语句加以说明。

一则使程序更加清晰,二则使预编译程序能作某些语法检查。

SQL语句执行后,系统要反馈给应用程序若干信息,这些信息送到SQL的通信区SQLCA。

SQLCA用语句EXECSQLINCLUDE加以定义。

在SQLCA中有一个状态指示字段SQLCODE。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 计算机硬件及网络

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1