自考数据库及其应用重点知识讲解.docx
《自考数据库及其应用重点知识讲解.docx》由会员分享,可在线阅读,更多相关《自考数据库及其应用重点知识讲解.docx(11页珍藏版)》请在冰豆网上搜索。
自考数据库及其应用重点知识讲解
2010年自考数据库及其应用重点知识讲解
2010年自考数据库及其应用重点知识讲解
(1)
第一章 人类社会活动的三大要素是能源、物质和信息。
信息是现实世界各种事物的存在特征、运动形态以及不同事物间的相互联系等诸要素在人脑中的抽象反映,进而形成概念。
是一个抽象的概念。
信息源于客观事物,而后通过人们加工处理再控制客观事物,从而达到认识世界,改造世界的目的。
数据本质上是对信息的一种符号化表示,即用一定的符号表示信息。
符号是由人为而定,在计算机中通常使用0和1这两个符号。
信息和数据,既有区别,又有联系,数据是信息的载体,用来载荷信息,信息是数据的内涵,数据处理本质上就是信息处理。
从已知数据出发,参照相关数据,进行加工计算,产生出一些新的数据,这些新的数据又表示了新的信息,可以作为某种决策的依据,这一过程就是数据处理过程。
数据处理的任务不是计算,而是管理数据。
数据处理本质上就是信息处理。
数据的收集、整理、组织、存储、查询、维护和传送等各种*作,是数据处理的基本环节,是任何数据处理任务必有的共性部分。
数据管理大体上可分为自由管理阶段、文件系统阶段和数据库系统阶段。
文件是*作系统管理数据的基本单位,文件可以命名,通过文件名以记录为单位存取数据,不必关心数据的存储位置。
若干记录的集合称为文件。
描述事物性质的最小数据单位是数据项。
记录是若干数据的集合,一个记录能表达一个具体事物。
在数据库系统阶段,数据库技术具有以下五个特点:
数据结构化、数据共享、减少了数据冗余、有较高的数据独立性和提供了方便的用户接口。
文件系统与数据库系统的最大区别是数据结构化。
数据库系统由数据库、支持数据库运行的软硬件、数据库管理系统和应用程序等部分组成。
DB是存储在磁盘等外部直接存取设备上的数据集合,是按一定的数据结构组织起来的,数据库是一个结构化的数据集合,主要是通过综合各个用户的文件,除去不必要的冗余,使之相互联系所形成的数据结构。
(结构化的、有联系的数据集合) 数据库系统中的硬件是数据库赖以存在的物理设备,包括CPU、存储器和其他外部设备。
数据库系统中的软件是指数据库管理系统。
-用于数据管理的软件系统 数据库管理系统简称DBMS,是是数据库系统的关键组成部分,是专门用于数据管理的软件。
任何数据*作,包括数据库定义、数据查询、数据维护、数据库运行控制等都是在DBMS管理下进行的。
DBMS是用户与数据库的接口,应用程序只有通过DBMS才能和数据库打交道。
DBA是指数据库管理员,其职责是维护和管理数据库,使之始终处于最佳状态。
UWA:
用户工作区,是用户程序与系统缓冲区交换数据的场所。
用户只能对UWA中的数据进行处理,其数据是DBMS根据用户的请求装进去的。
DD:
数据字典,其中存放着数据库三级结构的描述以及各数据项的类型、值域和关键字等,从结构上对数据的语言和数值范围加以约束。
计算机系统中任何软件必须在*作系统的支持下才能工作。
1975年ARC公布了数据库标准报告,提出了数据库三级组织结构,称ARC分级结构,从内到外分三个层次描述,分别称为内模式、概念模式、外模式。
概念模式,简称模式,是对数据库的整体逻辑描述,并不涉及物理存储,故称为DBA视图。
内模式,又称存储模式,具体描述了数据是如何组织存储在存储介质上,是系统程序员用一定的文件形式组织起来的一个个存储文件和联系手段。
故称内模式为系统程序员视图。
只有内模式才是真正存储数据的。
外模式通常是模式的一个子集,又称子模式,外模式面向用户,是用户眼中的数据库,称外模式为用户视图。
数据库系统的三级结构中,总体观和存储观有一个,用户观有多个,一个应用对应一个用户观。
三级结构的关系,可以概括为模式是内模式的逻辑表示,内模式是模式的物理实现,外模式是模式的部分抽取。
三个模式反映了对数据库的三种不同观点,模式表示了概念级数据库,体现了对数据库的总体观,内模式表示了物理级数据库,体现了对数据库的存储观,外模式表示了用户级数据库,体现了对数据库的用户观。
数据库三个模式之间存在两种映射,一是外模式/模式间的映射,另一映射是模式/内模式间的映射。
在数据库系统的组织结构中,模式/内模式映射把概念数据库与物理数据库联系起来,外模式/模式把用户数据库与概念数据库联系起来。
映射技术的好处:
保证了数据的独立性、保证了数据共享、方便了用户使用数据库、有利于数据的安全和保密。
应用程序员和终端用户是数据库的用户。
DBMS通过DDL(数据描述语言)来定义三种模式,并将各种模式翻译成相应的目标代码。
DML数据*纵语言实现对数据库的*作,基本*作有:
插入、修改、删除、检索。
DBMS有两种类型的程序设计语言:
如FORTRAN、C等属于宿主(HL)型,FoxPro则属于自主(SCL)型。
DBMS对数据库运行的控制主要是通过数据安全性控制、完整性控制、故障恢复和并发*作四个方面实现的。
关于信息和数据,下面的论述是正确的。
D (A)只有区别没有联系(B)信息是数据的载体(C)同一信息用同一数据表示形式(D)数据处理本质上就是信息处理 数据库是。
B(A)单用户独享的(B)多用户共享的(C)多用户(D)单用户 下面关于数据库管理系统的论述,是正确的。
B (A)数据库管理系统是用户与应用程序的接口(B)应用程序只有通过数据库管理系统才能和数据库联系 (C)数据库管理系统用DML来定义三级模式(D)数据库管理系统用DDL来实现对数据库的各种*作 数据库系统提供了多种语言,下面不是其中的一种。
(A)DDL(B)SCL(C)DML(D)HL2005
2010年自考数据库及其应用重点知识讲解
(2)
第二章 数据模型是对客观事物及其联系的描述,是记录及其联系的集合,应具有描述数据和数据联系两方面的功能,采用形式化的描述方法表达数据和数据之间的联系。
数据模型表示的是数据库的框架,在该框架约束下填上具体数据才是数据库。
数据库类型根据数据模型划分。
数据的数据结构形式就是数据模型 为保证数据的完整性,数据模型对数据的描述应包括)模型中包含哪些记录类型,并对记录类型进行命名;指明各个记录类型由哪些数据项构成,并对数据项进行命名;每个数据项均需指明其数据类型和取值范围。
对数据间联系的描述要指明:
各个不同记录类型间所存在的联系和联系方式。
公式DM{R,L}是对数据模型的描述,其中R代表记录类型的集合,L代表不同记录类型联系的集合。
公式的含义是表示了数据模型具有描述数据和数据联系两方面的功能,R是对数据的描述,L是对数据间联系的描述。
数据模型本质上是对“信息模型”的数据化表示,信息模型又称“实体联系模型”,是客观事物及其自然联系在人脑中所形成的概念。
信息来自于三个领域:
现实世界、信息世界和数据世界。
在信息世界中,不论是实际存在的东西,还是概念性的东西,或是事物与事物之间的联系,一律统称为实体。
不同实体是由其属性的不同而被区分的。
实体和属性都有“型”和“值”之分。
“型”是概念的内涵,而“值”是概念的实例。
“型”表达的是个体的共性,而“值”是个体的具体内容。
“键”也称关键字,是指在实体属性中,可用于区分实体集中不同个体的那个或几个属性的组合。
当有多个属性可作为键而选定其中一个时,则称它为该实体的“主键”。
若在实体诸属性中,某实体虽非该实体的主键,却是另一个实体的主键,则称此属性为“外部键”。
实体中每个属性,都有一个取值范围,这叫做属性的“域”。
实体间的联系分别是一对一联系(1:
1),一对多联系(1:
n),多对多联系(m:
n)。
E-R方法,又称为实体联系表示法。
E-R图中所表示的实体及其联系,实际上是信息模型。
E-R图的三大要素:
属性、实体、联系。
目前,成熟地应用于数据库系统中的数据模型有层次模型、网状模型和关系模型。
层次模型用树结构表示记录类型及其联系。
结构特点:
有且仅有一个结点无父结点,其他结点有且仅有一个父结点。
在层次模型中,上一层记录型和下一层记录型之间的联系为1:
n.不能直接支持m:
n联系。
对于记录之间的m:
n关系,可以将其转换为1:
n联系。
网状模型的结构是结点的连通图,特点是:
有一个以上结点无父结点且至少有一个结点有多于一个父结点。
典型代表是DBTG系统。
目前,在微机上的数据库系统应用最广泛的数据模型是关系模型。
关系模型的本质是一张二维表,关系模型中,一张二维表就称为一个关系。
如果二维表中的数据有变化,则它的记录数改变,它的字段数相对固定。
在文件系统中,一张二维表称为一个文件,表头行称为记录型,表中其他各行称为记录,而每一列中的各元素称为一个数据项。
通常在数据库中,二维表以文件的形式存储在磁盘上,一个关系就是一个文件(一张二维表)。
从E-R图导出关系模型的时候,图中的每一个实体,都应转换为关系,其中应包括对应实体的全部属性,并应根据关系所表达的语义确定哪个属性(或哪几个属性组合)作为主键。
E-R图:
方框表示实体,椭圆表示实体的属性,菱形表示联系。
信息世界用语:
实体集、实体、属性、实体键,在数据世界中对应:
文件、记录、数据项(字段)、记录键。
以下关于数据模型的描述,A不正确。
(A)数据模型表示的是数据库本身 (B)数据模型表示的是数据库的框架 (C)数据模型是客观事物及其联系的描述(D)数据模型能够以一定的结构形式表示出各种不同数据之间的联系 下列关于实体的说法,B不正确。
(A)实体是指现实世界中存在的一切事物 (B)实体靠联系来描述 (C)实体所具有的性质统称为属性 (D)实体和属性是信息世界表达概念的两个不同单位 实体集中,各实体值相应的属性有着B的域。
(A)不同(B)相同(C)各自(D)固定 综合:
画E-R图,写出关系模型
2010年自考数据库及其应用重点知识讲解(3)
第三章 域是值的集合,域中数据个数叫做域的基数。
R(D1,D2,…Dn)的含义是:
当且仅当R是D1×D2×…×Dn的一个子集,则称R是D1×D2×…×Dn上的一个关系。
其中,R是关系名,n是关系的度,Di是第i个域名。
在关系的定义中,n度的关系,必有n个域。
一个关系就是一张二维表,表中的每一行对应关系中的一个元组,它对应于信息世界中的实体和计算机世界中的记录,表中的每一列就是关系中的一个域。
也称为属性,对应于计算机世界中的字段。
关系与文件有许多相似之处,把关系看成文件时,则元组就是文件中的记录,属性就是记录中的数据项(字段)。
不允许“表中套表”,即表中元组分量必须是原子的。
二维表中的各列取自同一个域,因此一列中的各个分量具有相同性质。
列的次序、行的次序可以任意交换,不改变关系的实际意义。
表中的行叫元组,代表一个实体,因此表中不允许出现相同的两行。
判断两个关系是否相等,与属性的次序无关,与元组的次序无关,与关系的命名无关。
关系模式是指用关系数据描述语言描述后的关系,必须逐个对关系模型中的关系进行描述才能生成数据库概念模式。
对关系的描述实为定义关系模式。
关系数据描述语言实质是定义关系框架的,包括对域和关系进行描述 常用的关系数据描述语言(DDL)有问答式和语言描述式,常用的FoxPro属于问答式DBMS. 语言描述式有专门描述语言定义关系模式,包括关系名、组成该关系的各个域名、数据类型、长度和取值范围 域描述语句:
DOMAIlt;域名>ICIlt;类型(长度)>[RANGEIlt;数1>THRU<数2>],通过DOMAIN定义域名、PIC定义数据类型和长度,RANGE定义取值范围。
关系描述语句:
RELATIOlt;关系名>(<域名1,域名2,…>)KEY=(<域名i,域名j,…>) 关系模式的三类完整性规则是:
实体完整性约束规则、引用完整性约束规则、用户定义的完整性约束规则。
实体完整性约束是指关系中的“主键”不允许取空值。
引用完整性约束规则是限制引用不存在的记录。
在关系的各种*作中,关系查询是核心,所以关系数据*纵语言DML语言,常被称为查询语言。
DML特点:
*作对象与结果都是关系,非过程性强,语言一体化,有严密的数学工具。
关系数据*作的最大特点是:
以关系为处理单位,处理后的结果是关系。
关系DML查询,根据表达查询方式的不同,可分为两类:
用关系代数运算表达查询和用关系演算公式表达查询。
关系数据*作语言相应分为两种不同类型:
关系代数型和关系演算型。
所谓单目运算就是对一个关系施加的运算,所谓双目运算就是对两个关系施加的运算。
选择、投影是单目运算,连接、关系笛卡儿积是双目运算。
集合运算符:
∪并、∩交、-差、×迪卡尔积,关系运算符:
π投影、σ选择、|×|连接 比较运算符:
>、≥、<、≤、=、≠,逻辑运算符:
-非、∧与、∨或 并、交、差用于关系运算,要求参加运算的两个关系是相容的,即两个关系度数相同,相应属性取自同一个域。
并:
由属于R或属于S或同时属于R和S的元组构成的集合,记为R∪S. 差:
由属于R而不属于S的所有元组组成的集合,记为R-S。
交:
由同时属于R和S的元组组成的集合,记为R∩S. 选择:
按给定条件从关系中挑选满足条件的元组组成的集合,记为σF(R) 投影:
从关系中挑选出指定的属性组成的新关系,记为:
πA(R)A是属性名表,R是关系名。
关系R和S的笛卡儿积,它是由R的第一个元组依次与S的所有元组组合,然后是R的第二个元组,直到最后一个元组依次与S所有元组组合,形成新的关系。
记为:
R×S关系R和S的笛卡儿积k1+k2个元组。
连接:
按给定条件,把满足条件的两关系的所有元组,按一切可能拼接后形成的新关系,相当于在两关系笛卡儿积上的选择。
记为:
R|×|S=σF(R×S)关系R和S的连接后的关系有≤k1×k2个元组。
连接运算可以从乘积运算和选择运算中导出,自然连接运算可以从乘积运算、选择运算和投影运算中导出。
自然连接是连接的一个重要特例,它要求被连接的两关系有若干相同的属性名。
记为:
R|×|S 连接运算:
JOIN<关系1>WITH<关系2>WHERE<条件>,按给定条件对两关系进行连接运算。
五种基本运算:
并、差、选择、投影、连接。
在关系中,当有多个属性可作为键而选定其中一个时,则称它为该关系的主键。
在一个关系中,需要几个属性组合起来才能惟一标识元组时,则称这几个属性为该关系的联合键。
凡在关系中可以用来惟一标识元组的属性或属性组叫做候选键。
当关系中的某个属性或某一组属性并非主键,但却是另一个关系的主键时,称该属性为外部键。
凡可作为侯选键的属性叫主属性,不能作为侯选键的属性叫非主属性。
所谓函数依赖其实质是刻画关系中各个属性之间相互制约而又相互依赖的关系。
函数依赖包括:
完全函数依赖、部分函数依赖、传递函数依赖 满足最低要求的关系称它属于第一范式,在此基础上又满足了某种条件,则称它属于第二范式的关系,依此类推直到第五范式。
数据库一般使用3NF以上的关系。
满足较高条件者必满足较低范式条件。
一个较低范式的关系,可以通过关系的无损分解转换为若干较高级范式关系的集合,这个过程叫做关系规范化 如果关系R的所有属性都是不可再分的数据项,称该关系属于第一范式。
1NF 第一范式缺点:
数据冗余大、修改麻烦、插入异常、删除异常。
若关系R属于1NF,且它的每一非主属性都完全依赖于主键,则称R属于第二范式,2NF 若关系R属于2NF,且它的每一非主属性都不传递依赖于关键字,则称R属于第三范式,3NF 在关系规范化中,分解关系的两条基本原则是:
分解必须是无损的和分解后的关系要相互独立。
关系规范化过程实质是对关系不断分解的过程,通过分解使关系逐步达到较高范式。
规范化是围绕函数依赖进行的。
在规范化过程中,消除部分依赖和传递依赖后,1NF变成3NF.1NF、2NF、3NF相互间是全包含关系。
以下说法正确的是(A) (A)一个关系就是一张二维表(B)在关系所对应的二维表中,行对应属性,列对应元组 (C)笛卡儿积中不允许有相同的域(D)关系的各属性名必须与对应的域同名 根据关系模式的完整性规则,一个关系中的“主键”。
(C) (A)不能有两个(B)不能成为另一个关系的外部键(C)不允许为空(D)可以取空值 关系中的最高范式为(D) (A)2NF(B)3NF(C)4NF(D)5NF 综合:
1、计算并、差、交、选择、投影、关系笛卡尔积、连接、自然连接。
2、范式关系规范化 3、写出关键字 4、确定范式等级
2010年自考数据库及其应用重点知识讲解(4)
第四章 数据库设计是数据库应用系统的核心部分,它包括两方面的内容:
结构特性设计和行为特性设计。
在数据库的两方面设计中,结构特性是静态的,一旦形成轻易不再改变,行为特性是指用户的业务活动,这种活动体现在应用程序中。
结构特性设计是指数据库总体概念设计。
它应该是具有最小数据冗余的,能反映不同用户数据需求的,能实现数据共享的系统。
数据库设计中结构设计是关键。
在数据库设计中,结构特性是在模式和子模式中定义的,而行为特性通过应用程序实现。
数据库设计包括数据库系统的逻辑设计、物理设计、应用程序设计和系统的运行与维护等方面。
数据库逻辑设计分为三个阶段,分别是:
收集和分析用户要求、建立E-R模型和数据库模式设计。
主要任务是创建数据库模式。
数据库逻辑设计中的第一阶段收集和分析用户需求是按以下四步进行的:
分析用户活动,确定系统范围,分析用户活动所涉及的数据和分析系统数据。
数据流图是一种从数据和对数据的加工两方面表达系统工作过程的图形表示法。
含有四种基本成分:
带箭头的线段表示数据及其流动方向,圆形框表示对数据的加工,卡片形框表示文件,方框表示源点和终点。
画数据流图应遵循:
由外向内、自顶向下原则进行。
数据库系统的生命期可以分为五个阶段,依次是分析、设计、编码、测试、运行。
所谓分析用户活动所涉及的数据就是以数据流图的形式表示出数据的流向和对数据所进行的加工。
所谓分析系统数据就是对数据流图中的每一个数据流名、每个文件名、每个加工名,都要给出具体定义,都需要用一个条目进行描述。
描述后的产物是数据字典。
数据流图和数据字典结合在一起,加上必要的说明构成系统说明书。
数据字典是对数据流图中的四个成分(数据流、数据项、文件、加工)的描述。
教材中所讲的数据库设计方法称为视图设计法,即从分析用户的活动入手,针对用户的局部视图,然后进行综合,用E-R图表示数据库的概念,进而转换为关系模式。
逻辑设计第二阶段建立E-R模型分两步,首先应进行局部E-R模型设计,然后进行总体E-R模型的设计。
逻辑设计第三阶段在数据库模式设计阶段分两步进行,第一步初步设计:
把E-R图转换为关系模型,第二步优化设计:
对模式进行调整和改善。
优化是在性能预测的基础上进行的,一般用三方面指标来衡量:
1、单位时间内所访问的逻辑记录个数要少,2、单位时间内数据传送量要少;3、系统占用的存储空间尽量要少。
数据库物理设计包括:
选择存储结构、确定存取方法、选择存取路径、确定数据的存放位置。
主要解决选择文件存储结构和确定文件存取方法的问题。
在数据库中访问数据的路径主要表现为如何建立索引。
如要直接定位到所要查找的记录,应采用索引方法存取方法(索引表)。
顺序表只能从起点进去向后一个个访问记录。
数据库的物理实现取决于特定的DBMS,在规划存储结构时主要应考虑存取时间和存储空间,这两者通常是互相矛盾的,要根据实际情况决定。
经过从概念设计→逻辑设计→物理设计,标志着数据库的框架搭设成功。
一般程序设计方法均适用于应用程序设计,如:
自顶向下或结合由下而上灵活运用,程序按功能模块化,使模块便于组装和调试,追求程序可读性,不过多采用难以理解的技巧。
应用程序设计的依据:
数据库逻辑设计。
老化就是对数据库施加各种*作,例如增、删、查、改。
数据库投入运行标志着开发任务的基本完成和维护工作的开始。
所谓维护就是整理数据的存储。
数据库维护工作包括:
日常维护(指对数据库中的数据随时按需要进行增、删、插入、修改或更新*作),定期维护(重构重组数据库),故障维护(当数据库遭到意外破坏时,把它恢复到破坏前的状态)。
以下关于数据库设计的说法,C不正确。
(A)数据库设计是“反复探寻,逐步求精”的过程(B)数据库设计包括结构特性设计和行为特征设计两个部分 (C)数据库设计中行为特征设计是关键部分(D)数据库设计是数据库应用系统设计中的核心部分。
数据库系统中的技术文档主要有系统说明书、技术说明书和使用说明书。
以下程序调试方法,最为常用。
B (A)通读程序编码,发现错误的命令行(B)在程序中设置断点,观察断点处状态 (C)输入数据,进行人工检验(D)暂时删除无关语句,简化程序编码 以下观点中,错误的是。
B (A)关系数据库中记录通常是按到来的先后顺序存放(B)DNMS通常只支持顺序存取方法。
(C)数据库访问的路径对效率影响是很大的(D)数据库多半存放在磁盘、光盘或磁带上。
2010年自考数据库及其应用重点知识讲解(5)
第五章 数据管理系统是管理数据库的系统软件,是用户与数据库之间的接口,提供*纵数据库的各种命令。
数据库统是由用户、数据库管理系统和数据库构成的。
Foxpro特点:
windows应用程序风格,非编程接口,多用户功能,提供了应用程序开发工具,快速查找机制,提供了真正的编译器,提供了与高级语言接口,提供了对SQL的支持。
FoxPro提供了一个真正的编译器“DistributionKit”,可将FoxPro应用程序编译为直接在*作系统下运行的“。
exe”文件;提供了一个真正的外部程序接口“LibraryCotructionKit”,允许开发者用C语言创建FoxPro函数。
在FoxPro中每一条记录最多可以有255个字段,最多可以有65000个内存变量。
在FoxPro中,一个二维表即称为一个文件,二维表是以文件的形式存储在磁盘上的,一个关系就是一个文件,这样的文件称为数据库文件。
a$b测试字符串a是不是b的子串,a#b=a文件file编辑edit数据库database记录record程序program运行run文字text窗口window帮助help
2010年自考数据库及其应用重点知识讲解(6)
FoxPro共有225个工作区,工作区号为1-255.其中前10个工作区也可命名为A-J.。
最近一交换选择的工作区称为当前工作区。
调用其它工作