数据库技术产生于六十年代末.docx

上传人:b****7 文档编号:10456866 上传时间:2023-02-11 格式:DOCX 页数:73 大小:44.36KB
下载 相关 举报
数据库技术产生于六十年代末.docx_第1页
第1页 / 共73页
数据库技术产生于六十年代末.docx_第2页
第2页 / 共73页
数据库技术产生于六十年代末.docx_第3页
第3页 / 共73页
数据库技术产生于六十年代末.docx_第4页
第4页 / 共73页
数据库技术产生于六十年代末.docx_第5页
第5页 / 共73页
点击查看更多>>
下载资源
资源描述

数据库技术产生于六十年代末.docx

《数据库技术产生于六十年代末.docx》由会员分享,可在线阅读,更多相关《数据库技术产生于六十年代末.docx(73页珍藏版)》请在冰豆网上搜索。

数据库技术产生于六十年代末.docx

数据库技术产生于六十年代末

数据库技术产生于六十年代末,是数据管理的最新技术,是计算机科学的重要分支数据库技术是信息系统的核心和基础,它的出现极大地促进了计算机应用向各行各业的渗透数据库的建设规模、数据库信息量的大小和使用频度已成为衡量一个国家信息化程度的重要标志

1.1.1四个基本概念

数据(Data)

数据库(Database)

数据库管理系统(DBMS)

数据库系统(DBS)

一、数据

数据(Data)是数据库中存储的基本对象

数据的定义

描述事物的符号记录

数据的种类

文字、图形、图象、声音

数据的特点

数据与其语义是不可分的

数据举例

学生档案中的学生记录

(李明,男,1972,江苏,计算机系,1990)

数据的形式不能完全表达其内容

数据的解释

语义:

学生姓名、性别、出生年月、籍贯、所在系别、入学时间

解释:

李明是个大学生,1972年出生,江苏人,1990年考入计算机系

(请给出另一个解释和语义)

二、数据库(续)

人们收集并抽取出一个应用所需要的大量数据之后,应将其保存起来以供进一步加工处理,进一步抽取有用信息

数据库(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据集合

二、数据库(续)

数据库的特征

数据按一定的数据模型组织、描述和储存

可为各种用户共享

冗余度较小

数据独立性较高

易扩展

三、数据库管理系统

DBMS

DataBaseManagementSystem

是操纵和管理数据库的一组软件,位于用户与操作系统之间。

系统软件

一组用以管理、维护、访问数据库的程序

基本目标

提供一个可以方便地、有效地存取数据库信息的环境

即提供数据定义语言(DataDefinitionlanguage),通过它,可以定义数据对象

提供数据操纵语言(DataManipulationlanguage)实现用户对数据操作,如对数据

的增、删、改和查询。

DML分为两种:

⑴嵌入到宿主语言中,如嵌入在C、Java、Delphi、PowerBuilder等高级语言中,称为宿主型DML⑵可以独立交互使用的DML,称为自主型或自含型DML,常用的有Transact-SQL,SQLPlus等.DBMS对数据库的保护主要包括四个方面:

⑴数据安全性控制:

数据安全性控制的作用是防止未被授权的用户破坏或

存取数据库中的数据.

⑵数据完整性控制

完整性控制的目的是保证进入数据库中数据的语义的正

确性和有效性,防止操作对数据的修改会违反其语义.

⑶并发控制

DBMS一般允许多个用户并发地访问数据库,即数据共享.但是多个用户同时对数据库进行访问可能会破坏数据的正确性,因此DBMS中必须有并发控制的机制,解决多用户下的并发冲突.

⑷恢复功能

数据库在运行中可能会出现各种故障,DBMS必须把处于故障中的数据库恢复到以前的某个正确状态,保持数据库的一致性.DBMS提供一系列的实用程序来完成包括数据库的初始数据的装入、转化功能,数据库的存储、恢复功能,数据库的重新组织功能和性能监视、分析功能等.

常用的DBMS:

Oracle

IBMDB2

Sybase

MicrosoftSQLServer

Informix

InterBase

MicrosoftAccess(用于微机)

四、数据库系统(DBS)

在计算机系统中引入数据库后的系统

数据库

DBMS(以及应用开发工具)

应用系统

数据库管理员

应用程序员

最终用户

1.1.2数据管理技术的演变

1.人工管理阶段(20世纪50年代中期)

产生的背景

应用需求科学计算

硬件水平无直接存取存储设备

软件水平没有操作系统

处理方式批处理

人工管理阶段(20世纪50年代中期)

特点:

数据的管理者:

应用程序,数据不保存。

数据面向的对象:

某一应用程序

数据的共享程度:

无共享、冗余度极大

数据的独立性:

不独立,完全依赖于程序

数据的结构化:

无结构

数据控制能力:

应用程序自己控制

缺点:

数据存在着大量的重复存储现象.

2文件系统阶段

(20世纪50年代后期到60年代中期)

文件系统阶段背景

应用需求科学计算、管理

硬件水平磁盘、磁鼓

软件水平有文件系统

处理方式联机实时处理、批处理

特点

(1)数据以文件的形式可长久保存在外设

(2)由专门的数据管理软件(提供数据存取、查询及维护功能

(3)数据文件具有多样性

(4)数据按文件名访问,按记录进行存取

特点

数据的管理者:

DBMS

数据面向的对象:

现实世界

数据的共享程度:

共享性高

数据的独立性:

高度的物理独立性和一定的

逻辑独立性

数据的结构化:

整体结构化

数据控制能力:

由DBMS统一管理和控制

应用程序与数据的对应关系(数据库系统)

数据的高共享性的好处

降低数据的冗余度,节省存储空间

避免数据间的不一致性

使系统易于扩充

数据独立性

物理独立性

指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。

当数据的物理存储改变了,应用程序不用改变。

逻辑独立性指用户的应用程序与数据库的逻辑结构是相互独立的。

数据的逻辑结构改变了,用户程序也可以不变。

数据结构化

整体数据的结构化是数据库的主要特征之一。

数据库中实现的是数据的真正结构化

数据的结构用数据模型描述,无需程序定义和解释。

数据可以变长。

数据的最小存取单位是数据项。

DBMS对数据的控制功能(见前)

数据的安全性(Security)保护

使每个用户只能按指定方式使用和处理指定数据,保护数据以防止不合法的使用

造成的数据的泄密和破坏。

数据的完整性(Integrity)检查

将数据控制在有效的范围内,或保证数据之间满足一定的关系。

DBMS对数据的控制功能

并发(Concurrency)控制

对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。

数据库恢复(Recovery)

将数据库从错误状态恢复到某一已知的正确状态。

1.2.4高级数据库阶段(20世纪70年代)

⑴数据库方法:

面向对象方法和思想应用于各种计算机系统。

⑵商用数据库系统的运行:

使数据库技术日益广泛地应用到各方面,深入到生产

,生活的各个领域.

⑶关系方法的理论研究和软件系统的研制取得了很大成果.

分布式数据库

面向对象数据库

多媒体数据库

数据仓库

★模型

是现实世界特征的模拟和抽象。

数据模型应满足三方面要求:

一是能比较真实地模拟现实世界;

二是容易为人所理解;

三是便于在计算机上实现。

数据模型分成两个不同的层次

(1)概念模型

(2)数据模型(逻辑模型和物理模型)

1.2.2数据模型的组成要素

数据结构

数据操作

数据的约束条件

1.数据结构

什么是数据结构

对象类型的集合

两类对象

与数据类型、内容、性质有关的对象

与数据之间联系有关的对象

数据结构是对系统静态特性的描述

2.数据操作

数据操作

对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则

数据操作的类型

检索

更新(包括插入、删除、修改)

数据模型对操作的定义

操作的确切含义

操作符号

操作规则(如优先级)

实现操作的语言

数据操作是对系统动态特性的描述。

3.数据的约束条件

数据的约束条件

一组完整性规则的集合。

完整性规则是给定的数据模型中数据及其联系所具有的制约和储存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。

数据模型对约束条件的定义

反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。

例如在关系模型中,任何关系必须满足实体完整性和参照完整性两个条件。

提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定语义约束条件。

1.2.2概念模型

1.概念模型

2.信息世界中的基本概念

3.概念模型的表示方法

1.概念模型

概念模型的用途

概念模型用于信息世界的建模

是现实世界到机器世界的一个中间层次

是数据库设计的有力工具

数据库设计人员和用户之间进行交流的语言

对概念模型的基本要求

较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识

简单、清晰、易于用户理解。

3.实体联系模型(E-R模型)表示方法

E-R模型的三要素:

实体、属性、实体间的联系.

1.2.4数据模型的分类

实体联系模型

层次模型(树型结构)

网状模型(网状结构)

关系模型

1.2.5层次模型

层次模型定义

满足下面两个条件的基本层次联系的集合为层次模型。

1.有且只有一个结点没有双亲结点,这个结点称为根

结点

2.根以外的其它结点有且只有一个双亲结点

层次数据模型的数据结构图

表示方法

实体型:

用记录类型描述。

每个结点表示一个记录类型。

属性:

用字段描述。

每个记录类型可包含若干个字段。

联系:

用结点之间的连线表示记录(类)型之间的

一对多的联系

实例:

教员-学生数据模型(P21)

层次数据模型的特点

结点的双亲是唯一的

只能直接处理一对多的实体联系

每个记录类型定义一个排序字段,也称为码字段

任何记录值只有按其路径查看时,才能显出它的全部意义

没有一个子女记录值能够脱离双亲记录值而独立存在

多对多联系在层次模型中的表示

用层次模型间接表示多对多联系

方法

将多对多联系分解成一对多联系

分解方法

冗余结点法

虚拟结点法

2.层次模型的数据操纵

查询

插入

删除

更新

3.层次模型的完整性约束

无相应的双亲结点值就不能插入子女结点值

如果删除双亲结点值,则相应的子女结点值也被同时删除

更新操作时,应更新所有相应记录,以保证数据的一致性

4.层次数据模型的存储结构

邻接法

按照层次树前序遍历的顺序把所有记录值依次邻接存

放,即通过物理空间的位置相邻来实现层次顺序

链接法

用指引元来反映数据之间的层次联系

子女-兄弟链接法P26

层次序列链接法P26

5.层次模型的优缺点

优点

层次数据模型简单,对具有一对多的层次关系的部门描述自然、直观,容易理解

性能优于关系模型,不低于网状模型

层次数据模型提供了良好的完整性支持

缺点

多对多联系表示不自然

对插入和删除操作的限制多

查询子女结点必须通过双亲结点

层次命令趋于程序化

6.典型的层次数据库系统

IMS数据库管理系统

第一个大型商用DBMS

1968年推出

IBM公司研制

网状模型

满足下面两个条件的基本层次联系的集合为网状模型。

1.允许一个以上的结点无双亲;

2.一个结点可以有多于一个的双亲。

网状数据模型的数据结构

实例:

特点

只能直接处理一对多的实体联系

每个记录类型定义一个排序字段,也称为码字段

任何记录值只有按其路径查看时,才能显出它的全部意义

网状模型与层次模型的区别

网状模型允许多个结点没有双亲结点

网状模型允许结点有多个双亲结点

网状模型允许两个结点之间有多种联系(复合联系)

网状模型可以更直接地去描述现实世界

层次模型实际上是网状模型的一个特例

多对多联系在网状模型中的表示

用网状模型间接表示多对多联系

方法

将多对多联系直接分解成一对多联系

2.网状模型的数据操纵

查询

插入

删除

更新

3.网状数据模型的完整性约束

网状数据库系统(如DBTG)对数据操纵加

了一些限制,提供了一定的完整性约束

双亲结点与子女结点之间是一对多联系

允许插入尚未确定双亲结点值的子女结点值

允许只删除双亲结点值

4.网状数据模型的存储结构

关键

实现记录之间的联系

常用方法(P27)

单向链接

双向链接

环状链接

向首链接

5.网状模型的优缺点

优点

能够更为直接地描述现实世界,如一个结点可以有多个双亲

具有良好的性能,存取效率较高

缺点

结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不

利于最终用户掌握

DDL、DML语言复杂,用户不容易使用

6.典型的网状数据库系统

DBTG系统,亦称CODASYL系统

由DBTG提出的一个系统方案

奠定了数据库系统的基本概念、方法和技术

70年代推出

实际系统

CullinetSoftwareInc.公司的IDMS

Univac公司的DMS1100

Honeywell公司的IDS/2

HP公司的IMAGE

1.2.7关系模型

1.2.7关系模型

最重要的一种数据模型。

也是目前主要采用的数据模型

1970年由美国IBM公司SanJose研究室的研究员E.F.Codd提出

本课程的重点

关系数据模型的数据结构

在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。

关系模型的基本概念

关系(Relation)

一个关系对应通常说的一张表。

元组(Tuple)

表中的一行即为一个元组。

属性(Attribute)

表中的一列即为一个属性,给每一个属性起一个名称即属性名。

关系模型的基本概念

主码(Key)

表中的某个属性组,它可以唯一确定一个元组。

域(Domain)

属性的取值范围。

分量

元组中的一个属性值。

关系模式

对关系的描述

关系名(属性1,属性2,…,属性n)

学生(学号,姓名,年龄,性别,系,年级)

实体及实体间的联系的表示方法

实体型:

直接用关系(表)表示。

属性:

用属性名表示。

一对一联系:

隐含在实体对应的关系中。

一对多联系:

隐含在实体对应的关系中。

多对多联系:

直接用关系表示。

例1

学生、系、系与学生之间的一对多联系:

学生(学号,姓名,年龄,性别,系号,年级)

系(系号,系名,办公地点)

例2

系、系主任、系与系主任间的一对一联系

系(系号,系名,系主任姓名)

例3

学生、课程、学生与课程之间的多对多联系:

学生(学号,姓名,年龄,性别,系号,年级)

课程(课程号,课程名,学分)

选修(学号,课程号,成绩)

关系必须是规范化的,满足一定的规范条件

最基本的规范条件:

关系的每一个分量必须是

一个不可分的数据项。

2.关系模型的数据操纵

查询、插入、删除、更新

数据操作是集合操作,操作对象和操作结果都是关系,即若干元组的集合

存取路径对用户隐蔽,用户只要指出“干什么”,不必详细说明“怎么干”

3.关系模型的完整性约束

实体完整性

参照完整性

用户定义的完整性

4.关系数据模型的存储结构

表以文件形式存储

有的DBMS一个表对应一个操作系统文件

有的DBMS自己设计文件结构

5.关系模型的优缺点

优点

建立在严格的数学概念的基础上

概念单一,数据结构简单、清晰,用户易懂易用。

实体和各类联系都用关系来表示。

对数据的检索结果也是关系。

关系模型的存取路径对用户透明

具有更高的数据独立性,更好的安全保密性

简化了程序员的工作和数据库开发建立的工作

关系模型的优缺点(续)

缺点

存取路径对用户透明导致查询效率往往不如非

关系数据模型

为提高性能,必须对用户的查询请求进行优化

增加了开发数据库管理系统的难度

6.典型的关系数据库系统

ORACLE

SYBASE

INFORMIX

DB/2

COBASE

PBASE

EasyBase

DM/2

OpenBase

1.3数据库系统的系统结构

数据库系统模式的概念

数据库系统的三级模式结构

数据库的二级映象功能与数据独立性

小结

1.3.1数据库系统模式的概念

“型”和“值”的概念

型(Type)

对某一类数据的结构和属性的说明

值(Value)

是型的一个具体赋值

例如:

学生记录

记录型:

(学号,姓名,性别,系别,年龄,籍贯)

记录值:

(900201,李明,男,计算机,22,江苏)

“型”和“值”的区别

模式(Schema)

数据库逻辑结构和特征的描述

是型的描述

反映的是数据的结构及其联系

模式是相对稳定的

模式的一个实例(Instance)

模式的一个具体值

反映数据库某一时刻的状态

同一个模式可以有很多实例

实例随数据库中的数据的更新而变动

1.3.2.数据库系统的三级模式结构

1)模式(Schema)

模式(也称逻辑模式)

数据库中全体数据的逻辑结构和特征的描述

所有用户的公共数据视图,综合了所有用户的需求

一个数据库只有一个模式

模式的地位:

是数据库系统模式结构的中间层

与数据的物理存储细节和硬件环境无关

与具体的应用程序、开发工具及高级程序设计语言无关

模式的定义

数据的逻辑结构(数据项的名字、类型、取值范围等)

数据之间的联系

数据有关的安全性、完整性要求

2)外模式(ExternalSchema)

外模式(也称子模式或用户模式)

数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的

描述

数据库用户的数据视图,是与某一应用有关的数据的逻辑表示

外模式的地位:

介于模式与应用之间

模式与外模式的关系:

一对多

外模式通常是模式的子集

一个数据库可以有多个外模式。

反映了不同的用户的应用需求、看待数据的方式

、对数据保密的要求

对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同

外模式与应用的关系:

一对多

同一外模式可以为某一用户的多个应用系统所使用,

但一个应用程序只能使用一个外模式。

外模式的用途

保证数据库安全性的一个有力措施。

每个用户只能看见和访问所对应的外模式中的数据

3)内模式(InternalSchema)

内模式(也称存储模式)

是数据物理结构和存储方式的描述

是数据在数据库内部的表示方式

记录的存储方式(顺序存储,按照B树结构存储,按hash方法存储)

索引的组织方式

数据是否压缩存储

数据是否加密

数据存储记录结构的规定

一个数据库只有一个内模式

1.3.3数据库的二级映象与数据独立性

三级模式是对数据的三个抽象级别

二级映象在DBMS内部实现这三个抽象层次的联系和转换

数据库系统的三级模式结构

1)外模式/模式映象

定义外模式与模式之间的对应关系

每一个外模式都对应一个外模式/模式映象

映象定义通常包含在各自外模式的描述中

外模式/模式映象的用途

——保证数据的逻辑独立性

当模式改变时,数据库管理员修改有关的外模式/模式映象,使外模式保持不变

应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程

序的逻辑独立性,简称数据的逻辑独立性。

2.模式/内模式映象

模式/内模式映象定义了数据全局逻辑结构与存储结构之间的对应关系。

例如,

说明逻辑记录和字段在内部是如何表示的

数据库中模式/内模式映象是唯一的

该映象定义通常包含在模式描述中

模式/内模式映象的用途

——保证数据的物理独立性

当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改

模式/内模式映象,使模式保持不变

应用程序不受影响。

保证了数据与程序的物理独立性,简称数据的物理独立性。

1.4数据库系统的组成

硬件

软件

人员

一、硬件平台及数据库

数据库系统对硬件资源的要求

(1)足够大的内存

操作系统

DBMS的核心模块

数据缓冲区

应用程序

(2)足够大的外存

磁盘

操作系统

DBMS

应用程序

数据库及其备份

光盘、磁带、软盘

数据备份

(3)较高的通道能力,提高数据传送率

二、软件

DBMS

操作系统

与数据库接口的高级语言及其编译系统

以DBMS为核心的应用开发工具

为特定应用环境开发的数据库应用系统

三、人员

数据库管理员

系统分析员

数据库设计人员

应用程序员

(最终用户)

1.数据库管理员(DBA)

决定数据库中的信息内容和结构

决定数据库的存储结构和存取策略

定义数据的安全性要求和完整性约束条件

数据库管理员(续)

监控数据库的使用和运行

周期性转储数据库

数据文件

日志文件

系统故障恢复

介质故障恢复

监视审计文件

数据库管理员(续)

数据库的改进和重组

性能监控和调优

数据重组

数据库重构

2.系统分析员

负责应用系统的需求分析和规范说明

与用户及DBA协商,确定系统的硬软件配置

参与数据库系统的概要设计

3.数据库设计人员

参加用户需求调查和系统分析

确定数据库中的数据

设计数据库各级模式

4.应用程序员

设计和编写应用系统的程序模块

进行调试和安装

5.用户

偶然用户

企业或组织机构的高中级管理人员

简单用户

银行的职员、机票预定人员、旅馆总台服务员

用户(续)

复杂用户

工程师、科学家、经济学家、科技工作者等

直接使用数据库语言访问数据库,甚至能够基于数据库管理系统的API编制自己

的应用程序

小结

数据库系统概述

数据库的基本概念(掌握)

数据管理的发展过程(了解)

数据库系统的研究领域(了解)

数据模型

数据模型的三要素(掌握)

概念模型,E-R模型(掌握)

三种主要数据模型(了解)

小结(续)

数据库系统的结构(掌握)

数据库系统三级模式结构

数据库系统的体系结构

数据库系统的组成(掌握)

第二章关系数据库

第二章关系数据库

2.1关系数据结构及形式化定义

2.2关系操作

2.3关系的完整性

2.4关系代数

2.5关系演算

2.6小结

关系数据库简介

系统而严格地提出关系模型的是美国IBM公司的E.F.Codd

1970年提出关系数据模型

E.F.Codd,“ARelationalModelofDataforLargeSharedDataBanks”,

《CommunicationoftheACM》,1970

之后,提出了关系代数和关系演算的概念

1972年提出了关系的第一、第二、第三范式

1974年提出了关系的BC范式

关系数据库简介

关系数据库应用数学方法来处理数据库中的数据

80年代后,关系数据库系统成为最重要、最流行的数据库系统

关系数据库简介

典型实验系统

SystemR

UniversityINGRES

典型商用系统

ORACLE

SYBASE

INFORMIX

DB2

INGRES

第二章关系数据库

2.1关系数据结构及其形式化定义

2.2关系操作

2.3关系的完整性

2.4关系代数

2.5关系演算

2.6小结

2.1关系数据结构及其形式化定义

2.1.1关系

2.1.2关系模式

2.1.3关系数据库

2.1.1关系

⒈域(Domain)

2.笛卡尔积(CartesianProduct)

3.关系(Relation)

⒈域(Domain)

域是一组具有相同数据类型的值的集合。

例:

整数

实数

介于某个取值范围的整数

长度指定长度的字符串集合

{‘男’,‘女’}

介于某个取值范围的日期

2.笛卡尔积(CartesianProduct)

1)笛卡尔积

给定一组域D1,D2,…,Dn,这些域中可以有相同的。

D1,D2,…,Dn的笛卡尔

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 军事

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1