数据库基础学习方法.ppt
《数据库基础学习方法.ppt》由会员分享,可在线阅读,更多相关《数据库基础学习方法.ppt(445页珍藏版)》请在冰豆网上搜索。
2022/10/23,数据库系统,1,本章要求:
1数据库系统概述,4数据库系统的组成,2数据模型,3DBS的结构,本章内容:
1、了解数据管理的发展过程2、掌握数据库系统的基本概念和主要特点3、掌握数据库系统的三级模式结构和数据库系统的组成4、掌握实体、记录等有关概念和三种数据模型,请选择内容,返回,2022/10/23,数据库系统,2,一、基本概念1、数据:
描述事务的符号记录。
可用文字、图形等多种形式表示,经数字化处理后可存入计算机。
2、数据库(DB):
按一定的数据模型组织、描述和存储在计算机内的、有组织的、可共享的数据集合。
3、数据库管理系统(DBMS):
位于用户和操作系统之间的一层数据管理软件。
主要功能包括:
数据定义功能:
DBMS提供DDL,用户通过它定义数据对象。
数据操纵功能:
DBMS提供DML,用户通过它实现对数据库的查询、插入、删除和修改等操作。
1数据库系统概述,2022/10/23,数据库系统,3,数据库的运行管理:
DBMS对数据库的建立、运行和维护进行统一管理、统一控制,以保证数据的安全性、完整性、并发控制及故障恢复。
数据库的建立和维护功能:
数据库初始数据的输入、转换,数据库的转储、恢复、重新组织及性能监视与分析等。
4、数据库系统(DBS):
计算机中引入数据库后的系统,包括数据库DB数据库管理系统DBMS应用系统数据库管理员DBA和用户,2022/10/23,数据库系统,4,二、数据管理与数据处理1、数据管理:
对数据收集、整理、组织、存储、维护、检索、传送等,对象,操作,目标:
在妥当的时候以妥当的形式给妥当的人提供妥当的数据。
2、数据处理:
对数据进行加工、计算、提炼,从而产生新的有效数据的过程,数据,信息,2022/10/23,数据库系统,5,3、管理与处理的关系:
管理是处理的基础处理为管理服务,数据处理,数据处理,源数据,新数据,新数据,管理和处理又可看成一个问题的两个阶段,故可以统一起来,其中心是管理,数据管理,数据管理,2022/10/23,数据库系统,6,三、数据管理的发展阶段人工管理阶段(50年代中期以前)文件系统阶段(50年代中期至60年代后期)数据库系统阶段(60年代后期以后),2022/10/23,数据库系统,7,1、人工管理阶段(程序员管理阶段)特点:
数据不保存程序员负责数据管理的一切工作数据和程序一一对应,没有独立性和共享性,数据和程序的关系:
应用程序1,数据1,应用程序2,数据2,应用程序n,数据n,2022/10/23,数据库系统,8,又可分为两个阶段
(1)60年代初期出现了初等的文件系统主要特点:
组织方式:
顺序文件数据结构:
物理结构=逻辑结构软件功能:
仅有简单I/O操作,
(2)60年代中期出现了成熟的文件系统主要特点:
组织方式:
顺序和随机存取并用数据结构:
物理结构和逻辑结构有了简单的变换软件功能:
软件系统提供了存取方法,硬件:
有了大容量直接存储外存设备,如磁盘、磁鼓等软件:
有了专门的数据管理软件-文件系统处理方式:
有批处理、联机实时处理等,2、文件系统阶段,基础,2022/10/23,数据库系统,9,三个主要缺点:
数据高度冗余:
数据基本上还是面向应用或特定用户的。
数据共享困难:
文件基本上是私有的,只能提供很弱的文件级共享数据和程序缺乏独立性:
只有一定的物理独立性,完全没有逻辑独立性。
应用程序1,数据1,应用程序2,数据2,应用程序n,数据n,数据与程序的关系:
存取方法,操作系统负责,2022/10/23,数据库系统,10,3、数据库系统阶段文件系统不能适应大数据量、多应用共享数据的根本原因:
数据没有集中管理数据库方法的基本出发点:
把数据统一管理、控制,共享使用,应用程序1,应用程序2,应用程序n,数据与程序的关系:
DBMS,数据库,2022/10/23,数据库系统,11,
(1)数据高度结构化集成,面向全组织
(2)数据共享性好。
可为多个不同的用户共同使用(3)数据冗余少,易扩充(4)数据和程序的独立性高,物理独立性:
存储结构变,逻辑结构可以不变,从而应用程序也不必改变。
逻辑独立性:
总体逻辑结构变,局部逻辑结构可以不变,从而应用程序也不必改变。
好处:
简化应用程序的编写和维护,(5)数据控制统一安全性控制:
防止泄密和破坏完整性控制:
正确、有效、相容并发控制:
多用户并发操作的协调控制故障恢复:
发生故障时,将数据库恢复到正确状态,主要优点,2022/10/23,数据库系统,12,4、各个阶段的比较:
从四个方面,人工管理文件系统数据库系统,谁管理数据,面向谁,共享性,数据独立性,程序员,特定应用,不能,没有,操作系统提供存取方法,系统集中管理,基本上是特定用户,共享很弱,面向系统,充分共享,一定的物理独立性,较高的独立性,文件系统和数据库系统的本质区别:
内部:
数据库的数据是结构化的,有联系的文件系统的各记录无联系,外部:
数据库系统是共享的文件系统基本上是面向特定用户的,2022/10/23,数据库系统,13,2数据模型,数据处理的抽象过程(涉及三个领域),建立概念模型建立数据模型(便于用户和DB设计人员交流)(便于机器实现)一、概念模型(信息模型)把现实世界中的客观对象抽象成的某种信息结构,主要用于数据库设计。
独立于具体的计算机系统独立于具体的DBMS支持的数据模型,现实世界=信息世界,抽象,=机器世界(数据世界),转换,2022/10/23,数据库系统,14,实体:
客观存在并可相互区分的事物。
实体集:
性质相同的同类实体的集合。
属性:
实体具有的某一特性。
实体标识符:
能将一个实体与其它实体区分开来的一个或一组属性。
信息世界,记录实体(抽象表示)文件实体集字段或数据项属性关键字实体标识符。
唯一地标识一个记录。
又称码、键。
数据世界,1、实体与记录,2022/10/23,数据库系统,15,2、型与值在DBS中,每一个对象广义上讲都有型与值之分:
型是对象的结构或特性描述,值是一个具体的对象实例。
类似于程序设计语言中数据类型与数据值的概念。
(1)实体型:
对实体固有特性或结构的描述。
用实体名及其属性名集合来抽象和刻画。
如汽车(车牌号,车型,车主),实体值:
实体型的一个实例,即一个具体的实体。
如(豫A00001,丰田,张三),
(2)记录型:
记录格式。
记录值:
一个具体的记录。
2022/10/23,数据库系统,16,如:
(3)几点说明区分型与值的实质DBS中讨论的重点是型通常只说实体、记录,含义根据上下文自明,3、实体间的联系实体内部的联系(属性间的联系):
反映在数据上就是记录内部数据项间的联系,实体之间的联系:
反映在数据上就是记录之间的联系,2022/10/23,数据库系统,17,
(1)1对1联系(1:
1):
两个实体集中的每一个实体至多和另一个实体集中的一个实体有联系。
如国家部长学员队学员,
(2)1对多联系(1:
n):
若实体集A中的每个实体与实体集B中0个或多个实体有联系,而B中每个实体至多与A中的一个实体有联系,则称从A到B为1对多的联系。
如国家总统学员队队长,实体之间的联系可归结为三类:
(3)多对多联系(m:
n):
两个实体集中的每一个实体都和另一个实体集中0个或多个实体有联系。
如学员课程,2022/10/23,数据库系统,18,DBS的核心问题之一:
如何表示和处理实体及实体间的联系。
4、概念模型的表示方法之一:
实体联系方法(Entity-RelationshipApproach)用ER图(Entity-RelationshipDiagram)描述:
实体型:
用长方形表示联系:
用菱形表示属性:
用椭圆形表示框内写上相应的名称用无向边连接:
2022/10/23,数据库系统,19,说明:
联系也必须命名多个实体之间也可以有联系,联系也可以有属性,单个实体之间也可以有联系,2022/10/23,数据库系统,20,例:
某工厂物资管理E-R图(P20),2022/10/23,数据库系统,21,二、数据模型是对现实世界进行抽象的工具,它按计算机系统的观点对数据建模,用于提供数据库系统中信息表示和操作手段的形式框架,主要用于DBMS的实现,是数据库系统的核心和基础。
1、常用的数据模型层次模型网状模型关系模型面向对象模型,称作非关系模型,是下列基本层次联系的集合,Ri,Rj是实体型(记录型)Lij是从Ri到Rj的1:
1或1:
n联系,2022/10/23,数据库系统,22,2、数据模型的三要素,形式化描述数据、数据之间的联系以及数据操作和有关的语义约束规则的方法,数据结构,数据操作,完整性约束,如何保证数据的约束条件得到满足,如何实现查、增、删、改,如何表示实体及联系(难点是表示联系),根据现实世界实体间联系的特征用四种不同的方法进行抽象,(因此,是按照数据结构的类型来命名数据模型),(动态),(静态),2022/10/23,数据库系统,23,3、层次模型根据一个单位的组织结构直观地得出,方框表示一个实体型(结点)线表示联系(边),
(1)定义:
用树形结构来表示实体以及实体间联系的模型。
其特征是:
(a)有且仅有一个结点无双亲(根结点);(b)其它结点有且仅有一个双亲。
2022/10/23,数据库系统,24,
(2)说明:
(a)树中实体间联系只能是从父到子的1:
1或1:
n联系,对m:
n联系,须使用辅助手段转换成多个1:
n联系,但不易掌握(b)简单直观,结构清晰,运行效率高,但编程复杂,4、网状模型
(1)定义:
用图结构来表示实体以及实体间联系的模型。
其特征是:
任一结点都可以无双亲或有一个以上的双亲。
例,2022/10/23,数据库系统,25,
(2)优:
可表示m:
n的联系,运行效率高缺:
过于复杂,实现困难,(3)说明(a)即使对网状模型,具体在计算机上实现时,m:
n的联系仍需分解成若干个1:
n的联系。
(因此,网状模型的图结构实质上是有向图),如,课程成绩单,学生成绩单,2022/10/23,数据库系统,26,(b)网状模型中允许两结点间有多条边,层次模型则不允许,5、关系模型层次、网状模型基本上是面向专业人员的,使用极不方便问题:
寻找一种能面向一般用户的数据模型?
(1)定义:
用二维表(关系)来描述实体及实体间联系的模型。
(2)示例,2022/10/23,数据库系统,27,供应商S,零件P,(联系)供应SP,关系:
对应一张表,每表起一个名称即关系名元组:
表中的一行属性:
表中一列,每列起一个名称即属性名主码:
唯一确定一个元组的属性组域:
属性的取值范围,2022/10/23,数据库系统,28,(3)关系模式:
对关系的描述,一般表示为:
关系名(属性1,属性2,属性n),(4)优点:
无论实体还是实体之间的联系都用统一的数据结构(二维表、关系)来表示,可方便地表示m:
n联系,因此概念简单,用户易懂易用如:
可表示为:
学生(学号,姓名,性别,系和年级)课程(课程号,课程名,学分)选修(学号,课程号,成绩),表格中行、列次序无关有坚实的理论基础(关系理论),2022/10/23,数据库系统,29,存取路径对用户透明,用户只需指出“做什么”,不需说明“怎么做”,因此数据独立性更高,缺点:
由于存取路径对用户透明,查询效率不够高,必须对查询请求进行优化。
说明:
关系必须规范化,关系的每个分量必须是一个不可分的数据项,不允许表中套表。
规范化理论将在后续章节讲解。
(5)关系模型与非关系模型的比较,统一不统一均为关系,对用户透明对用户不透明,一次一集合一次一记录,2022/10/23,数据库系统,30,三级模式(外模式、模式、内模式)两级映象(外模式/模式,模式/内模式映象),一、DBS的三级模式结构1、模式(Schema):
又称逻辑模式。
DB的全局逻辑结构。
即DB中全体数据的逻辑结构和特征的描述。
说明模式只涉及到型的描述,不涉及具体的值(实例),反映的是数据的结构及其联系模式不涉及物理存储细节和硬件环境,也与应用程序