数据库设计步骤简述Word文档格式.docx
《数据库设计步骤简述Word文档格式.docx》由会员分享,可在线阅读,更多相关《数据库设计步骤简述Word文档格式.docx(5页珍藏版)》请在冰豆网上搜索。
数据库应用软件和其他软件一样,也有它的诞生和消亡。
数据库应用软件作为软件,在其生命周期可以看作有三个大的时期:
软件定义时期,软件开发时期和软件运行时期。
按照规范化设计方法,从数据库应用系统设计和开发的全过程来考虑,将数据库及其应用软件系统的生命周期的三个时期又可以细分为六个阶段:
需求分析、概念结构设计、逻辑结构设计、物理结构设计、实施及运行维护。
一、需求分析
信息需求:
指目标系统设计的所有实体、属性、以及实体间的联系等,包括信息的内容和性质,以及由信息需求导出的数据需求。
处理需求:
指为得到需要的信息而对数据进行加工处理的要求,包括处理描述,发生的频度、响应时间以及安全保密要求等。
进行数据库设计首先必须准确了解与分析用户需求。
需求分析是真个设计过程的基础,是最困难、最耗费时间的一步。
作为地基的需求分析是否做得充分与准备,决定了在其上构建数据库大厦的速度与质量。
需求分析做得不好,甚至会导致整个数据库设计返工重做。
需求任务分析:
需求分析的任务是通过详细调查现实世界要处理的对象(组织、部门、企业等),充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求,然后在此基础上确定新系统的功能。
新系统必须充分考虑今后可能的扩充和改变,不能仅仅按当前应用需求来设计数据库。
需求分析的重点是调查、收集与分析用户在数据管理中的信息要求、处理要求、安全性与完整性要求。
信息要求是指用户需要从数据库中获得信息的内容与性质。
由用户的信息要求可以导出数据要求,即在数据库中需要存储哪些数据。
处理要求是指用户要求完成什么处理功能,对处理的响应时间有什么要求,处理方式是批处理还是联机处理。
新系统的功能必须能够满足用户的信息要求、处理要求、安全性与完整性要求
需求分析的方法:
通过调查了解了用户需求后,需要进一步分析和表达用户的需求。
分析和表达用户需求的方法主要包括自顶向下和自底向上两类方法。
二、概念设计
将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计。
概念结构是对现实世界的一种抽象,即对实际的人、物、事和概念进行人为处理,抽取人们关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述。
概念结构独立于数据库逻辑结构,也独立于支持数据库的DBMS。
它是现实世界与机器世界的中介,它一方面能够充分反映现实世界,包括实体和实体之间的联系,同时又易于向关系、网状、层次等各种数据模型转换。
它是现实世界的一个真实模型,易于理解,便于和不熟悉计算机的用户交换意见,使用户易于参与,当现实世界需求改变时,概念结构又可以很容易地作相应调整。
因此概念结构设计是整个数据库设计的关键所在。
设计概念结构通常有四类方法:
1、自顶向下:
首先定义全局概念结构的框架,然后逐步细化。
2、自底向上:
首先定义各局部应用的概念结构然后将它们集成起来,得到全局概念结构。
这是最经常采用的策略是自底向上方法。
即自顶向下地进行需求分析,然后再自底向上地设计概念结构
3、逐步扩张:
首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构。
4、混合策略:
将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构
分E-R图经过合并生成的是初步E-R图。
修改、重构初步E-R图以消除冗余主要采用分析方法
视图集成后形成一个整体的数据库概念结构,对该整体概念结构还必须进行进一步验证,确保它能够满足下列条件:
整体概念结构内部必须具有一致性,即不能存在互相矛盾的表达。
整体概念结构能准确地反映原来的每个视图结构,包括属性、实体及实体间的联系
整体概念结构能满足需要分析阶段所确定的所有要求
整体概念结构最终还应该提交给用户,征求用户和有关人员的意见,进行评审、修改和优化,然后把它确定下来,作为数据库的概念结构,作为进一步设计数据库的依据。
三、逻辑设计
设计逻辑结构应该选择最适于描述与表达相应概念结构的数据模型,然后选择最合适的DBMS。
设计逻辑结构时一般要分三步进行:
将概念结构转换为一般的关系、网状、层次模型
将转化来的关系、网状、层次模型向特定DBMS支持下的数据模型转换
对数据模型进行优化
关系模型的逻辑结构是一组关系模式的集合。
而E-R图则是由实体、实体的属性和实体之间的联系三个要素组成的。
所以将E-R图转换为关系模型实际上就是要将实体、实体的属性和实体之间的联系转化为关系模式,这种转换一般遵循如下原则:
1、一个实体型转换为一个关系模式。
实体的属性就是关系的属性。
实体的码就是关系的码
2、一个m:
n联系转换为一个关系模式。
与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性。
而关系的码为各实体码的组合
3、一个1:
n联系可以转换为一个独立的关系模式,也可以与n端对应的关系模式合并。
如果转换为一个独立的关系模式,则与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,而关系的码为n端实体的码
4、一个1:
1联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并。
如果转换为一个独立的关系模式,则与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,每个实体的码均是该关系的候选码。
如果与某一端对应的关系模式合并,则需要在该关系模式的属性中加入另一个关系模式的码和联系本身的属性。
5、三个或三个以上实体间的一个多元联系转换为一个关系模式。
与该多元联系相连的各实体的码以及联系本身的属性均转换为关系的属性。
6、同一实体集的实体间的联系,即自联系,也可按上述1:
1、1:
n和m:
n三种情况分别处理。
具有相同码的关系模式可合并
数据库逻辑设计的结果不是唯一的。
为了进一步提高数据库应用系统的性能,通常以规范化理论为指导,还应该适当地修改、调整数据模型的结构,这就是数据模型的优化。
数据模型的优化方法为
1、确定数据依赖。
2、对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系。
3、按照数据依赖的理论对关系模式逐一进行分析,确定各关系模式分别属于第几范式。
4、按照需求分析阶段得到的对数据处理的要求,分析对于这样的应用环境这些模式是否合适,确定是否要对它们进行合并或分解。
5、对关系模式进行必要的分解。
四、物理设计
物理设计也分为两个部分:
物理数据库结构的选择和逻辑设计中程序模块说明的精确化。
数据库最终是要存储在物理设备上的。
为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构(存储结构与存取方法)的过程,就是数据库的物理设计。
物理结构依赖于给定的DBMS和和硬件系统,因此设计人员必须充分了解所用DBMS的内部特征,特别是存储结构和存取方法;
充分了解应用环境,特别是应用的处理频率和响应时间要求;
以及充分了解外存设备的特性。
设计数据的存取路径
在关系数据库中,选择存取路径主要是指确定如何建立索引。
例如,应把哪些域作为次码建立次索引,建立单码索引还是组合索引,建立多少个为合适,是否建立聚集索引等
确定数据的存放位置
为了提高系统性能,数据应该根据应用情况将易变部分与稳定部分、经常存取部分和存取频率较低部分分开存放
评价物理结构
数据库物理设计过程中需要对时间效率、空间效率、维护代价和各种用户要求进行权衡,其结果可以产生多种方案,数据库设计人员必须对这些方案进行细致的评价,从中选择一个较优的方案作为数据库的物理结构
五、数据库的实施
根据物理设计的结果产生一个具体的数据库和它的应用程序,并把原始数据装入数据库。
实施阶段主要有三项工作:
1、建立实际数据库结构;
2、装入试验数据对应用程序进行调试;
3、装入实据数据。
在数据库实施阶段,设计人员运用DBMS提供的数据语言及其宿主语言,根据逻辑设计和物理设计的结果建立数据库,编制与调试应用程序,组织数据入库,并进行试运行。
六、运行维护
数据库系统的正式运行,标志着数据库设计与应用开发工作的结束和维护阶段的开始。
运行和维护阶段的主要任务有四项:
(1)维护数据库的安全性与完整性;
(2)监测并改善数据库运行性能;
(3)根据用户要求对数据库现有功能进行扩充;
(4)及时改正运行中发现的系统错误。
数据库应用系统经过试运行后即可投入正式运行。
在数据库系统运行过程中必须不断地对其进行评价、调整与修改。
需要指出的是,这个设计步骤既是数据库设计的过程,也包括了数据库应用系统的设计过程。
在设计过程中把数据库的设计和对数据库中数据处理的设计紧密结合起来,将这两个方面的需求分析、抽象、设计、实现在各个阶段同时进行,相互参照,相互补充,以完善两方面的设计。
事实上,如果不了解应用环境对数据的处理要求,或没有考虑如何去实现这些处理要求,是不可能设计一个良好的数据库结构的。
数据库试运行结果符合设计目标后,数据库就可以真正投入运行了。
数据库投入运行标着开发任务的基本完成和维护工作的开始,并不意味着设计过程的终结,由于应用环境在不断变化,数据库运行过程中物理存储也会不断变化,对数据库设计进行评价、调整、修改等维护工作是一个长期的任务,也是设计工作的继续和提高。