浅析分布式数据库Word文档下载推荐.doc
《浅析分布式数据库Word文档下载推荐.doc》由会员分享,可在线阅读,更多相关《浅析分布式数据库Word文档下载推荐.doc(19页珍藏版)》请在冰豆网上搜索。
日期:
2013年6月15日
浅析分布式数据库
目录
目录 2
引言 4
分布式数据库系统概述 5
1、分布式数据库系统的定义 5
2、分布式数据库的特性 5
3、分布式数据库系统的优点 6
4、分布数数据库系统存在的问题 6
5、几种典型分布式数据库原型系统 7
分布式数据库技术发展现状 8
1、分布式数据库技术国外发展现状 8
2、分布式数据库技术国内发展现状 9
分布式数据库应用设计三个列子 10
1、分布式数据库在学生信息管理系统中的应用 10
2、分布式数据库在物流系统中的应用 10
3、分布式数据库系统在企业信息系统中的应用 13
分布式数据库系统安全分析 14
1、概念 14
2、分布式数据库安全需求分析 14
3、分布式数据库安全策略 15
分布式数据库发展趋势 17
1、分布式并发控制 17
2、P2P数据管理系统 18
3、Web数据库集成系统 18
小结 18
参考书籍 19
引言随着信息技术的飞速发展,社会经济结构、生产方式和消费结构已经发生了重大变化,这些变化深刻地影响着人民生活的方方面面。
尤其是近十年来人们对计算机的依赖性越来越强,同时也对计算机提出了更高的要求。
随着数据库在各个行业中的不断发展,各行业也对数据库提出了更高的要求,数据量也急剧增加,对于管理这些数据的复杂度也随之增加。
同时各行业部门或企业所使用的软硬件之间的差异,这给开发企业管理数据库管理软件带来了巨大的工作量,如果能够有效解决这个问题,即使用同一模块管理操作不同的数据表格,对不同的数据表格进行查询、插入、删除、修改等操作,也即对企业简单的应用实现即插即用的功能,那么就能大大地减少软件开发的维护和更新费用,缩短软件的开发周期。
分布式数据库系统的开发,降低了企业开发的成本,提高了软件使用的回报率。
当今社会已进入了信息时代,人们将越来越多的信息存储在网络中的计算机上。
如何更有效地存储、管理、共享和提取信息,越来越引起人们的关注。
集中式数据库已经不能满足人们的需求,因此分布式数据库系统应运而生,并且得到迅速发展。
分布式数据库系统的出现,有效地利用企业现有资源和网络资源。
分布式数据库系统是一个面向地理上分布而在管理上需要不同程度集中的处理系统,主要解决在计算机网络上如何进行数据的分布和处理。
由于分布式数据库有许多突出的优点,因此,分布式数据库系统可以广泛地应用于大企业,多种行业及军事国防等领域,这对建立集约型社会,加快社会主义现代化建设,将具有重要的现实意义。
本文主要对分布式数据库进行了简要介绍,分析其研究现状及安全方面的问题,并结合三个列子进一步研究分布式数据库的应用设计,最后探讨了分布式数据库的发展趋势。
分布式数据库系统概述
1、分布式数据库系统的定义
分布式数据库是地理上分散而逻辑上集中的数据库系统,具体来说是由一组数据组成的,这组数据分布在计算机网络的不同计算机上。
网络中的每个结点具有独立处理的能力,称为场地自治(Autonomous)。
它可以执行局部的应用程序。
同时,每个结点也能通过网络通信子系统执行全局的应用。
这就是说,每个场地是独立的数据库系统:
它有自己的数据库、一组终端、中央处理器、运行它自己的局部DBMS,执行局部的应用程序,具有高度的自治性。
同时又相互协作组成一个整体,这种整体性的含义是,对于用户来说,从一个分布式数据库系统的逻辑上看如同一个集中式数据库系统一样,用户可以在任何一个场地执行全局应用。
2、分布式数据库的特性
分布式数据库具有数据透明性和场地自治性。
(1)数据透明性,具体体现为分布透明性、分片透明性、复制透明性。
(2)场地自治性,具体体现为设计自治性、通信自治性、执行自治性。
3、分布式数据库系统的优点
(1)适合分布式数据管理,能够有效提高系统性能。
分布式数据库系统的结构更适合具有地理分布特性的组织或机构使用,允许分布在不同区域、不同级别的各个部门对其自身的数据实行局部控制。
(2)系统经济性和灵活性好。
与一个大型计算机支持一个大型的冀中是数据库在加一些进程和远程终端相比,由超级微型计算机或超级小型计算机支持的分布式数据库系统往往具有更高的性价比和实施灵活性。
集中式数据库系统强调的是集中式控制,而DDBS更多地强调各个场地局部DBMS的自治性,大部分的局部事务管理和控制就地解决,只有涉及其它场地数据时才通过网络作为全局事务处理。
DDBMS可以设计成不同程度的自治性,从具有充分的场地自治性到几乎完全的集中式控制。
(3)系统经可靠性高和可用性强。
由于存在冗余数据,个别场地或个别链路的故障不会导致整个系统的崩溃。
同时,系统可自动检测故障所在,并利用冗余数据恢复出故障的场地,这种检测和修复是在联机状态下完成的。
4、分布数数据库系统存在的问题
(1)系统设计复杂。
分布式数据库的分片设计和分配设计依赖于系统的应用需求,并且影响系统性能、响应速度及可能性的。
分布式数据库的查询处理优化、事务管理、故障恢复和并发控制,以及元数据管理等,都需要分布式处理。
(2)系统处理和维护复杂。
一般来说,在分布时数据库中存取数据,与集中式数据库系统相比,DDBS更复杂,为保证各场地之间的协调必须做很多额外的工作。
(3)数据的安全性和保密性较难控制。
在具有高度场地自治的分布时数据库中,不同场地的局部数据库管理员可以采用不同的安全措施,但是无法保证全局数据都是安全的。
安全性问题是分布式系统固有的问题。
因为分布式系统是通过通信网络来实现分布控制的,而通信网络本身却在保护数据的安全性和保密性方面存在弱点,数据很容易被窃取。
5、几种典型分布式数据库原型系统
(1)SDD-1DDBMS
美国计算机公司(ComputerCorporationofAmerica)研制的SDD-1项目是第一个分布式数据库管理系统的样机。
各地点由ARPANET连接,并采用叫做数据计算机的当前DBMS。
这个项目特别有助于理解分布式数据库的重要问题和对其中某些问题的解决方法。
(2)ENCOMPASS
ENCOMPASS是一种同构型分布式数据库管理系统,它是根据Tandem公司的NonStop计算机体系结构和GUARDIANOS建立起来的。
计算机的体系结构和OS两者都具有对实现分布式数据库管理系统极其有用的特性。
Tandem公司的计算机的最好的特性在于它是由几个(至
少两个)独立CPU组成,这些独立的CPU利用高吞吐量总线连接起来,共享对磁盘驱动器的访问。
因为Tandem公司的计算机的基本体系结构是分布式的,所以Guardian操作系统能在由不同CPU执行的各进程之间提供方便的通信。
各进程之间的所有通信都通过信息进行。
信息系统可使硬件各单元的分布对进程是透明的。
(3)IBMSystemR*
R*系统是在美国CA州的IBMSanJoseResearchLaboratory开发的。
它的目的是建立协同操作,却是独立的地点构成的分布式数据库系统。
每个地点支持一个关系数据库系统。
R*是R系统向分布式环境的自然扩展。
分布式数据库技术发展现状
1、分布式数据库技术国外发展现状
分布式数据库系统(DistributedDatabasesystem,简称DDBS)已有20多年的发展历史,经历了一个从产生到发展的过程,取得了长足的进步,许多技术问题被提出并得到了解决。
20世纪90年代起,DDBS己进入商品化应用阶段,当前,分布式数据库技术已经成熟并得到广泛应用。
一些数据库厂商在不断推出和改进自己的分布式数据库产品,以适应多种需要和扩大市场的占有份额。
但是,实现和建立分布式数据库系统绝对不是数据库技术与网络技术的简单结合,而是在这两种技术相互渗透和有机融合后的技术升华,它又产生了很多新的技术。
而且,分布式数据库系统虽然基于集中式数据库系统,但分布式数据库系统却有它自己的特色和理论基础。
由于数据的分布环境形成了很大的固有的技术难度,使得分布式数据库系统的应用被推迟。
至今完全遵循分布式数据库系统规则,特别是实现完全分布透明性的商用系统还很难见到。
对分布数据管理的研究有两个方面:
一是单项的研究。
比如数据的分布问题,通信问题等。
在研究一个问题时,假定其它因素是不变的,得出研究成果。
此处还要研究的是要将各种因素综合起来,研究它们的相互作用和结果。
数据库设计和更新同步之间就有密切的联系,对于更新要求,依据不同的更新同步方案,对通信系统的要求也随着不同。
因此,就要对这些因素综合地考虑。
二是对计算机网络的研究。
计算机网络技术的迅速发展,已经很大程度地影响到了数据库和分布数据库的领域。
不管是在远程网络还是局域网领域,都发生了很多的变比。
局域网和远程网之间的处理差别,必然会导致处理数据库和分布数据库问题的显然不同的一些原则和方法。
分布式数据库系统已经成为信息处理学科的重要领域,正在迅速发展之中。
2、分布式数据库技术国内发展现状
我国对分布式数据库系统的研究约在20世纪80年代初期开始,一些科研单位和高校先后建立和实现了几个各具特色的分布式数据库系统。
如由中国科学院数学研究所设计,由该所与上海科学技术大学、华东师范大学合作实现的C.POREL,武汉大学研制的WDDBS和WOODDBS,东北大学研制的DMD/FO系统等,尤其值得一提的是华中科技大学达梦数据库多媒体研究所开发的DMZ多媒体数据库,它解决了异构数据库系统实现数据的共享和透明访问的难度。
他们的工作对我国分布式数据库技术的理论研究和应用开发起到了积极的推动作用。
分布式数据库应用设计三个列子
1、分布式数据库在学生信息管理系统中的应用
(1)需求分析
学校学生信息量大,不同校区间距离可能较大,各学院分布较散。
学生信息是一个整体,而各个学院只需处理学生信息的部分,所以采用分布式数据库十分合理。
(2)概念设计
一个学生可以选择多门课程,而一门课程也可以有多个学生;
没门课程只有一个成绩,每个成绩也只对应一门课程。
(3)逻辑设计
数据模型包括学生数据、成绩数据、课程数据。
① 学生数据:
学生编号,学生姓名,学生生日,学生性别,民族,家庭住址,电话,政治面貌,简介
② 成绩数据:
学期编号,课程名称,分数
③ 课程数据:
课程名称,分数,授课老师
(4)分布设计
学校行政管理部门储存全部学生信息,各学院各自存储自己学院学生,即采用水平分片方式、非冗余设计。
2、分布式数据库在物流系统中的应用
(1)需求分析
物流企业规模大,呈现国际化、全国性、仓储分布分散的特点。
每个物流企业都有若干个子公司或相互关联的部门,虽然在业务上它们独立处理各自的数据,但彼此之间数据的交换和处理显得越来越重要并日趋频繁.所以针对顾客的个性化需求和企业区域分散性的特点,将众多物流公司整合起来,实现对物流资源的有效利用是非常有必要的。
所以为达到既要保持单个公司的独立性,又要实现分布式的信息资源共享,使物流在各公司或大型公司内