对数据库当中的逻辑数据模型的个人理解Word格式文档下载.docx

资源描述

对数据库当中的逻辑数据模型的个人理解Word格式文档下载.docx

《对数据库当中的逻辑数据模型的个人理解Word格式文档下载.docx》由会员分享，可在线阅读，更多相关《对数据库当中的逻辑数据模型的个人理解Word格式文档下载.docx（10页珍藏版）》请在冰豆网上搜索。

对数据库当中的逻辑数据模型的个人理解Word格式文档下载.docx

什么是数据模型，数据库和数据模型的关系是什么，我们最常用的数据库有哪些？

近期出现的新的数据模型和以往我们使用的数据库有什么不同，现在世界上数据库数据模型的发展趋势是什么？

一、什么是数据库

数据库是依照某种数据模型组织起来并存放二级存储器中的数据集合。

这种数据集合具有如下特点：

尽可能不重复，以最优方式为某个特定组织的多种应用服务，其数据结构独立于使用它的应用程序，对数据的增、删、改和检索由统一软件进行管理和控制。

从发展的历史看，数据库是数据管理的高级阶段，它是由文件管理系统发展起来的。

数据库的基本结构分三个层次，反映了观察数据库的三种不同角度。

（1）物理数据层。

它是数据库的最内层，是物理存贮设备上实际存储的数据的集合。

这些数据是原始数据，是用户加工的对象，由内部模式描述的指令操作处理的位串、字符和字组成。

（2）概念数据层。

它是数据库的中间一层，是数据库的整体逻辑表示。

指出了每个数据的逻辑定义及数据间的逻辑联系，是存贮记录的集合。

它所涉及的是数据库所有对象的逻辑关系，而不是它们的物理情况，是数据库管理员概念下的数据库。

（3）逻辑数据层。

它是用户所看到和使用的数据库，表示了一个或一些特定用户使用的数据集合，即逻辑记录的集合。

二、数据库和数据模型有什么关系

模型的操纵部分规定了数据的添加、删除、显示、维护、打印、查找、选择、排序和更新等操作。

数据模型会影响客户端通过API对数据的操作。

不同的数据模型可能会提供或多或少的功能。

一般而言，数据模型不会直接提供过多的功能，许多功能必须由客户端自行实现。

三、常用的的数据模型

目前最常用的数据库模型是关系数据库，关系实际上就是关系模式在某一时刻的状态或内容。

也就是说，关系模式是型，关系是它的值。

关系模式是静态的、稳定的，而关系是动态的、随时间不断变化的，因为关系操作在不断地更新着数据库中的数据。

关系模型对比其他模型具有如下的优点：

（1）数据结构单一

关系模型中，不管是实体还是实体之间的联系，都用关系来表示，而关系都对应一张二维数据表，数据结构简单、清晰。

（2）关系规范化，并建立在严格的理论基础上

构成关系的基本规范要求关系中每个属性不可再分割，同时关系建立在具有坚实的理论基础的严格数学概念基础上。

（3）概念简单，操作方便

关系模型最大的优点就是简单，用户容易理解和掌握，一个关系就是一张二维表格，用户只需用简单的查询语言就能对数据库进行操作。

但是随着因特网的出现，关系数据库不能与因特网完美的融合，需要在因特网和数据库之间加入大量的中间件，这就在无形的当中加大了数据库基于网络应用的难度，在以HTTP为基础，HTML为文件格式的因特网的需求条件下，关系数据库暴露出了如下的缺点：

（1）关系数据库建立在一个严格的二维表上,在列的维度上,对于每个属性其长度和类型是事先定义并且很难扩展的;

在行的维度上,每一条记录（行为record）都不完全相同。

（2）关系数据库以二维表的方式管理数据,数据以一条条记录的方式存储,每一记录内部包括许多字段,字段名不可重复,对每一记录的每一字段具有惟一值,字段中不支持子字段。

关系数据库在数据类型上主要管理各种字符型、数值型数据,虽然后来也提供了对于一些超长文本、图像、声音等多媒体以及面向对象的扩充,但对这些数据类型的扩充仅仅停留在简单的存储与输出上,对于数据的深层次的检索或其他需求必须通过特别的开发和处理,必然对系统的效率产生负面影响。

（3）数据库最核心的技术之一就是数据的检索技术。

对于任何一个数据库系统,数据检索都是其核心内容和精髓所在,而进行数据检索之前必须建立索引。

只有建立了严密的索引,才能使数据库强大的检索功能得以发挥。

数据库索引方式的差异决定了数据库的检索方式及检索能力。

现有关系数据库支持的索引只限于单字段索引、复合索引（多字段索引）等几种方式。

对数据库的检索主要基于结构化查询语言（SQL）,用户通过构造SQL查询表达式和设置各种查询条件,实现对关系数据库的检索,因为受到关系数据库的索引限制,其数据查询能力也受到很大的限制。

（4）因特网的迅猛发展使数据库应用环境发生了巨大的变化。

以因特网为平台的Internet/Web应用向数据库领域提出了前所未有的挑战。

电子商务、Web医院、远程教育、数字图书馆、移动计算等都需要新的数据库技术支持。

由于关系数据库从一开始就没有考虑网络时代的应用需求,因而对于网络环境下应用,如各种非结构化文档信息、多媒体信息以及全文检索需求显得力不从心。

虽然后来关系数据库对于这些需求作出了一些适应性调整,但对于网络环境应用不可或缺的检索效率、全文检索能力等却无法解决。

关系数据库从设计之初并没有也不可能考虑到以HTTP为基础HTML为文件格式的因特网的需求,只是在因特网出现后才作出相应的调整,因此关系数据库在基于因特网应用时,由于结构模型等原因的限制,不能与因特网完全融合,需在Web服务器与数据库之间加入大量的中间件,从而在无形中加大了数据库基于网络应用的难度,给数据库的因特网应用带来了新的网络瓶颈,应用服务器端由于与数据库频繁交互,因其本身的效率和数据库检索的效率造成因特网应用在应用服务器端的阻塞。

四、最新的出现的数据库有哪些

在最近面对因特网的潮流大势，关系数据库模型已经不能满足人们的需求，所以一种新的数据库模型诞生，这就是非结构化数据库，

（1）非结构化数据库的二维表却不是严格的,在列的维度上,对于每个属性是可以伸展的,即属性的长度是可变的。

（2）在非结构化数据库中,字段内容是可重复的,这表现在两个方面:

一是一个字段支持重复字段,即字段在列这个级别上是可重复的;

二是在同一个字段内部允许出现不同的子字段,即字段在行级别上,内容是分层次的。

总之,对于一个字段,可以在行、列方向上有多个值,即非结构化数据库具有支持重复字段（多值）、子字段（子项）的能力。

这种能力,使得非结构化数据库可以在记录中实现二维嵌套,避免由于关系（二维表）连接导致的系统性能问题。

（3）非结构化数据库在数据类型上不仅可以支持字符型、数值型数据,而且由于其强大的外部文件支持功能,更可以支持任何文件类型,如超长文本、图像、声音等扩展型数据类型,同时,非结构化数据库对于文本、RTF、超文本文档、DOC等具有检索意义的外部文件类型还能提供强大的索引和全文检索功能。

由于有着灵活的数据结构,非结构化数据库中支持的索引方式比关系数据库要丰富得多,可以满足极其复杂检索的需要。

其中字段索引兼容关系数据库的索引,子字段索引和全文索引（英文单词索引和中文单汉字索引）是非结构化数据库的特色,非结构化数据库甚至可以支持人工标引索引,中、英文混合索引等方式。

配合非结构化数据库的格式化语言,可以对同一字段进行若干种不同的索引,以满足特殊检索的需求。

数据库系统能够提供的检索方式,是和其对数据库内容建立的索引密切相关的。

高度灵活的索引方式造就了高度灵活的检索方式,非结构化数据库对中文的全文检索效率比关系型数据库要高得多。

例如,国信贝斯软件有限公司开发的iBASE非结构化数据库目前支持8种索引方式,可以涵盖所有的关系数据库所提供的90%以上的检索方式,同时还提供了大量的关系数据库不具备的检索方式,包括简单检索、组合检索、字段检索、右截断检索、全文检索、扩展检索、相关检索（ANY词检索）、集合检索、二次顺序检索、禁用词顺序检索等。

iBASE非结构化数据库采用B3树的索引机制,定位一条记录最多限于7次定位操作。

（4）利用非结构化数据库全部基于因特网的数据库结构模型,采用网络服务器和数据库服务器紧密集成的方法,可以将目前传统数据库厂商由C/S结构扩展来的浏览器/Web服务器+应用服务器/数据库服务的三层体系结构,集成为浏览器/网上资源发布系统式的因特网计算结构,使数据库系统成为因特网的一个重要有机组成部分,实现在单一平台上融合所有数据库和应用服务器的功能。

这不仅大大减少了用户对额外硬件、中间件和其他昂贵的集成业务的需求,而且极大地缩短了用户开发和采用基于因特网应用的时间。

同时非结构化数据库还有效解决了关系型数据库在因特网应用上出现的检索效率低、全文检索能力差等弊端。

从这个意义上来说,非结构化数据库是真正的网络数据库。

（5）非结构化数据库处理的对象多为海量数据库,不仅检索功能强而且检索速度快,在检索速度方面一般不受文献量的影响。

以iBASE非结构化数据库为例,每个数据库最大记录数可达1000万条,每条记录的最大长度可达32000个汉字,每个数据库最多可有800个字段,每个字段的最大长度可达32000个汉字。

五、未来数据库的发展趋势是什么

对于未来的数据库，是关系数据库浴火重生，还是非结构化数据库一统江山，或者二者二分天下，到目前为止也是一个没有定论的事情，关系数据库面对传统数据的强大优势，和非结构化数据库对日新月异的新技术的集成性，二者在目前的数据库来说都不可缺少。

后关系时代数据库，面对信息的复杂性，处理的高效性，应用的灵活性这三个关系数据库的短板，在这里我查到了几种数据库的发展方向：

1、XML语言的出现，给数据库系统的发展开辟了新的天地，它包含下面四个重要的特性

XML语言的出现，给数据库系统的发展开辟了一片新的天地。

XML的全称是“可扩展的标识语言”。

XML有下列重要特性：

（1）、XML是一种表意而非表形的元语言。

采用不同的显示页就可以做到同一数据源却有不同途径的显示结果。

（2）、XML是Internet的标准语言，因而具有跨操作平台、跨区域的特点。

（3）、由于XML能为机器所解读，使得“服务器对服务器”的应用成为可能。

（4）、XML是一种可自我描述定义的元语言，所以它可以大量用于制定行业内及行业间数据交换的标准。

其中代表就是IBM的新一代数据库DB29，它第一次实现了关系型引擎与层次型引擎的结合，实现了混合数据库。

这种一方面在原有的系统基础上，增加对非结构化话数据的支持，实现系统无缝平稳的过渡，是用户最能接受的一种形式。

2、面对新的时代要求，有人提出了内容信息库的概念，从而却带传统的数据库，所谓“信息库”，其实就是利用一个统一的数学模型，对目前的数据库技术（DataBase）和企业内容管理系统（ecm）进行整合，从而在一个统一的平台上，有效地实现对结构化数据和非结构化数据的集中统一管理。

在IBM的访问中，认为信息库包含以下的内容

（1）、完善的系统架构

“信息库”技术需要考虑如何实现灵活高效的数据模型，如何实现完善的访问控制管理，以及如何支持大量数据的存储和上千的并发用户。

（2）、数据模型

数据模型的能力直接表现出一个平台适应用户需求的能力。

丰富元数据的模型不是一蹴而就的，这就要求一个面向客户全部信息管理的通用数据模型，以适应客户不断变化的需求。

（3）、检索查询等功能的完备。

对于“信息库”技术的最终用户来说，如何高效准确地找到自己所需要的资源是首要课题。

（4）、内容管理的API。

完整的API支持是区别“信息库”技术和一般的内容管理应用软件的重要依据。

3、而最后一种理论在我看来是十分的大胆，他们提出的概念就是让数据库消失，面对网络时代的大流，云计算的蓬勃发展，大数据步步紧逼，Web时代数据技术将向哪个方向走呢？

有一种看法是，它将向把数据本身、语义本身结构化的方向发展，不是在库这个容器中刻划出维度来处理数据，而是要对语言本身进行结构化处理，把维度内嵌到数据本身之中，这也是第三代互联网的神髓。

从研究的角度出发，Web上的信息确实就是一个数据库，一个更大、更复杂的数据库。

Web上的每一个站点就是一个数据源，每个数据源都是异构的，这就构成一个巨大的异构数据库环境。

充分利用有用的数据，对尽可能多的数据进行有效的存储、管理、分析和挖掘，这本身就是数据库技术思想的基础。

但是，用Web来取代数据库，可能在很多方面还不成熟，包括如进行数据的更新和维护，如何对数据进行保密，毕竟不是每一个用户都愿意将自己的所有数据存放在网络上。

4、通过上面三种对数据库未来潮流的讨论，实际上也就表现出了数据库在如下四个方面的革新目标：

数据库技术发展和大多数领域发展一样，必将是应用驱动和技术驱动相结合。

传统的关系数据库，由于其自身的局限性，在使用中受到了很多限制，在搜索、多媒体、企业内容管理、计算机辅助设计等方面，数据库技术几乎很少涉足，如能在以下4个方面完善数据库技术，数据库将获取更大市场。

方向1.实现非结构化数据管理

企业在信息化过程中需要处理大量报表、账单、影像、电子文档、图片、音频、视频等非机构化数据，这些数据难以用传统的关系型数据库管理。

随着XML技术的出现，数据库实现对非结构化数据的管理已经成为可能。

“如果谁能控制、支持和存储所有类型的数据，那么这样的厂商也就有能力扩展自己其他产品和服务的市场空间。

因此整合XML、对象数据、多媒体数据，将所有数据类型放在一个平台上将是传统的关系数据库发展的一大趋势。

”

不过，处理结构化数据的关系型数据库从理论到技术上经历了30多年发展，已经相当成熟，而非结构化数据的复杂程度远远高于结构化数据，所以非结构化数据的存储还存在很多有待解决的难题，比如，如何很好地解决多种异构数据源的存储和查询就是其中的关键问题。

虽然有人认为将来XML数据库将能比较好地解决非结构化数据的管理问题，但将现有文档映射到XML文档的工作才刚刚开始，XML查询语言也远不如SQL成熟。

方向2.实现对Web数据的挖掘

近年来，随着Internet技术的快速普及和迅猛发展，使各种信息可以以非常低的成本在网络上获得，由于Internet在全球互连互通，可以从中取得的数据量难以计算，而且Internet的发展趋势继续看好，特别是电子商务的蓬勃发展为网络应用提供了强大支持，如何在Internet这个全球最大的数据集合中发现有用信息无疑将成为数据挖掘研究的热点。

数据库技术应用于Web挖掘主要是为了解决Web信息的管理和查询问题。

这些问题可以分为三类：

Web信息的建模和查询；

信息抽取与集成；

Web站点建构和重构。

从数据库的观点进行Web内容挖掘主要是试图建立Web站点的数据模型并加以集成，以支持复杂查询，而不止是简单的基于关键词的搜索。

这要通过找到Web文档的模式、建立Web数据仓库或Web知识库或虚拟数据库来实现。

相关研究主要是基于半结构化数据进行的。

长期以来，由于在数据库观点下数据的表示方法比较特殊，其中包含了关系层次和图形化的数据，所以大部分建立在扁平数据集合之上的数据挖掘方法不能直接使用。

目前已经有人针对多层数据库挖掘算法进行研究。

方向3.对智能搜索技术的支撑

搜索技术是现在互联网的热门应用，不过由于速度慢和并发性差等瓶颈限制，数据库和搜索技术长期以来都是“大路朝天，各走一边”。

据陈华介绍，在目前的搜索技术中，出于速度等方面的考虑，搜索过程中很少有使用数据库工具的情况。

不过随着搜索技术对智能化要求的提高，大量的匹配信息、描述语句出现在搜索过程中，数据库技术如何配合未来的智能搜索，也逐渐被大家关注。

现代网络系统中存在大量的有用数据，例如，每天有几千万个研究。

然而，得到这些数据却非常困难。

据了解，google目前正在尝试建立一个体系结构能够支持新的关于海量Web数据的研究。

为了支持新研究，Google以压缩的形式保存了实际所抓到的文档。

Google的目标之一就是要建立一个环境使其他研究者能够很快进入这个领域，处理海量Web数据，在这样的情况下，无疑需要数据库技术来对这种系统进行有效的支持。

大型Web搜索引擎将是个非常复杂的系统，为了提高搜索效率，需要覆盖大约1亿个网页。

我们必须有一个巧妙的算法来决定哪些旧网页需要重新抓取，哪些新网页需要被抓取。

受需求驱动，用代理cache创建搜索数据库正在成为目前一个有前途的研究领域。

方向4.辅助软件工程及制造系统的应用

关系数据库技术是为传统的事务处理而开发的，如库存控制、工资、账目等。

但是人们很少将关系数据库技术用于计算机辅助设计、辅助工程、辅助软件工程及辅助制造（CAD，CAE，CASE和CAM）系统及其应用。

传统的数据库系统所支持的事务模型不适合于交互式、协作设计环境下所必须的长事务（Long-duration）。

传统的数据库系统也不提供表示和管理数据库的临时变化，包括如像模式的时间和版本变化以及变化的通报（notification）方面的一些工具。

其实，在计算机辅助设计过程中、制造过程中，会出现大量的结构信息数据，包括参数、图形、描述、表格、文档等。

有效构建相应结构信息的数据库,对所有的结构信息、载荷信息和技术资料进行合理的存储，并对这些信息资料设计专用检索程序，可以极大的优化设计工作效果。

结束语：

因为个人对数据库的知识浅薄，所以在文章中引用的大段的资料和论文，只有在最后总结的时候才表示出了自己的主要想法，在这篇论文当中，描述主要两种数据库模型，一种是关系数据库，作为传统数据库的代表，在现在已经开始显示出颓势，另一方面是在2000年左右提出的关系数据库的概念，在现在日新月异的发展。

面对新技术的需求，甲骨文、微软、IBM、谷歌都拿出了自己的理论的数据库模型，但是关键点还是在于继续对传统的关系数据库进行修补，进一步加入模块，通过最新的XML语言、云计算让关系数据库重新散发生机，还是推倒重来，让非结构化数据库成为未来的主流，毕竟在与互联网的融合程度上，非关系数据库拥有不可或缺的优势，还是更加大胆一些，放弃数据库，让WEB技术取代数据库，但是这一方面目前阻力非常大。

通过这篇论文的写作，我也对数据库有了一个更加清晰的认识，通过这篇论文，明白了以前很多感觉疑惑的事情，相信我通过以后的学习，一定可以写出一篇真正的属于自己数据库论文。

参考文献

[1]XX文库.《数据库未来技术发展方向》、《下一代数据库技术》、《数据库数据模型的发展及方向》、《数据库最新技术》

[2]XX百科.《关系数据库》、《数据库模型》.

[3]CSDN.《云计算一周热文回顾：

五大主流数据库模型》.2012年3月

[4]google.《解析全球级分布式数据库GoogleSpanner》.2012年09月19日

[5]李慧颜显森.《数据库技术发展的新方向》.武汉大学信息管理学院硕士论文.2000年11月：

287—288页

展开阅读全文