基于信息空间模型的网络信息资源存储网格doc.docx

上传人:b****8 文档编号:23832979 上传时间:2023-05-21 格式:DOCX 页数:22 大小:29.09KB
下载 相关 举报
基于信息空间模型的网络信息资源存储网格doc.docx_第1页
第1页 / 共22页
基于信息空间模型的网络信息资源存储网格doc.docx_第2页
第2页 / 共22页
基于信息空间模型的网络信息资源存储网格doc.docx_第3页
第3页 / 共22页
基于信息空间模型的网络信息资源存储网格doc.docx_第4页
第4页 / 共22页
基于信息空间模型的网络信息资源存储网格doc.docx_第5页
第5页 / 共22页
点击查看更多>>
下载资源
资源描述

基于信息空间模型的网络信息资源存储网格doc.docx

《基于信息空间模型的网络信息资源存储网格doc.docx》由会员分享,可在线阅读,更多相关《基于信息空间模型的网络信息资源存储网格doc.docx(22页珍藏版)》请在冰豆网上搜索。

基于信息空间模型的网络信息资源存储网格doc.docx

基于信息空间模型的网络信息资源存储网格doc

基于信息空间模型的网络信息资源存储网格

纪利群王恒山

(上海理工大学管理学院,上海200093)

E—mail:

jilq0@163.COB

摘要随着知识管理第二阶段的到来,大多数企业中基于客户机/服务器或浏览器/月艮务器架构的知识管理系统的弊端

日益突出以指数级增长的网络信息资源及其访问量以及以同样速度递增的网络用户,极大地阻碍了人们有效地共享和

管理各种网络资源。

而现有的网络存储技术并不能有效地缓解存储压力。

因此,论文提出了基于信息空间模型的网络信

息资源存储网格方案来解决现有知识管理系统中存在的若干问题。

在系统分析了导致现有知识管理系统存在相关弊端

的根源并介绍了存储网络的相关研究后,详细介绍了信息空间模型,并在此基础上对各种网络信息资源进行了统一的、

标准化的描述。

然后给出了基于信息空间模型的网络信息资源存储网格的系统框架。

在该环境下,统一组织和描述的各

种网络信息资源分别存储在每一个分布式的网络终端,不仅有效解决了指数级增长的信息对存储容量的需求,而且能够

有效消除“信息孤岛”现象,实现了负载均衡。

而且,终端用户利用统一的语义映像能够实现对各种网络信息资源的共享

与管理.极大地提高了资源的利用效率。

基于信息空间模型的网格信息资源存储网格方案还极大地提高了系统的动态扩

展性能。

关键词网络信息资源存储网络存储网格信息空间模型

文章编号1002—8331一(2006)25—0039—05文献标识码A中图分类号C93;G203

WebInformationResourcesStorageGridBasedon

KnowledgeSpaceModel

jILi-qunWANGHeng-shan

(CollegeofManagement,UniversityofShanghaiforScienceandTechnology,Shanghai200093)

Abstract:

Withtheoncomingofthesecondstageofknowledgemanagement,thedisadvantagesofknowledge

managementsystemsbasedonthestructureofclient/serverorbrowser/serverareconstantlyemerginginmanybusiness

organizations.Webinformationresourcesaswellastheiraccessingquantitiesexponentialgrowthandchangingdemands

forstoragepreventpeoplefromefficientlyandeffectivelysharingandmanagingthem.However,thenetworkstoragecan

noteffectivelyalleviatethepressureinresources’storage.So,thispaperpresentsanewscenarioofwebinformation

storagegridbaseduponinformationspacemodeltosolvethisissue.Thispapersystematicallyanalyzesthesituationsof

knowledgemanagementsystemsexistsinmostofbusinessorganizationsandaddressestherelatedworkofnetwork

storageatfirst,andaddressestheinformationspacemodelanditsstructuringandstandardizingdescriptionsinXML,

thenpointsoutthearchitectureofthewebinformationresourcestoragegridbasedonthemode1.Insuchagrid

environment,webinformationresourcesarestoredatanyapeerclientlevel,whichnotonlymeetstheneedsofthe

storage.buteliminatesthephenomenonofinformationisolation,SOastorealizeloadbalance.Meanwhile,itallowsits

end-userstoshareandmanagewebinformationresourcesbyauniversalsemanticmapping,consequently,theefficiency

ofinformationsharingwillbegreatlyimproved.Inaddition,thescenarioisscalableanddynamicallychangeable.

Keywords:

Webinformationresources,storagenetwork,storagegrid,informationspacemodel

l引言

随着知识管理的第二阶段的到来1,许多企业的数据库或

知识库变得十分庞大,现阶段的基于客户机/服务器(client/

server,C/S)或浏览器/服务器(browser/server,B/S)结构的知识管

理系统、甚至是通过紧密耦合的网络将多个系统联系起来的分

布式知识管理网络系统的问题日益突出[21,其中最为显著的就

是资源存储瓶颈问题。

随着企业信息存量和对信息的访问量的

迅猛增长,越来越多的企业将存储看作是为其现有及待建的知

识管理系统赢得竞争优势的战略性要素。

信息存量的巨大和人

们要求在全球范围内快速访问信息的矛盾,使网络技术与存储

变革的交汇成为大势所趋。

自20世纪80年代后期C/S体系所引发的变革以来,存储

网络是计算机体系中最为重要的发展。

基于C/S体系的成功应

用.将服务器组件技术的处理能力推到了新的高度,但到20世

纪90年代,终端用户对在线信息存储容量呈指数级增长的需

求与存储容量不足的矛盾日益突出,整个存储行业以及各个数

基金项目:

上海市重点学科建设项目(编号:

"I'0502)

作者简介:

纪利群(1975一),女(汉),在读博士研究生,研究方向:

信息管理、知识管理。

王恒山(1948一),男,教授,博士生导师,主要研究方向:

信息

管理、知识管理。

计算机工程与应用2006.2539

维普资讯

据中心都在寻求新的途径以实现能够快速访问的大容量存储

的目的。

由此存储网络应运而生12]

存储网络建立了独立的基于网络的存储架构,增强了现有

C/S的计算拓扑结构,从整体上改变了上述模型。

自动化存储

网络将给企业带来敏捷性和生产效率的快速提升p】.但现有的

存储网络由于其自身的局限性,并没有最终解决网络信息资源

存储所面临的难题。

另一方面,知识管理的核心任务之一——知识共享.也要

求企业的知识管理系统能提供更好的网络存储服务。

在基于

信息空间模型的网络信息资源存储网格环境中,知识共享方式

除了C/S式共享外,还有端到端(P2P)式共享以及代理(Proxv)

式共享;网络信息资源可以存储在分布式网络的任何一个终

端,而不仅仅是服务器端,因此,有效消除了基于C/S的知识管

理系统中服务器过载和“信息孤岛”等问题;而网格可扩展特

性,使这种知识共享不仅仅局限在某一组织内部,还包括同行

业甚至是相关行业间的更广泛的网络信息资源共享.对知识管

理系统的扩展十分有利。

本文的其余部分的结构安排如下:

在第二部分,本文概括

了目前企业知识管理系统存在的弊端,并分析了导致这些弊端

产生的根源。

第三部分,论述了网络存储的相关工作,总结了目

前两种网络存储模式的优缺点。

第四部分,首先引入了信息空间

模型,并对网络信息资源进行了统一描述.在此基础上提出了基

于信息空间模型的存储网格办案。

第五部分,对全文作了总结。

2现阶段企业知识管理系统的弊端及其主要原因

分析

随着企业对知识管理越来越重视,一般企业都已建立了自

己的知识管理系统。

但是,随着知识管理的第二阶段的到来.企

业信息存量的大幅增长使企业的数据库或知识库变得十分庞

大,人们对利用和管理这些信息都变得力不从心:

另一方面.由

于人们对各种信息资源的依赖性越来越强.对共享信息的访问

量也呈指数级增长,对存储的要求也不断变化。

现阶段的基于

c/s或B/S结构的知识管理系统、甚至是通过紧密耦合的网络

将多个系统联系起来的分布式知识管理系统的弊端日益突出.

已不能满足企业的发展需求。

2.1现有知识管理系统存在的弊端

企业现有的知识管理系统存在的弊端可概括如下:

(1)信息与用户膨胀[61

通讯技术和计算机技术的迅猛发展及其在企业中的相关

应用,导致企业的信息量呈指数级增长,平均每12个月到18

个月就会扩展一倍,而现有的基于C/S或B/S架构的知识管理

系统不具备有效处理以此种速度递增的信息的能力。

与此对应

的是信息需求用户也是与日俱增。

另一方面,信息技术与通信

技术的快速发展,也加快了信息的传播速度,这又反过来推动

着企业信息存量的进一步膨胀。

(2)信息分布的不均衡性17]

目前许多企业出于自己的商业目的,采用各种相互独立的

网络系统、应用系统,在部分提高了效率的同时,这些系统之间

缺乏一个统一的用户接口,给企业间的信息访问与共享设置了

障碍。

(3)信息的非结构化阎

对大多数企业来说,结构化数据库只占到企业全部信息的

4020o6.25计算机工程与应用

10%左右,其他的90%都是数据库难以存取到的非结构化信

息。

而对于企业创新来说,这些隐藏的非结构化的数据才是真

正的创新之源。

但现有的知识管理系统很难对各种非结构化的

资源进行统一处理,因此,造成大量非结构化的资源的浪费。

(4)企业员工动态参与性差

目前,现有的知识管理系统的一个最紧迫的问题.就是如

何提高其动态参与性。

动态参与性指的是企业员工不仅能依据

工作实践中动态出现的即时需求,便捷、准确地从企业的各种

流程(如业务流、工作流、知识流等)获取有参考价值的信息.而

且也能将工作实践中新建立或修改过的信息或知识随时融合

到各种流程中,以方便流程中其他成员共享来驱动企业创新能

力的产生。

动态参与性不足主要表现在:

一方面.现有的知识管

理系统中的信息只能被静态取用,即企业中的员工只能取用预

先收集并存储在知识库中的信息,使工作实践局限于陈旧的应

用模式中。

另一方面,这些系统的维护都是封闭的,即数据库或

知识库中的信息只能由数据库或知识库管理员增删和更新.个

体员工无法随时把自己在工作实践中所积累的经验或创建的

新知识或信息及时加入到数据库或知识库中供其他人共享.导

致数据库或知识库仅包含过时的信息和不能反映工作实践的

局外人的观点。

这些不足大大限制了知识管理系统的实用化。

(5)系统的扩展性差

目前,大多数企业的知识管理系统都是基于C/S或B/S架

构,采取集中式数据处理模式,这种结构在企业信息存量持续、

大量扩充或企业规模不断扩大之后.一方面由于服务器的负载

过大,当信息访问过大或过于集中时会导致系统崩溃:

另一方

面,信息存储和信息处理过于集中,不利于负载的均衡。

这两方

面因素对知识管理系统的动态扩展十分不利.并极大地限制了

企业内部各部门之间以及企业之间的知识交流与共享以及知

识重用。

2.2产生的根源分析

(1)目前知识管理系统中的非线性性能问题

目前的知识管理系统中的非线性的性能扩展问题主要受

到两方面因素的影响。

首先是在线存储容量是否充足、可用.以

满足应用系统数据的需求,并有足够的临时存储资源,以满足

应用系统事务处理的要求。

其次,是与应用系统进行交互操作

从而访问在线存储设备以读取应用数据或向存储设备中写入

新数据的用户数量。

以下将详细讨论这两个因素

首先是在线存储的可用性问题。

若用户将要与应用系统进

行交互操作,那么与该交互操作相关的信息就应该能够被实时

地访问。

在线存储所提供的就是满足这种要求的机制

影响非线性性能扩展的第二个因素是访问应用系统的用

户数量,也可以理解为规划的数据访问量。

如图1所示,访问存

储资源的用户数量与完成每个事务所需要的时间非线性相关

处理时间

35

3O

25

2O

l5

lO

5

///—一/

5101520用户数

应用事务

图l影响应用系统性能的非线性扩展

维普资讯

(2)C/S存储模式

当今的存储配置方式体现的是分布式计算形式下C/S模

式的特征。

该存储模式为服务器组件提供了数据存储能力,也

为网络客户端提供了存储资源。

在C/S环境中.存储设备都直

接与服务器相连;对存储设备上所保持的所有数据的任何访问

操作.都必须由服务器来进行。

这种处理方式给服务器带来了

沉重的负担。

由于客户端用户需求的增长速度高于服务器能力

的提高速度.服务器很快就会达到其性能的极限。

除了客户端网络连接需求之外.随着用户需求的增长.数

据库中所存储的信息量也呈现出指数级的增长.很快就超过了

在线存储所能提供的最大容量。

而关系型数据库模型架构为了

实现其丰富的功能.也需要消耗大量额外的存储开销。

总之.由于网络上信息的发布和访问十分简单.使得来自

企业内部和外部网络中的信息以指数级增长.人们对信息的需

求也不断增加.相应地.对信息的访问量也越来越大。

C/S存储

模式在全球性的在线工作环境所带来的挑战面前已经显得捉

襟见肘。

即使有多个服务器也难以保证能为客户端的访问提供

最佳效果。

而庞大的数据库系统规模、激增的数据库事务量以

及新近出现的数据集中式的应用系统都要求存储系统具有更

为强大的配置结构。

此外.实际应用中也需要配备更多的服务

器以提供访问系统信息的能力。

这两方面的要求又导致一个新

的问题:

网络信息资源的增长速度开始分化.并且出现不均衡

的增长。

一部分服务器配备了过多的存储资源造成了浪费:

一部分服务器却处理能力不足,而造成应用服务的中断。

3相关研究

自20世纪8O年代后期C/S体系所引发的变革以来,存储

网络是计算机体系中最为重要的发展[91。

企业知识存量、用户对

数据的访问量都呈指数级增长.导致终端用户对在线数据存储

容量的需求不断加大。

然而.所有革新并没有有效应对2O世纪

9O年代以来潮水般增长的存储需求。

整个存储行业以及各个

数据中心都在寻求新的途径以实现能够快速访问的大容量存

储.存储网络应运而生。

存储网络建立了独立的基于网络的存储架构,增强了现有

C,s的计算拓扑结构,从而从整体上改变了上述模型。

存储网

络允许存储设备直接连接到现有网络上.也可以通过专门的存

储网络进行连接,这一技术给传统的存储配置方案带来了两个

重要的变化。

(1)存储网络在存储设备、服务器以及客户机之间建立了

更多的直接访问路径,从而使用户事务能够绕过大量的服务器

I/0操作而直接与数据发生联系.避免了对服务器进行不必要

的访问

(2)存储网络使得商务应用系统能够以更高的效率访问数

据。

换句话说,存储网络使得应用系统能够更方便地共享数据.

并赋予服务器更为强大的数据连接能力。

此外,存储网络能满足对来自不同数据源的大量数据(包

括结构化数据和非结构化数据)的传输、处理和存储.所有处理

的结果都被集中放置在一个固定的地点供用户访问.体现了单

一的部署策略。

更为重要的是,它极大地提高了应用系统的数

据访问的可扩展性。

存储网络代表了计算机系统中数据存储和访问方式的一

种基本典范。

与其他重大技术变革一样,存储网络带来了新的

挑战。

目前,存储网络已经分化为两种不同的模式,即网络连接

存储(NetworkAttachedStorage.NAS)和存储区域网络(Storage

AreaNetwork,SAN)。

NAS可以将存储设备从服务器上分离出来,使其直接连接

在现有的C/s网络时.建立了一种对多个应用系统提供支持的

可扩展的存储基础设施,从而提供了解决数据访问和存储挑战

的一种途径。

此外这种模式可以弥补在应用系统实施的高潮会

出现的规划缺失的问题,还能够根据商务活动的需求不断提高

存储容量。

但是在某些情况下使用NAS是不合适的,原因有两

个方面:

首先.NAS产品所使用的体系结构并不适合于那些依

赖于对存储介质进行复杂操作的应用系统。

其次.若有大量的

用户需要对数据进行频繁、持续的更新操作,就不适合使用

NAS。

代替NAS的另一种方式是SAN,它与NAS类似,可以将

存储设备连接在网络上以供多台客户机和服务器访问,所不同

的是它们实现这一功能的方式。

SAN需要在专门的网络中运

行,从而可以显著地提高吞吐量.其次在应用系统之间分配I/O

负载的方式也具有独特之处。

但是,SAN也有几方面的不利因

素。

其中最主要的问题在于,SAN本身具有异质的特性,因而具

有较高的复杂性.并需要较高的成本。

由于SAN是由若干分散

的组件配置而成121.因而配置和实施的复杂性就成了一个挑战。

总之,存储网络为IT行业所带来的价值尚未充分地转化

为对企业的现实贡献.其实施和管理上的复杂性也使得许多人

对之望而却步。

因此本文提出了基于信息空间模型的网络信息

资源存储网格方案来满足知识管理过程中的网络信息资源存

储和知识共享问题。

4基于信息空间模型的网络信息资源存储网格方案

网格研究已经成为计算机行业的热门话题[10,111.参照适用

领域,一般将网格研究分为计算网格、数据网格、信息网格、知

识网格等[12,131。

它们解决的一个共同问题是分布的、海量的资源

共享和计算,其中数据与存储虚拟化是网格计算的基础.我们

也可称为存储网格或者网格存储【141。

在介绍存储网格之前,先给出若干术语的描述:

(1)资源的内部表达模型:

是指某个资源自身所采用的描

述模型。

比如.对于一个关系数据库资源.其内部描述模型就是

关系模型;对于WebService.其服务描述是基于XML的.所以

其内部描述模型就是XML。

(2)资源的内本体(InternalOntology):

是指某个资源采用

内部表达模型描述的资源的内部数据模式.比如对于.芙系数据

库资源,就是指关系模式的定义。

(3)资源的外部表达模型:

是指某个资源对外发布时所采

用的描述模型,外部描述模型用于集成与共享。

(4)资源的外本体(ExternalOntology):

是指某个资源采用

外部表达模型描述的数据模式。

本文的指导思想是:

在不改变各种网络信息资源的内部表

达模型和和资源的内本体以及资源的物理存储位置的前提下,

主要是为各种网络信息资源建立一个统一的外部表达模型,然

后利用XML语言对统一的资源外部表达模型作统一的描述。

为各种网络信息资源建立一个统一语义映射机制,从而为网络

用户提供一个全局范围内的统一资源视图.以帮助用户实现对

各种网络信息资源的虚拟存储、资源共享与协同管理。

计算机工程与应用20o6.254l

维普资讯

4.1信息空间模型的定义

在存储网格环境下,为了给所有用户提供统一的网络信息

资源视图,方便用户发布、共享和管理各种网络信息资源.本文

引入信息空问模型对网络信息资源进行统一化、规范化和系统

化的组织和描述。

信息空问模型是参照知识空问模型建立的.它是一个三

维结构,一般可描述为IS=(信息类型,信息层次,信息存储位

置)。

前两维用来界定信息资源的内容,而第三维确定了信息资

源所存储的位置。

在信息空间中的每一个点代表某一层次、某

种类型、存储在某一位置的信息.如图2所示。

信息层次

Z

信息存

图2信息空间模型

信息类型

其中,信息类型轴是对网络信息资源进行分类,它反映了

不同领域的信息。

每一种信息类型可以分解为若干子类型,而

每一个子类型又能进一步分解为若干个更小的子类类型。

一种

信息类型与它所有的子类型构成一个信息类型的树形层次结

构。

因此信息类型轴的坐标是可以扩展的。

除了基本的子类型

外,水平轴上的每一个坐标都能向下分解为低一级的一组坐

标。

而这些低一级的坐标又可以进一步向下分解或综合到它上

一级的坐标上。

水平轴上的最顶层坐标是所有信息类型层次结

构的根。

信息层次可以分为四层:

概念层、公理层、规则层、方法层。

概念层主要提供以名词或名词性词组的形式出现的基本概念

以及他们的相关解释或定义。

公理层主要描述概念间的相互关

系,属于常识性知识范畴。

规则层则是对公理间的逻辑关系的

描述。

方法层主要提供解决问题的方法。

信息存储位置描述了网络信息资源在网络中的存储位置,

我们可以称为统一信息位置(UniversalInformationIJocati0n,

UIL),其格式可以定义为:

uR组名]/[用户名]/[属性],yl/。

中,URL是用户可以存储信息的网址。

“组名”和“用户名”是发

布该信息的个人或小组名称。

“属性”则是表明该信息的访问权

限,其取值可以是“私人的”、“小组的”或“公开的”,分别表示仅

能被其拥有者使用的信息、只能被同一小组成员所共享的信息

和能够被全局范围内所有用户共享的公开信息。

属性的缺省值

为“公开的”。

“”则表示信息内容的坐标值。

当位置维缺省

时,表示当前的网络路径。

UKL可以按照相应的URL所属的时

间区来对位置坐标进行排序。

有了信息空问模型,我们利用XML语言就能对所有网络

信息资源进行统一的组织和描述,为全局范围内的所有网络用

户提供统一的信息资源视图,方便用户共享和管理各种网络信

息资源。

4.2网络信息资源描述

知识管理系统中一般是通过信息服务模块为请求者提供

422006.25计算机工程与应用

所需的信息。

信息服务提供的信息可以是分布在网络中的任何

位置,可以由任何网络用户使用。

这就要求信息服务提供给请

求者的信息要有统一的表示形式.以便访问者能在最短的时间

内获取所需要的信息。

信息服务所提供的信息表示应该与具体

的应用平台无关。

这里与平台无关包括两层含义:

一层含义是

信息的表示与信息服务的实现平台和提供服务的环境无关:

二层含义是信息的表示可以被访问者使用的任何平台所理解,

访问者可以从任何平台(使用任何程序设计语言开发的客户端

应用)访问信息服务提供的信息。

XML逐渐成为网络数据交换

的标准,用XML格式表示信息可以消除因理解不同而带来的

歧义[16,1。

采用XML对信息空间中的任意一点的信息进行描述

如下:

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1