基于xml数据交换系统研究与实现Word文件下载.docx

上传人:b****6 文档编号:20506512 上传时间:2023-01-23 格式:DOCX 页数:32 大小:393.13KB
下载 相关 举报
基于xml数据交换系统研究与实现Word文件下载.docx_第1页
第1页 / 共32页
基于xml数据交换系统研究与实现Word文件下载.docx_第2页
第2页 / 共32页
基于xml数据交换系统研究与实现Word文件下载.docx_第3页
第3页 / 共32页
基于xml数据交换系统研究与实现Word文件下载.docx_第4页
第4页 / 共32页
基于xml数据交换系统研究与实现Word文件下载.docx_第5页
第5页 / 共32页
点击查看更多>>
下载资源
资源描述

基于xml数据交换系统研究与实现Word文件下载.docx

《基于xml数据交换系统研究与实现Word文件下载.docx》由会员分享,可在线阅读,更多相关《基于xml数据交换系统研究与实现Word文件下载.docx(32页珍藏版)》请在冰豆网上搜索。

基于xml数据交换系统研究与实现Word文件下载.docx

FinallytheXMLfileprocessingobjectcompletestheXMLfileprocessing,obtainsthegoaldatabasemappingobject,storesthegoaldatabaseagainthroughHibernate.

ThissystemtakesthemiddledataformattingbytheXMLdocument,completedhasexchangedthedatabetweenthedifferentrelationsdata,achievedthegoalofdatasharing.

Keywords:

XML,RelationalDatabase,DataExchange,DTD.,XMLSchema

目录

摘要I

AbstractII

1绪论1

1.1系统研究背景1

1.2研究现状1

1.3本文研究内容2

1.4论文组织结构2

1.5本章小结3

2系统需求5

2.1关系型数据库5

2.2异构数据共享的方式5

2.3本系统的解决方案6

2.4本章小结6

3XML及其相关技术7

3.1XML语言概述7

3.1.1标记语言的概念7

3.1.2标记语言的分类7

3.1.3SGML8

3.1.4HTML9

3.1.5XML10

3.1.6SGML、HTML、XML之间的关系11

3.2XML应用12

3.3XML文件12

3.3.1规范的XML文件12

3.3.2XML三要素12

3.4XMLSchema14

3.4.1简介14

3.4.2一个XML文档及其SCHEMA的例子14

3.5本章小结17

4JAVA及其相关技术19

4.1JAVA简介19

4.1.1JAVA历史19

4.1.2JAVA特点19

4.2J2EE介绍22

4.3JAVA数据库连接(JDBC)23

4.3.1简介23

4.3.2编程接口23

4.3.3编程实例24

4.4Hibernate与Xmlbeans24

4.5本章小结25

5XML数据交换方案设计27

5.1系统开发平台和相关技术27

5.2系统设计27

5.3系统实现28

5.4数据库导出XML文档30

5.5XML文档导入数据库33

5.6模式转换33

5.7系统介绍34

5.8本章小结35

6总结与展望37

致谢38

参考文献39

1绪论

1.1系统研究背景

异构数据库分布在网络的不同位置,其异构性体现在DBMS(DatabaseManagementsystem)运行的系统环境和使用的数据模型的不同,以及用户各自独立对数据进行建模而引起的数据结构和数据语义表达的差异。

系统异构给数据库间跨网络的互操作带来困难,模型异构使得用户无法使用本地的数据库语言访问异构数据库中的数据,结构异构和语义异构则使应用系统难以理解异构数据库中的数据并对其进行分析和处理。

因此,这些异构数据库就象一个个“信息孤岛”,彼此间的共享存在困难。

数据交换是实现异构数据库共享的途径之一。

解决异构数据库的共享主要有远程访问、数据库集成、数据交换等方式,其中数据交换是用源数据库的数据格式读出所需数据,再按目标数据库的格式写入,将数据在目标数据库中冗余存储,使双方的数据互为补充,达到异构数据库共享的目的。

数据交换中数据转换质量的好坏直接影响到交换后的数据能否有效地存入目标方数据库或被目标应用系统使用。

因此,如何在数据转换过程中消除数据异构性是数据交换的一个难点问题。

此外,数据交换过程不可避免地涉及数据的请求、发送与接收等操作,又面临着系统运行环境异构带来的系统间互操作问题,所以解决系统间的互操作是数据交换的第二个难点。

最后,数据交换中数据传输的安全性也是很重要的课题。

随着Internet和电子商务的发展,企业之间的联系日趋紧密,不同系统之间的信息交流日益增多,异构数据交换技术的应用也日益广泛。

1.2研究现状

数据库的异构性导致数据共享存在困难的问题,已经引起了业界的关注,数据库厂商和软件厂商都在不断探索和研究解决的方案。

在异构数据库的数据交换方面,目前主要有以下几种技术途径:

数据库交换工具,数据库交换中间件,中间数据法。

数据库交换工具与DBMS结合紧密,运行效率高,但通用性不足,目前还没有一种工具能够适用于所有异构数据库的交换。

并且使用这些工具通常需要人工对交换过程进行初始化设置,设置工作较为繁琐。

功能完善的数据库交换中间件可以屏蔽数据的分布地点、DBMS、SQL方言/扩展、特殊的本地API等差异并对数据进行转换以用户能够接受的格式提供数据。

但是中间件技术本身比较复杂,还需配套使用应用服务器这类昂贵的软件,因此其应用成本较高。

中间数据法为数据交换提供公共的数据格式,交换双方统一使用这一数据格式的文档交换数据。

在这种方法中,交换双方各自负责实现中间数据文档与本地数据库之间的转换,无需考虑对方数据库的实现细节,可扩展性强,同时,使用文档进行数据交换的应用成本较低,所以中间数据法具有较高的通用性,得到了广泛的使用。

目前,中间数据法的数据交换主要是以XML作为中间数据格式。

XML是一种数据格式描述的元语言标准,具有系统独立性、可扩展性、自描述性、遵循严格的语法规范以及支持多语种等特点,自产生之后就迅速被作为中间数据格式标准应用到数据交换领域。

作为数据交换的中介,XML不仅能够提供对数据的存储,还包含对数据结构的描述回。

XML的系统独立性使得XML数据能够在不同的系统中使用各种编程语言解析和处理,屏蔽了异构数据库间系统环境的差异。

因此,基于XML的数据交换方案已经被广泛用于解决网络环境下异构数据库的共享。

1.3本文研究内容

基于XML的数据交换方案一般是通过定义一个XML模式,在交换过程中传输符合XML模式的数据文档实现数据交换,交换双方各自负责数据在本地关系模式与XML模式间的转换。

在进行关系数据与XML数据转换时,还需要对数据进行操作和编辑,消除数据异构性,然后才能将数据转入本地数据库或XML文档。

本文主要研究如何实现各个关系型数据库之间的信息交换。

XML是一种新型的数据交换标准,通过XML和JDBC,Hibernate,J2EE等技术的应用可以实现不同数据库间信息的交换。

为完成数据库到XML和XML到数据库之间数据的交换与传递,系统解决了XML文档结构和数据库结构之间的映射,本文主要研究XMLSchema与关系模式之间的映射,这一步采用的是Xmlbeans与Java反射机制。

还研究了基于XML的数据交换系统的设计、运行机制等。

1.4论文组织结构

全文共分为六章,其中:

第一章是绪论部分,首先简单概括了系统的开发背景,然后论述了目前国内外对数据交换的研究现状,最后根据系统背景和存在的问题提出了本系统的建设原则,并阐述了此XML数据交换的重大意义以及论文的组织结构。

第二章论述了系统的基本需求。

概述了系统的功能,也就是完成各种不同数据库之间的数据转换。

第三章论述了与XML相关的各种技术。

首先扼要概述了XML这种半结构化语言的基本特征,然后说明了XML的相关应用,XML规范,最后阐述了实现XML数据交换的重要技术XMLSCHEMA,它严格定义了XML文件的模式。

第四章论述了与JAVA相关的各种技术。

首先描述了JAVA语言的发展及其JAVA语言本身的特征与优点。

然后简单介绍了J2EE技术组成,最后介绍了实现XML数据交换的又一个关键问题:

JDBC,JAVA数据库操作与连接。

第五章详细介绍了XML数据交换的系统设计。

首先说明了如何完成XML文件导入导出数据库,接着叙述了如何在网络环境下完成异构数据库系统之间的数据交换。

第六章对研究工作进行归纳和总结。

1.5本章小结

本章首先简单概括了系统的开发背景,然后论述了目前国内外对数据交换的研究现状,最后根据系统背景和存在的问题提出了本系统的建设原则,并阐述了此XML数据交换的重大意义以及论文的组织结构。

2XML及其相关技术

2.1XML语言概述

2.1.1标记语言的概念

标记语言,用一系列约定好的标记来对电子文档进行标记,已实现对电子文档的语义、结构、及格式的定义。

标记语言是一种将文本以及文本相关的其他信息结合起来,展现出关于文档结构和数据处理细节的电脑文字编码。

与文本相关的其他信息(包括例如文本的结构和表示信息等)与原来的文本结合在一起,但是使用标记进行标识。

当今广泛使用的标记语言是超文本标记语言(HTML)和可扩展标记语言(XML)。

标记语言广泛应用于网页和网络应用程序。

标记最早用于出版业,是作者、编辑以及出版商之间用于描述出版作品的排版格式所使用的。

2.1.2标记语言的分类

一、特定标记语言

顾名思义,“特定标记语言”(SpecificMarkupLanguage)是为特殊用途而产生的标记语言。

通常都是为了“特别的应用软件”,或是为了“特别的应用用途”。

总体而言就是为了这两方向而产生特定用途的标记语

二、通用标记语言

一般来说,通用标记语言(GeneralizedMarkupLanguage),通常只描述文件里的内容及其结构,而语言本身并没有告诉我们如何“使用”它,比方说显示、扫印等工作。

要如何去应用,就要看你所使用的应用程序怎么去处理了。

也正因如此,所以通用标记语言就具有很强的“使携性”(Portable),它不受限于特别的描述方法或是特别的应用方向。

比较有名的通用标记语言有GML(GeneralizedMarkupLanguage),GML是相当流行的SGML的前辈。

2.1.3SGML

SGML(StandardGeneralizedMarkupLanguage,标准通用标记语言),是一种定义电子文档结构和描述其内容的国际标准语言,是所有电子文档标记语言的起源,早在Web发明之前SGML就已存在.

SGML是1986年出版发布的一个信息管理方面的国际标准(ISO8879)。

该标准定义独立于平台和应用的文本文档的格式、索引和链接信息,为用户提供一种类似于语法的机制,用来定义文档的结构和指示文档结构的标签。

其中Markup的含义是指插入到文档中的标记。

标记分为两种:

一种称为procedardmarkup,用来描述文档显示的样式;

另一种称为descriptivemarkup,用来描述文档中的文字的用途。

制定SGML的基本思想是把文档的内容与样式分开。

SGML规定了在文档中嵌入描述标记的标准格式,指定了描述文档结构的标准方法,目前在WEB上使用的HTML格式便是使用固定标签集的一种SGML文档。

用于SGML可以支持无数的文档结构类型,并且可以创建与特定的软硬件无关的文档,因此很容易与使用不同计算机系统的用户交换文档。

使用SGML对多媒体的创作将带来许多好处。

首先,由于其规范性,它可以使创作人员更集中于内容的创作,可提高作品的重复使用性能、可移植性能以及共享性能。

其次,由于SGML的独立性,使得它在许多场合都有用武之地。

同XML相比,定义的功能很强大,缺点是它不适用于Web数据描述,而且SGML软件价格非常昂贵。

ISO/ANSI/ECMA的一个标准,一种用来注释文本文档,提供文档片断的类型信息的规范。

SGML它从80年代初开始使用。

正如XML一样,SGML也可用于创建成千上万的置标语言,它为语法标志提供了异常强大的工具,同时具有极好的扩展性,因此在分类和索引数据中非常有用。

目前,SGML多用于科技文献和政府办公文件中。

但是,SGML非常之复杂,其复杂程度对于网络上的日常应用简直不可思议。

不仅如此,SGML非常昂贵。

还有,最关键的一点,几个主要的浏览器厂商都明确拒绝支持SGML,这无疑是SGML在网上传播遇到的最大障碍。

2.1.4HTML

HTML即超文本标记语言(HyperTextMarkupLanguage的缩写)。

它是由W3C制定出来的,最早的版本是在1993年推出的HTML1.0,而到目前我们所使用的是HTML4.0版。

它最大的魁力在于利用超链接的方式,将包含着图、文、多媒体的网页呈现在浏览器上,只要点一下超链接,就可以链接到不同的网页,而每个网页又可以相连,将整个世界的网络似乎串了起来。

HTML会如此地流行,最主要的原因在于刚好在网络刚要成长的时候,而HTML又刚好可以满足Web的需求,因为顺应了这股力量,HTML一下就变成标记语言的主流。

要知道,互联网上的网站在不停地以好几倍的速度增长,而其中比例最大的一宗就是Web网站。

HTML的优点:

一、简易性,HTML版本升级采用超集方式,从而更加灵活方便。

二、可扩展性,HTML语言的广泛应用带来了加强功能,增加标识符等要求,HTML采取子类元素的方式,为系统扩展带来保证。

三、平台无关性。

虽然PC机大行其道,但使用MAC等其他机器的大有人在,HTML可以使用在广泛的平台上,这也是WWW盛行的另一个原因。

HTML的缺陷:

一、缺少延伸的空间

这是HTML碰到的最大问题。

SGML具有可扩展性,而HTML本身就是一种规定好了的语言。

如同前面所言,它的语法简单,读者很快就可以学会它的标记,但可扩展性方面差一些.。

二、只着重于数据的显示

前面我们在介绍HTML的起源时提到过,HTML是W3C为了在Web上发展而制定的,所以,它的定位放在为了展示、表达某些信息上。

因此,在HTML的语法下,计算机无法去分辨你的数据是什么。

三、缺乏一致的规格

虽然HTML并没有平台上的问题,可是,由于HTML在制定的时候并不像SGML那么严谨,它注重在“表达”数据的能力上,所以,不同的浏览器厂商就有时会做出不同的HTML标记,那么当你使用A浏览器来观看由B浏览器厂商做出的HTML标记所写出的网页时,有些原本由B浏览器可以正确观看的网页效果,在A浏览器上却看不到了。

2.1.5XML

XML为ExtensibleMarkupLanguage的简称,即可扩展标记语言。

XML的出现就是为了要应用于各个不同的层面,可根据应用领域的不同,而以不同的方式来描述文件。

简单地说,对XML是以一种简单、标准、并可扩充的方式,将各种信息如文本、表格,甚至图形等以原始数据的方式储存。

但在储存的过程中,加入一些可供识别的标记,而凭借这些可供识别的标记,在网络上的服务器可将信息内容做进一步的处理,从而得到所需的信息。

前面曾提及的SGML,由于规范实在过于严谨以及本身具有高度的复杂性,因此根据SGML所衍生制定出的HTML便大行其道,在网络上扮演着主流的角色,但却也失去了数据内容的灵活性(Flexibility)与可重用性(Reusability);

也正同为如此,XML才诞生。

XML并非是原创的语言,它与HTML一样都是根据SGML的标准所衍生制定出来的,融合了SGML的数据兼容性与HTML的简单标记法,使得它能够提供一套简单易懂又有效率的程序语法。

XML的优点:

一、可扩展

XML虽然和HTML一样都是标记语言,但它却不像HTML只是特定应用在网页上,由于可以自由地创造新的标记来配合应用,使得XML的应用层面又有无限的延伸性,可以说是一种MetaLanguage(元语言)。

所以利用XML所具有的延伸性,不只在网络上有更多发挥空间,对其他诸如文件数据库或多媒体数据库等复杂的数据系统也提供了很好的解决方案。

二、简单易懂

XML的程序代码部是以文本来表示,不是二进制码(BinaryCode),所以利用一般的编辑器就可以编辑修改,而且表达的方式也很直观。

三、平台无关性

在目前的信息社会中,存在着各式各样的信息产品,诸如PC,MAC数据库服务器以及掌上型计算机等,各个产品间的系统更是大不相同,所以在不同性质、不同平台间的信息传递将会随着网络的不断普及而更加受到重视。

在XML尚未出现时,不同的系统间的信息要互相传递可以说是一件费时又费工的苦差事,一般来说都需要特别为系统与系统之间编写软件来使彼此的信息能够正确地传递,且若是有一天系统需要更新或是改动部分软件,那么可能会造成系统间不兼容的问题,可以说问题很多。

当XML出现之后,这个问题立刻迎刃而解了,它为不同系统之间提供了一个沟通的平台,扮演着一个信息传递的媒介。

由于XML本身简单易读,能将不同类型的文件数据,诸如文本、图片以及特殊定义的对象等标记为XML格式,所以只要在要互相传递信息的系统上都挂有XML的解析器,就可以解读经标记过的数据,得到正确的信息。

四、国际化

XML支持多语种文件与Unicode,在设计XML的一开始,设计者便考虑到,信息的流通不应该只受限于一个国家或是一块区域,且随着Internet在全世界的普及,将一份文件能够以多种不同语言来呈现,是XML必须拥有的能力,所以便将XML建立在Unicode之上。

XML与HTML的区别主要表现在以下几个方面:

1)XML是被设计用来描述数据的;

而HTML是被设计用来显示数据的。

2)XML是关于数据的语言,是关于如何描述信息的;

而HTML是关于如何显示信息的。

3)XML是可扩展的,允许用户自定义自己的标记和自己的文档结构;

在HTML中所有的标记和文档结构都是预先定义的,用户只有权利使用标准的HTML标记。

4)XML是HTML的一种补充,XML不是HTML的一种替代品。

可以使用XML来描述网站所需数据和网站的结构,而使用HTML来格式化和显示这些数据。

2.1.6SGML、HTML、XML之间的关系

SGML是一个语言模板,它可以描述其他具有具体语义的语言。

HTML是SGML的一个实例,它的DTD作为标准被固定下来,因此,HTML不能作为定义其他标记语言的元语言。

它的语言遵照SGML规范,并且定义其中每个标记的具体含义。

XML是SGML的一个精简子集,它也是一个语言模板。

严格地讲,XML还是SGML。

与HTML不同的是,XML有DTD,因而也可以作为元语言来定义其他文件系统(标记语言)。

2.2XML应用

XML是一种网络标准能够简化互连网和企业网上的数据交换,目前它已经取得了很大的进展,伴随而来的是它的应用范围也越来越大。

一般来讲,XML的应用范围可分为如下几个方面:

一、要求Web客户机在两个或多个不同的数据库之间传递信息的应用。

二、希望将Web服务器的大量处理负荷转

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 艺术

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1