XML技术论文.docx
《XML技术论文.docx》由会员分享,可在线阅读,更多相关《XML技术论文.docx(11页珍藏版)》请在冰豆网上搜索。
![XML技术论文.docx](https://file1.bdocx.com/fileroot1/2022-10/9/f47b2ff2-616a-4b69-bd62-b7003e32d28f/f47b2ff2-616a-4b69-bd62-b7003e32d28f1.gif)
XML技术论文
摘要
随着计算机和网络技术的不断发展深入XML技术的应用也将不断扩大。
由于HTML对超级链接支持不足,并缺乏空间立体描述,处理图形、图像、音频、视频等多媒体能力较弱,图文混排功能简单,不能表示多种媒体的同步关系等缺点,也影响HTML的大规模应用以及用于复杂的多媒体数据处理。
可以说XML的诞生给数据交换带来了一场革命;XML的出现是至今为止最聪明的一种符号化语言;XML成为下一代网络发展的基石。
所以说,XML的出现,使HTML存在的问题可以得到很好的解决。
关键字:
XML,优势,功能,文档的组成,工作原理,应用。
1.使用Xml的功能
1.1使用Xml的功能
XML(eXtensibleMarkupLanguage)由SGML(StandardforGeneralMarkupLanguage,通用标记语言标准)演变而来,XML并不是SGML的一种应用,而是它的子集。
XML,在许多方面都与SGML雷同。
任何用XML完成的工作同样也可以用SGMI来完成。
XML拥有SGML80%的功能,其复杂程度却只有SGML的20%。
XML能有效地在互联网上应用,因而,XML带来了在SGML中所没有的优点,而且XML能与HTML整合来描述与显示数据。
其中,Xml的功能包括:
XML把数据从HTML分离;简化数据共享;简化数据传输;简化平台的变更。
1.1.1XML把数据从HTML分离
通过XML,数据能够存储在独立的XML文件中。
这样就可以更专注于使用HTML进行布局和显示,并确保修改底层数据不再需要对HTML进行任何的改变。
通过使用几行JavaScript,就可以读取一个外部XML文件,然后更新HTML中的数据内容。
1.1.2XML简化数据共享
在真实的世界中,计算机系统和数据使用不兼容的格式来存储数据。
XML数据以纯文本格式进行存储,因此提供了一种独立于软件和硬件的数据存储方法。
让数据存储方法创建不同应用程序可以共享的数据变得更加容易。
1.1.3XML简化数据传输
通过XML,可以在不兼容的系统之间轻松地交换数据。
对开发人员来说,其中一项最费时的挑战一直是在因特网上的不
兼容系统之间交换数据。
可以通过各种不兼容的应用程序来读取数据,以XML交换数据
降低了这种复杂性。
1.1.4XML简化平台的变更
升级到新的系统(硬件或软件平台),是非常费时的。
必须转换
大量的数据,不兼容的数据经常会丢失。
而,XML数据以文本格式存储。
这使得XML在不损失数据的情况下,更容易扩展或升级到新的操作系统、新应用程序或新的浏览器。
XML使您的数据更有用。
XML独立于硬件、软件以及应用程序,XML使数据更可用,也更有用。
不同的应用程序都能够访问用户的数据,不仅仅在HTML页中,也可以从XML数据源中进行访问。
通过XML,用户的数据可供各种阅读设备使用(手持的计算机、语音设备、新闻阅读器等),还可以供盲人或其他残障人士使用。
XML用于创建新的Internet语言
很多新的Internet语言是通过XML创建的:
其中的例子包括:
XHTML-最新的HTML版本
WSDL-用于描述可用的webservice
WAP和WML-用于手持设备的标记语言
RSS-用于RSSfeed的语言
RDF和OWL-用于描述资源和本体
SMIL-用于描述针对web的多媒体
2.使用Xml文档的优势
2.1使用Xml文档的优势
Web的开始阶段是简单的网站(信息中介和信息发布的平台),随着Internet和Intranet、Extranet的快速发展而发展成为各种应用的主要平台。
Web在商业、工业、银行、财政、教育、政府等领域产生了深远影响,这得益于Web标准化、松散耦合、语言中立、平台无关性、开放性等特性的服务。
Web服务需要XML(可扩展标记语言)、SOAP(简单对象访问协议、WSDL(Web服务描述语言)和UDDL(统一描述、发现和集成协议)四大技术标准的支持[1]。
其中UDDI、SOAP和WSDL基于XML,因此XML在Web系统中占有重要位置。
XML扩展标记语言第1版XML是世界互联网协会(WorldWideWebConsortium,WSC)于1998年2月颁布。
由于XML源自标准通用标记语言SGML,XML作为一种可扩展的标记语言,目前已成为信息描述的事实标准。
因此XML可以放便地描述风险及其相关的属性,这样也就能方便地对风险进行分析,进而选用对应的策略。
许多软件提供了对XML的支持,XML可以作为不同用户的异构应用系统之间进行数据交换的标准语言,实现数据交换的透明性。
目前,因特网上安全通信的事实标准是传输层安全性(TvansportLayerSecurITy,TLS)和安全套接子层(SSL)。
TLS和SSL不具备加密交换数据的一部分和多方(不止两方)之间的安全会话,而XML涵盖了安全性需求的机制。
2.1.1XML风险描述的优势
传统的风险描述主要包括适于规范数据,较为规范数据的关系数据库描述和适宜于非规范知识的本体描述。
关系数据库不方便扩展,风险间的关系不易用二元关系表达且关系表难于设计,本体描述难度大,概念间的关系难确定且一致性差。
XML结合了关系数据库和个体描述,并有效地解决了传统风险描述的缺点。
同时,XMLSchema易于确定XML文档的格式,使得风险描述更易实施和见效。
2.1.2XML开放性的优势
XML的开放性主要指它既与平台无关,又与技术提供厂商无关。
它解决了电子数据交换(ElectronicDataInterchange,EDI)的缺点。
EDI的主要缺点是国际上对于交换数据的格式和语义没有统一标准。
尽管国际上各个国家针对不同的行业制订了用于数据交换的EDL
标准,然而一个系统为了能够和不同的行业乃至不同的国家的合作伙伴进行数据交换,不得不购买并安装多种进行数据转换的适配软件插件,更何况各个行业具体的用户在实现这些数据时会或多或少加上一些个性化的标准。
因此,利用EDI技术实现平台系统成本和复杂度都比较高。
2.1.3XML加密的优势
XML可完成加密交换数据的一部分,而TLS/SSL的处理方式只能保证通信传输过程中的数据安全,不能对不同的用户施加不同的权限来保证用户信息的安全,即TLS/SSL(TvansportLayerSecurITy/SSL)不用完成对交换数据的一部分进行加密。
XML加密可实现多方之间的安全会话,即每一方都可保持与任何通信方的安全或非安全状态,可在同一文档中交换安全或非安全的数据。
XML加密可作为SOAP协议的安全性扩展,因为SOAP协议基于XML,可以通嵌入加密了的XML数据的形式来实现在消息传输的应用层灵活采用适当的加密策略。
3.XML文档的组成
3.1XML文档的序言
XML文档的序言里包含了关于文档本身的元信息,而不是文档的内容。
它可能包含XML声明、处理指令、注释以及嵌入的DTD或模式。
3.1.1XML声明
XML文档通常都以一个XML声明开始,虽然这并不是必需的.在XML文档中,包含一个声明是好的做法,因为它可以告诉应用程序或人随后的是一段XML内容。
它还能向处理程序提供关于该文档的额外信息,比如它的字符编码类型。
如果在XML中包含声明,就必须将它置于文档的第一行。
任何内容都不能放在XML声明前面,空格也不行。
如果你不小心在声明前面放了一个空格,XML处理程序就将无法正确解析文档的内容,并且会产生错误消息。
XML声明中还可以包含一些属性,这些属性提供关于版本、编码以及文档是否独立的信息:
XML声明中的每个属性都是可选的,但是它们的顺序很重要。
如果需要包含encoding属性,那它必须出现在version属性的后面。
而standalone属性只能是声明中的最后一个属性。
3.1.2处理指令
序言中还可包含处理指令(processinginstruction,PI),它们将关于XML文档的信息传递给其他应用程序。
XML处理程序并不处理PI,而是将它们原封不动地传递给应用程序。
PI以
开始而以?
>结束。
它们通常会在序言中出现,虽然它们也可出现在XML文档内的其他地方。
XML声明也以
xml开始。
虽然看起来相似,但是还是需要记住XML声明与PI是非常不同的。
3.1.3注释
注释几乎可以出现在XML文档的任何地方。
注释并不影响XML文档的处理,通常是为了便于阅读和理解的。
在添加注释时需要遵循以下规则:
(1)注释里不能包含文本-->;
(2)注释不能包含于标签内部;
(3)元素中的开始标签或结束标签不能被注释掉;
(4)虽然大多数XML处理程序都会把注释传递给应用程序,但并不一定必须这么做。
3.1.4DTD和XML模式
DTD和XML模式提供关于XML文档内的元素和属性如何出现的规则。
也就是说,它们确定哪些元素和属性是有效的,哪些是必需的或可选的。
序言中可以包含关于XML文档的声明,也可以包含一个到外部DTD或模式的引用,或是两者都包括。
3.2XML文档元素中的段
XML文档中的数据存储在文档元素或根元素内。
这个元素包含文档中的所有其他的元素、属性、文本和CDATA,同时也可包含实体和注释。
3.2.1元素
在XML文档中,元素有很多作用,它们
(1)可以标记内容;
(2)为它们标记的内容提供一些描述;
(3)为数据的顺序和相对重要性提供信息;
(4)展示数据之间的关系。
元素包括一个开始标签、一个结束标签和内容。
内容可以是文本、子元素或是二者都有。
元素的开始标签中也可包含属性。
在元素内部可以放置注释。
一共有四类元素:
(1).空元素
如果元素中不包含任何文本,那么它就是个空元素,可以以两种方式书写。
(2).仅含文本的元素
有些元素仅含文本内容。
、和都是仅含文本的元素:(3).含其他元素的元素
一个元素可以仅包含其他的元素。
容器元素称为父(parent),被包含的元素称为子(child)。
(4).混合元素
混合元素既含有文本也含有子元素。
综上所述,元素有以下条件:
(l)元素必须含有开始标签和结束标签。
在没有内容的情况下,才可以使用省略写法;
(2)标签名称必须符合XML命名规则;
(3)元素必须正确地嵌套。
3.2.2属性
在XML文档中,提供信息的另一种方法就是在元素的开始标签中使用属性。
属性通常为它们所修饰的元素提供额外的信息。
一个元素中可以出现的属性的数量是没有限制的。
属性由名称/值对组成,其中值是包含于单引号或双引号中的。
属性的两种通常用法是转换信息格式和指定特定的格式或编码。
当元素包含属性时,常称为复合类型(complextype)元素。
在同一个元素内,可以为不同的属性分别使用双引号或单引号。
请注意,不要在同一个属性中分别使用单引号和双引号,否则文档就不是合式的了。
注意 从文字处理文档中剪切属性粘贴到XML文档中时要十分小心。
文字处理软件通常使用小引号,而这会在XML文档中引起错误。
还可以将属性改写为嵌套的子元素。
现在总结一下与属性相关的规则:
(l)属性由名称/值对组成;
(2)属性值必须封装在单引号或双引号中;
(3)属性中不能含有XML标签;
(4)属性名称必须遵循XML命名规则。
3.2.3文本
所有XML文档内部的文本都包含于开始标签和结束标签内部。
除非该文本被标记为CDATA,那么它将会被认为是XML,从而做相应的