XML解析的三种方法.docx

资源描述

XML解析的三种方法.docx

《XML解析的三种方法.docx》由会员分享，可在线阅读，更多相关《XML解析的三种方法.docx（11页珍藏版）》请在冰豆网上搜索。

XML解析的三种方法.docx

XML解析的三种方法

三种解析XML文件的方法

在Android平台上可以使用SimpleAPIforXML（SAX）、DocumentObjectModel（DOM）和Android附带的pull解析器解析XML文件。

下面是本例子要解析的XML文件：

文件名称：

china.xml

xmlversion="1.0"encoding="UTF-8"?

liming

zhangxiaoxiao

例子定义了一个javabean用于存放上面解析出来的xml内容，这个javabean为Person，代码：

--------------------------------------------------------------

publicclassPerson{

privateIntegerid;

privateStringname;

privateShortage;

publicIntegergetId（）{

returnid;

}

publicvoidsetId（Integerid）{

this.id=id;

}

publicStringgetName（）{

returnname;

}

publicvoidsetName（Stringname）{

this.name=name;

}

publicShortgetAge（）{

returnage;

}

publicvoidsetAge（Shortage）{

this.age=age;

}

--------------------------------------------------------------

使用SAX读取XML文件

SAX是一个解析速度快并且占用内存少的xml解析器，非常适合用于Android等移动设备。

SAX解析XML文件采用的是事件驱动，也就是说，它并不需要解析完整个文档，在按内容顺序解析文档的过程中，SAX会判断当前读到的字符是否合法XML语法中的某部分，如果符合就会触发事件。

所谓事件，其实就是一些回调（callback）方法，这些方法（事件）定义在ContentHandler接口。

下面是一些ContentHandler接口常用的方法：

startDocument（）

当遇到文档的开头的时候，调用这个方法，可以在其中做一些预处理的工作。

endDocument（）

和上面的方法相对应，当文档结束的时候，调用这个方法，可以在其中做一些善后的工作。

startElement（StringnamespaceURI,StringlocalName,StringqName,Attributesatts）

当读到一个开始标签的时候，会触发这个方法。

namespaceURI就是命名空间，localName是不带命名空间前缀的标签名，qName是带命名空间前缀的标签名。

通过atts可以得到所有的属性名和相应的值。

要注意的是SAX中一个重要的特点就是它的流式处理，当遇到一个标签的时候，它并不会纪录下以前所碰到的标签，也就是说，在startElement（）方法中，所有你所知道的信息，就是标签的名字和属性，至于标签的嵌套结构，上层标签的名字，是否有子元属等等其它与结构相关的信息，都是不得而知的，都需要你的程序来完成。

这使得SAX在编程处理上没有DOM来得那么方便。

endElement（Stringuri,StringlocalName,Stringname）

这个方法和上面的方法相对应，在遇到结束标签的时候，调用这个方法。

characters（char[]ch,intstart,intlength）

这个方法用来处理在XML文件中读到的内容，第一个参数为文件的字符串内容，后面两个参数是读到的字符串在这个数组中的起始位置和长度，使用newString（ch,start,length）就可以获取内容。

下面是SAX事件的说明：

-------------------------------------------------------------

xmlversion="1.0"encoding="UTF-8"?

李明

李向梅

解析china.xml触发的事件为：

读到的标签及内容触发事件

{文档开始}startDocument（）

startElement（,"persons",null,"{Attributes}"）

"\n\t"characters（"...","12","2"）

startElement（,"person",null,"{Attributes}"）

"\n\t\t"characters（"...","31","3"）

startElement（,"name",null,"{Attributes}"）

"李明"characters（"...","40","2"）

endElement（"","name",null）

"\n\t\t"characters（"...","50","3"）

startElement（,"age",null,"{Attributes}"）

"30"characters（"...","58","2"）

endElement（"","age",null）

"\n\t"characters（"...","67","2"）

endElement（"","person",null）

"\n\t"characters（"...","79","2"）

startElement（,"person",null,"{Attributes}"）

"\n\t\t"characters（"...","98","3"）

startElement（,"name",null,"{Attributes}"）

"李向梅"characters（"...","107","3"）

endElement（"","name",null）

"\n\t\t"characters（"...","118","3"）

startElement（,"age",null,"{Attributes}"）

"25"characters（"...","126","2"）

endElement（"","age",null）

"\n\t"characters（"...","135","2"）

endElement（"","person",null）

"\n"characters（"...","147","1"）

endElement（"","persons",null）

{文档结束}endDocument（）

--------------------------------------------------------------

只要为SAX提供实现ContentHandler接口的类，那么该类就可以得到通知事件（实际上就是SAX调用了该类中的回调方法）。

因为ContentHandler是一个接口，在使用的时候可能会有些不方便，因此，SAX还为其制定了一个Helper类：

DefaultHandler，它实现了ContentHandler接口，但是其所有的方法体都为空，在实现的时候，你只需要继承这个类，然后重写相应的方法即可。

使用SAX解析itcast.xml的代码如下：

publicstaticListreadXML（InputStreaminStream）{

try{

SAXParserFactoryspf=SAXParserFactory.newInstance（）;

SAXParsersaxParser=spf.newSAXParser（）;//创建解析器

//设置解析器的相关特性，http:

//xml.org/sax/features/namespaces=true表示开启命名空间特性

//saxParser.setProperty（"http:

//xml.org/sax/features/namespaces",true）;

XMLContentHandlerhandler=newXMLContentHandler（）;

saxParser.parse（inStream,handler）;

inStream.close（）;

returnhandler.getPersons（）;

}catch（Exceptione）{

e.printStackTrace（）;

}

returnnull;

}

SAX支持已内置到JDK1.5中，无需添加任何的jar文件。

关于XMLContentHandler的代码实现：

--------------------------------------------------------------

importjava.util.ArrayList;

importjava.util.List;

importorg.xml.sax.Attributes;

importorg.xml.sax.SAXException;

importorg.xml.sax.helpers.DefaultHandler;

importcn.android.xml.domain.Person;

publicclassXMLContentHandlerextendsDefaultHandler {

privateListpersons=null;

privatePersoncurrentPerson;

privateStringtagName=null;//当前解析的元素标签

publicListgetPersons（）{

returnpersons;

}

*接收文档的开始的通知。

@Override

publicvoidstartDocument（）throwsSAXException{

persons=newArrayList（）;

}

*接收字符数据的通知。

@Override

publicvoidcharacters（char[]ch,intstart,intlength）throwsSAXException{

if（tagName!

=null）{

Stringdata=newString（ch,start,length）;

if（tagName.equals（"name"））{

this.currentPerson.setName（data）;

}elseif（tagName.equals（"age"））{

this.currentPerson.setAge（Short.parseShort（data））;

}

*接收元素开始的通知。

*参数意义如下：

*namespaceURI：

元素的命名空间

*localName：

元素的本地名称（不带前缀）

*qName：

元素的限定名（带前缀）

*atts：

元素的属性集合

@Override

publicvoidstartElement（StringnamespaceURI,StringlocalName,StringqName,Attributesatts）throwsSAXException{

if（localName.equals（"person"））{

currentPerson=newPerson（）;

currentPerson.setId（Integer.parseInt（atts.getValue（"id"）））;

}

this.tagName=localName;

}

*接收文档的结尾的通知。

*参数意义如下：

*uri：

元素的命名空间

*localName：

元素的本地名称（不带前缀）

*name：

元素的限定名（带前缀）

@Override

publicvoidendElement（Stringuri,StringlocalName,Stringname）throwsSAXException{

if（localName.equals（"person"））{

persons.add（currentPerson）;

currentPerson=null;

}

this.tagName=null;

}

使用DOM读取XML文件

除了使用SAX可以解析XML文件，大家也可以使用熟悉的DOM来解析XML文件。

DOM解析XML文件时，会将XML文件的所有内容以文档树方式存放在内存中，然后允许您使用DOMAPI遍历XML树、检索所需的数据。

使用DOM操作XML的代码看起来是比较直观的，并且在编码方面比基于SAX的实现更加简单。

但是，因为DOM需要将XML文件的所有内容以文档树方式存放在内存中，所以内存的消耗比较大，特别对于运行Android的移动设备来说，因为设备的资源比较宝贵，所以建议还是采用SAX来解析XML文件，当然，如果XML文件的内容比较小采用DOM也是可行的。

代码：

--------------------------------------------------------------

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;

import org.w3c.dom.Element;

import org.w3c.dom.Node;

import org.w3c.dom.NodeList;

import cn.android.xml.domain.Person;

/**

* 使用Dom解析xml文件

public class DomXMLReader {

publicstaticListreadXML（InputStreaminStream）{

Listpersons=newArrayList（）;

DocumentBuilderFactoryfactory=DocumentBuilderFactory.newInstance（）;

try{

//得到第一个person节点

ElementpersonNode=（Element）items.item（i）;

//获取person节点的id属性值

person.setId（newInteger（personNode.getAttribute（"id"）））;

//获取person节点下的所有子节点（标签之间的空白节点和name/age元素）

NodeListchildsNodes=personNode.getChildNodes（）;

for（intj=0;j

Nodenode=（Node）childsNodes.item（j）; //判断是否为元素类型

if（node.getNodeType（）==Node.ELEMENT_NODE）{

ElementchildNode=（Element）node;

//判断是否name元素

if（"name".equals（childNode.getNodeName（）））{

//获取name元素下Text节点,然后从Text节点获取数据

person.setName（childNode.getFirstChild（）.getNodeValue（））;

}elseif（“age”.equals（childNode.getNodeName（）））{

person.setAge（newShort（childNode.getFirstChild（）.getNodeValue（）））;

}

persons.add（person）;

}

inStream.close（）;

}catch（Exceptione）{

e.printStackTrace（）;

}

returnpersons;

}

除了可以使用SAX或DOM解析XML文件之外，大家也可以使用Android内置的Pull解析器解析XML文件。

Pull解析器是一个开源的java项目，既可以用于android，也可以用于JavaEE。

如果用在javaEE需要把其jar文件放入类路径中，因为Android已经集成进了Pull解析器，所以无需添加任何jar文件。

android系统本身使用到的各种xml文件，其内部也是采用Pull解析器进行解析的。

Pull解析器的运行方式与SAX解析器相似。

它提供了类似的事件，如：

开始元素和结束元素事件，使用parser.next（）可以进入下一个元素并触发相应事件。

跟SAX不同的是，Pull解析器产生的事件是一个数字，而非方法，因此可以使用一个switch对感兴趣的事件进行处理。

当元素开始解析时，调用parser.nextText（）方法可以获取下一个Text类型节点的值。

使用Pull解析器读取china.xml的代码：

import org.xmlpull.v1.XmlPullParser;

import android.util.Xml;

import cn.android.xml.domain.Person;

public class PullXMLReader {

public static List readXML（InputStream inStream） {

XmlPullParser parser = Xml.newPullParser（）;

try {

parser.setInput（inStream, "UTF-8"）;

int eventType = parser.getEventType（）;

Person currentPerson = null;

List persons = null;

while （eventType !

= XmlPullParser.END_DOCUMENT） {

switch （eventType） {

case XmlPullParser.START_DOCUMENT:

//文档开始事件,可以进行数据初始化处理

persons = new ArrayList（）;

break;

case XmlPullParser.START_TAG:

//开始元素事件

String name = parser.getName（）;

if （name.equalsIgnoreCase（"person"）） {

currentPerson = new Person（）;

currentPerson.setId（new Integer（parser.getAttributeValue（null, "id"）））;

} else if （currentPerson !

= null） {

if （name.equalsIgnoreCase（"name"）） {

currentPerson.set

展开阅读全文