Android开发之XML文件的解析的三种方法.docx
《Android开发之XML文件的解析的三种方法.docx》由会员分享,可在线阅读,更多相关《Android开发之XML文件的解析的三种方法.docx(18页珍藏版)》请在冰豆网上搜索。
Android开发之XML文件的解析的三种方法
Android开发之XML文件的解析的三种方法
/*
*Android开发之XML文件的解析的三种方法
*
*Createdon:
2012-7-24
*Author:
blueeagle
*Email:
liujiaxiang@
*/
本文主要讲解Android开发中如何对XML文件的解析,由于XML文件具有与平台无关,广泛应用于数据通信中,因此解析XML文件就显得很有意义。
Android对XML文件解析的方法主要有3种。
通常有三种方式:
DOM、SAX和PULL,下面就分别针对这三种方式来进行讨论。
假设我们在开发天气预报应用程序的时候,使用google给我们提供的API,以及天气预报数据,例如我们要获得北京当前的天气预报数据,即可在浏览器中输入如下地址:
则可以看到一个XML文件展现在我们面前,对于此XML文件Google给我们的说明是:
“ThisXMLfiledoesnotappeartohaveanystyleinformationassociatedwithit.Thedocumenttreeisshownbelow”.即此XML文件没有任何样式信息,只有文档结构树的显示。
文件内容如下所示:
<xml_api_replyversion="1">
<weathermodule_id="0"tab_id="0"mobile_row="0"mobile_zipped="1"row="0"section="0">
<forecast_information>
<citydata="Beijing,Beijing"/>
<postal_codedata="beijing"/>
<latitude_e6data=""/>
<longitude_e6data=""/>
<forecast_datedata="2012-07-24"/>
<current_date_timedata="2012-07-2415:
30:
00+0000"/>
<unit_systemdata="SI"/>
</forecast_information>
<current_conditions>
<conditiondata="多云"/>
<temp_fdata="77"/>
<temp_cdata="25"/>
<humiditydata="湿度:
78%"/>
<icondata="/ig/images/weather/cn_cloudy.gif"/>
<wind_conditiondata="风向:
东北、风速:
2米/秒"/>
</current_conditions>
<forecast_conditions>
<day_of_weekdata="周二"/>
<lowdata="22"/>
<highdata="30"/>
<icondata="/ig/images/weather/cn_cloudy.gif"/>
<conditiondata="多云"/>
</forecast_conditions>
<forecast_conditions>
<day_of_weekdata="周三"/>
<lowdata="24"/>
<highdata="30"/>
<icondata="/ig/images/weather/chance_of_rain.gif"/>
<conditiondata="可能有雨"/>
</forecast_conditions>
<forecast_conditions>
<day_of_weekdata="周四"/>
<lowdata="25"/>
<highdata="29"/>
<icondata="/ig/images/weather/thunderstorm.gif"/>
<conditiondata="雷阵雨"/>
</forecast_conditions>
<forecast_conditions>
<day_of_weekdata="周五"/>
<lowdata="24"/>
<highdata="31"/>
<icondata="/ig/images/weather/chance_of_storm.gif"/>
<conditiondata="可能有暴风雨"/>
</forecast_conditions>
</weather>
</xml_api_reply>
那么,我们要从中获取到天气的信息,就是要对此XML文件做解析。
下面我们就分别用DOM,SAX和PULL三种方式,分别对此XML文件做解析。
DOM方式
DOM方式解析xml是先把xml文档都读到内存中,然后再用DOM
API来访问树形结构,并获取数据。
由DOM解析的方式可以知道,如果XML文件很大的时候,处理效率就会变得比较低,这也是DOM方式的一个缺点。
现在我们来解析上文中提到的有关天气预报信息相关的xml文件。
什么是解析呢?
说的通俗一点,就是将这个带标签的XML文件识别出来,并抽取一些相关的,对我们有用的信息来给我们使用。
那在这个文件里,时间,天气,温度,以及图标对我们来说是需要得到的。
我们要对其做解析。
解析的具体思路是:
1.将XML文件加载进来。
2.获取文档的根节点
3.获取文档根节点中所有子节点的列表
4.获取子节点列表中需要读取的节点信息
根据这4个步骤,我们进行开发:
首先就是如何加载XML文件,假设此文件来源于网络。
Stringurl="
DefaultHttpClientclient=newDefaultHttpClient();
HttpUriRequestreq=newHttpGet(url);
HttpResponseresp=client.execute(req);
HttpEntityent=resp.getEntity();
InputStreamstream=ent.getContent();
DocumentBuildermyDocBuilder=DocumentBuilderFactory.newInstance().newDocumentBuilder();
DocumentmyDoc=myDocBuilder.parse(newInputSource(stream));
首先创建一个DocumentBuilderFactory实例
然后加载XML文档(Document)
加载完毕以后,就要进行节点获取操作,即第二步和第三步的操作:
//找到根Element
Elementroot=document.getDocumentElement();
//找到子节点forecast_conditions
NodeListnodes=root.getElementsByTagName(forecast_conditions);
假设我需要获得该XML文件中周三的最高气温,则可以用下列代码得到:
nodes.item
(1).getChildNodes().item
(2).getAttributes().item(0).getNodeValue();nodes.item
(1)表示包含标签forecast_conditions的第二个节点,从0开始计数。
getChildNodes().item
(2)表示获取标签forecast_conditions子节点的第三个条目节点,即high节点。
.getAttributes().item(0)表示high节点的第一个属性,即data,最后的getNodeValue()表示得到此属性的属性值。
SAX方式
SAX是SimpleAPIforXML的缩写。
是一个包也可以看成是一些接口。
相比于DOM而言SAX是一种速度更快,更有效,占用内存更少的解析XML文件的方法。
它是逐行扫描,可以做到边扫描边解析,因此SAX可以在解析文档的任意时刻停止解析。
非常适用于Android等移动设备。
SAX是基于事件驱动的。
所谓事件驱动就是说,它不用解析完整个文档,在按内容顺序解析文档过程中,SAX会判断当前读到的字符是否符合XML文件语法中的某部分。
如果符合某部分,则会触发事件。
所谓触发事件,就是调用一些回调方法。
当然android的事件机制是基于回调方法的,在用SAX解析xml文档时候,在读取到文档开始和结束标签时候就会回调一个事件,在读取到其他节点与内容时候也会回调一个事件。
在SAX接口中,事件源是org.xml.sax包中的XMLReader,它通过parser()方法来解析XML文档,并产生事件。
事件处理器是org.xml.sax包中ContentHander、DTDHander、ErrorHandler,以及EntityResolver这4个接口。
这四个接口的详细说明如下:
事件处理器名称
事件处理器处理的事件
XMLReader注册方法
ContentHander
XML文档的开始与结束,
XML文档标签的开始与结束,接收字符数据,跳过实体,接收元素内容中可忽略的空白等。
setContentHandler(ContentHandlerh)
DTDHander
处理DTD解析时产生的相应事件
setDTDHandler(DTDHandlerh)
ErrorHandler
处理XML文档时产生的错误
setErrorHandler(ErrorHandlerh)
EntityResolver
处理外部实体
setEntityResolver(EntityResolvere)
我们用来做内容解析的回调方法一般都定义在ContentHandler接口中。
ContentHandler接口常用的方法:
startDocument()
当遇到文档的开头的时候,调用这个方法,可以在其中做一些预处理的工作。
endDocument()
当文档结束的时候,调用这个方法,可以在其中做一些善后的工作。
startElement(StringnamespaceURI,StringlocalName,StringqName,Attributesatts)
当读到开始标签的时候,会调用这个方法。
namespaceURI就是命名空间,localName是不带命名空间前缀的标签名,qName是带命名空间前缀的标签名。
通过atts可以得到所有的属性名和相应的值。
endElement(Stringuri,StringlocalName,Stringname)
在遇到结束标签的时候,调用这个方法。
characters(char[]ch,intstart,intlength)
这个方法用来处理在XML文件中读到的内容。
例如:
<highdata="30"/>主要目的是获取high标签中的值。
第一个参数用于存放文件的内容,后面两个参数是读到的字符串在这个数组中的起始位置和长度,使用newString(ch,start,length)就可以获取内容。
注意:
SAX的一个重要特点就是它的流式处理,当遇到一个标签的时候,它并不会纪录下之前所碰到的标签,即在startElement()方法中,所有能够知道的信息,就是标签的名字和属性,至于标签的嵌套结构,上层标签的名字,是否有子元属等等其它与结构相关的信息,都是不知道的,都需要你的程序来完成。
这使得SAX在编程处理上没有DOM方便。
现在我们截取一段XML文件来做解析,其调用方法是这样的:
<?
xmlversion="1.0"?
>---------->startDocument()
<weather>---------->startElement
<forecast_information>---------->startElement
<city>---------->startElement
beijing---------->characters
</city>---------->endElement
</forecast_information>---------->endElement
</weather>---------->startElement
文档结束---------->startDocument()
SAX的解析步骤:
首先需要注意的是:
SAX还为其制定了一个Helper类:
DefaultHandler它实现了ContentHandler这个接口,但是其所有的方法体都为空,在实现的时候,你只需要继承这个类,然后重载相应的方法即可。
使用SAX解析XML文件一般有以下五个步骤:
1、创建一个SAXParserFactory对象;
2、调用SAXParserFactory中的newSAXParser方法创建一个SAXParser对象;
3、然后在调用SAXParser中的getXMLReader方法获取一个XMLReader对象;
4、实例化一个DefaultHandler对象
5、连接事件源对象XMLReader到事件处理类DefaultHandler中
6、调用XMLReader的parse方法从输入源中获取到的xml数据
7、通过DefaultHandler返回我们需要的数据集合。
我们仍然来解析上述那个天气预报的XML文件。
编写代码如下:
mySAX.setOnClickListener(newButton.OnClickListener(){
@Override
publicvoidonClick(Viewv){
try{
Stringurl="
DefaultHttpClientclient=newDefaultHttpClient();
HttpUriRequestreq=newHttpGet(url);
HttpResponseresp=client.execute(req);
HttpEntityent=resp.getEntity();
InputStreamstream=ent.getContent();//将文件导入流,因此用InputStream
SAXParserFactorysaxFactory=SAXParserFactory.newInstance();//获取一个对象
SAXParsersaxParser=saxFactory.newSAXParser();//利用获取到的对象创建一个解析器
XMLContentHandlerhandler=newXMLContentHandler();//设置defaultHandler
saxParser.parse(stream,handler);//进行解析
stream.close();//关闭流
/*XMLReaderxmlReader=saxFactory.newSAXParser().getXMLReader();//获取一个XMLReader
xmlReader.setContentHandler(handler);
xmlReader.parse(newInputSource(stream));
stream.close();*/
}catch(Exceptione){
e.printStackTrace();
}
}
});
}
publicclassXMLContentHandlerextendsDefaultHandler{
privatestaticfinalStringTAG="XMLContentHandler";
@Override
publicvoidcharacters(char[]ch,intstart,intlength)
throwsSAXException{
Log.i(TAG,"解析内容:
"+newString(ch,start,length));
}
@Override
publicvoidendDocument()throwsSAXException{
super.endDocument();
Log.i(TAG,"文档解析完毕。
");
}
@Override
publicvoidendElement(Stringuri,StringlocalName,StringqName)
throwsSAXException{
Log.i(TAG,localName+"解析完毕");
}
@Override
publicvoidstartDocument()throwsSAXException{
Log.i(TAG,"开始解析......");
}
@Override
publicvoidstartElement(Stringuri,StringlocalName,StringqName,
Attributesattributes)throwsSAXException{
Log.i(TAG,"解析元素:
"+localName);
if(localName.equals("high")){
Log.i(TAG,"解析元素:
"+localName);
i++;
if(i==2){
highestTmp.setText(String.valueOf((Integer.parseInt(attributes.getValue(0))-32)*5/9));
}
}
}
}
上面的那段注释:
/*XMLReaderxmlReader=saxFactory.newSAXParser().getXMLReader();//获取一个XMLReader
xmlReader.setContentHandler(handler);
xmlReader.parse(newInputSource(stream));
stream.close();*/
是用XMLReader来做解析的另外一种方法。
效果是一样的。
这里可以传流,也可以传一个字符串,如下所示:
是传字符串。
xmlReader.parse(newInputSource(newStringReader(xmlStr)));
PULL方式
除了可以使用SAX和DOM解析XML文件,也可以使用Android内置的Pull解析器解析XML文件。
Pull解析器的运行方式与SAX解析器相似。
它也是事件触发的。
Pull解析方式让应用程序完全控制文档该怎么样被解析。
比如开始和结束元素事件,使用parser.next()可以进入下一个元素并触发相应事件。
通过Parser.getEventType()方法来取得事件的代码值,解析是在开始时就完成了大部分处理。
事件将作为数值代码被发送,因此可以使用一个switch对感兴趣的事件进行处理。
Pull解析是一个遍历文档的过程,每次调用next(),nextTag(),nextToken()和nextText()都会向前推进文档,并使Parser停留在某些事件上面,但是不能倒退。
然后把文档设置给Parser。
Android中对Pull方法提供了支持的API,主要是
org.xmlpull.v1.XmlPullParser;
org.xmlpull.v1.XmlPullParserFactory;
二个类,其中主要使用的是XmlPullParser,XmlPullParserFactory是一个工厂,用于构建XmlPullParser对象。
应用程序通过调用XmlPullParser.next()等方法来产生Event,然后再处理Event。
我们仍然拿上述天气预报的XML文件的一部分来做例子。
例如:
需要解析的XML文件是:
<forecast_conditions>
<day_of_weekdata="周三"/>
<lowdata="22"/>
<highdata=&q