课题XPath教程.docx
《课题XPath教程.docx》由会员分享,可在线阅读,更多相关《课题XPath教程.docx(34页珍藏版)》请在冰豆网上搜索。
![课题XPath教程.docx](https://file1.bdocx.com/fileroot1/2023-4/23/2fc2b407-4ad9-4a47-ac5d-bb707383facc/2fc2b407-4ad9-4a47-ac5d-bb707383facc1.gif)
课题XPath教程
XPath教程
XPath简介
XPath是一门在XML文档中查找信息的语言。
XPath可用来在XML文档中对元素和属性进行遍历。
XPath是W3CXSLT标准的主要元素,并且XQuery和XPointer同时被构建于XPath表达之上。
因此,对XPath的理解是很多高级XML应用的基础。
在学习之前应该具备的知识:
在您继续学习之前,应该对下面的知识有基本的了解:
∙HTML/XHTML
∙XML/XML命名空间
什么是 XPath?
∙XPath使用路径表达式在XML文档中进行导航
∙XPath包含一个标准函数库
∙XPath是XSLT中的主要元素
∙XPath是一个W3C标准
XPath 路径表达式
XPath使用路径表达式来选取XML文档中的节点或者节点集。
这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。
XPath 标准函数
XPath含有超过100个内建的函数。
这些函数用于字符串值、数值、日期和时间比较、节点和QName处理、序列处理、逻辑值等等。
XPath 在 XSLT 中使用
XPath是XSLT标准中的主要元素。
如果没有XPath方面的知识,您就无法创建XSLT文档。
XQuery和XPointer均构建于XPath表达式之上。
XQuery1.0和XPath2.0共享相同的数据模型,并支持相同的函数和运算符。
XPath 是 W3C 标准
XPath于1999年11月16日成为W3C标准。
XPath被设计为供XSLT、XPointer以及其他XML解析软件使用。
XPath 节点
在 XPath 中,有七种类型的节点:
元素、属性、文本、命名空间、处理指令、注释以及文档节点(或成为根节点)。
XPath 术语
节点(Node)
在XPath中,有七种类型的节点:
元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点。
XML文档是被作为节点树来对待的。
树的根被称为文档节点或者根节点。
请看下面这个XML文档:
xmlversion="1.0"encoding="ISO-8859-1"?
>
HarryPotter
JK.Rowling
2005
29.99
上面的XML文档中的节点例子:
(文档节点)
JK.Rowling(元素节点)
lang="en"(属性节点)
基本值(或称原子值,Atomicvalue)
基本值是无父或无子的节点。
基本值的例子:
JK.Rowling
"en"
项目(Item)
项目是基本值或者节点。
节点关系
父(Parent)
每个元素以及属性都有一个父。
在下面的例子中,book元素是title、author、year以及price元素的父:
HarryPotterJK.Rowling
2005
29.99
子(Children)
元素节点可有零个、一个或多个子。
在下面的例子中,title、author、year以及price元素都是book元素的子:
HarryPotterJK.Rowling
2005
29.99
同胞(Sibling)
拥有相同的父的节点
在下面的例子中,title、author、year以及price元素都是同胞:
HarryPotterJK.Rowling
2005
29.99
先辈(Ancestor)
某节点的父、父的父,等等。
在下面的例子中,title元素的先辈是book元素和bookstore元素:
HarryPotterJK.Rowling
2005
29.99
后代(Descendant)
某个节点的子,子的子,等等。
在下面的例子中,bookstore的后代是book、title、author、year以及price元素:
HarryPotterJK.Rowling
2005
29.99
XPath 语法
XPath 使用路径表达式来选取 XML 文档中的节点或节点集。
节点是通过沿着路径 (path) 或者步 (steps) 来选取的。
XML 实例文档
我们将在下面的例子中使用这个XML文档。
xmlversion="1.0"encoding="ISO-8859-1"?
>
HarryPotter
29.99
LearningXML
39.95
选取节点
XPath使用路径表达式在XML文档中选取节点。
节点是通过沿着路径或者step来选取的。
下面列出了最有用的路径表达式:
表达式
描述
nodename
选取此节点的所有子节点。
/
从根节点选取。
//
从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
.
选取当前节点。
..
选取当前节点的父节点。
@
选取属性。
实例
在下面的表格中,我们已列出了一些路径表达式以及表达式的结果:
路径表达式
结果
bookstore
选取bookstore元素的所有子节点。
/bookstore
选取根元素bookstore。
注释:
假如路径起始于正斜杠(/),则此路径始终代表到某元素的绝对路径!
bookstore/book
选取属于bookstore的子元素的所有book元素。
//book
选取所有book子元素,而不管它们在文档中的位置。
bookstore//book
选择属于bookstore元素的后代的所有book元素,而不管它们位于bookstore之下的什么位置。
//@lang
选取名为lang的所有属性。
谓语(Predicates)
谓语用来查找某个特定的节点或者包含某个指定的值的节点。
谓语被嵌在方括号中。
实例
在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果:
路径表达式
结果
/bookstore/book[1]
选取属于bookstore子元素的第一个book元素。
/bookstore/book[last()]
选取属于bookstore子元素的最后一个book元素。
/bookstore/book[last()-1]
选取属于bookstore子元素的倒数第二个book元素。
/bookstore/book[position()<3]
选取最前面的两个属于bookstore元素的子元素的book元素。
//title[@lang]
选取所有拥有名为lang的属性的title元素。
//title[@lang='eng']
选取所有title元素,且这些元素拥有值为eng的lang属性。
/bookstore/book[price>35.00]
选取bookstore元素的所有book元素,且其中的price元素的值须大于35.00。
/bookstore/book[price>35.00]/title
选取bookstore元素中的book元素的所有title元素,且其中的price元素的值须大于35.00。
选取未知节点
XPath通配符可用来选取未知的XML元素。
通配符
描述
*
匹配任何元素节点。
@*
匹配任何属性节点。
node()
匹配任何类型的节点。
实例
在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:
路径表达式
结果
/bookstore/*
选取bookstore元素的所有子元素。
//*
选取文档中的所有元素。
//title[@*]
选取所有带有属性的title元素。
选取若干路径
通过在路径表达式中使用“|”运算符,您可以选取若干个路径。
实例
在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:
路径表达式
结果
//book/title|//book/price
选取book元素的所有title和price元素。
//title|//price
选取文档中的所有title和price元素。
/bookstore/book/title|//price
选取属于bookstore元素的book元素的所有title元素,以及文档中所有的price元素。
XPathAxes(坐标轴)
XML 实例文档
我们将在下面的例子中使用此XML文档:
xmlversion="1.0"encoding="ISO-8859-1"?
>
HarryPotter
29.99
LearningXML
39.95
XPath 轴
轴可定义相对于当前节点的节点集。
轴名称
结果
ancestor
选取当前节点的所有先辈(父、祖父等)。
ancestor-or-self
选取当前节点的所有先辈(父、祖父等)以及当前节点本身。
attribute
选取当前节点的所有属性。
child
选取当前节点的所有子元素。
descendant
选取当前节点的所有后代元素(子、孙等)。
descendant-or-self
选取当前节点的所有后代元素(子、孙等)以及当前节点本身。
following
选取文档中当前节点的结束标签之后的所有节点。
namespace
选取当前节点的所有命名空间节点。
parent
选取当前节点的父节点。
preceding
选取文档中当前节点的开始标签之前的所有节点。
preceding-sibling
选取当前节点之前的所有同级节点。
self
选取当前节点。
位置路径表达式
位置路径可以是绝对的,也可以是相对的。
绝对路径起始于正斜杠(/),而相对路径不会这样。
在两种情况中,位置路径均包括一个或多个步,每个步均被斜杠分割:
绝对位置路径:
/step/step/...
相对位置路径:
step/step/...
每个步均根据当前节点集之中的节点来进行计算。
步(step)包括:
轴(axis)
定义所选节点与当前节点之间的树关系
节点测试(node-test)
识别某个轴内部的节点
零个或者更多谓语(predicate)
更深入地提炼所选的节点集
步的语法:
轴名称:
:
节点测试[谓语]
实例
例子
结果
child:
:
book
选取所有属于当前节点的子元素的book节点。
attribute:
:
lang
选取当前节点的lang属性。
child:
:
*
选取当前节点的所有子元素。
attribute:
:
*
选取当前节点的所有属性。
child:
:
text()
选取当前节点的所有文本子节点。
child:
:
node()
选取当前节点的所有子节点。
descendant:
:
book
选取当前节点的所有book后代。
ancestor:
:
book
选择当前节点的所有book先辈。
ancestor-or-self:
:
book
选取当前节点的所有book先辈以及当前节点(如果此节点是book节点)
child:
:
*/child:
:
price
选取当前节点的所有price孙节点。
XPath 运算符
XPath 表达式可返回节点集、字符串、逻辑值以及数字。
XPath 运算符
下面列出了可用在XPath表达式中的运算符:
运算符
描述
实例
返回值
|
计算两个节点集
//book|//cd
返回所有拥有book和cd元素的节点集
+
加法
6+4
10
-
减法
6-4
2
*
乘法
6*4
24
div
除法
8div4
2
=
等于
price=9.80
如果price是9.80,则返回true。
如果price是9.90,则返回false。
!
=
不等于
price!
=9.80
如果price是9.90,则返回true。
如果price是9.80,则返回false。
<
小于
price<9.80
如果price是9.00,则返回true。
如果price是9.90,则返回false。
<=
小于或等于
price<=9.80
如果price是9.00,则返回true。
如果price是9.90,则返回false。
>
大于
price>9.80
如果price是9.90,则返回true。
如果price是9.80,则返回false。
>=
大于或等于
price>=9.80
如果price是9.90,则返回true。
如果price是9.70,则返回false。
or
或
price=9.80orprice=9.70
如果price是9.80,则返回true。
如果price是9.50,则返回false。
and
与
price>9.00andprice<9.90
如果price是9.80,则返回true。
如果price是8.50,则返回false。
mod
计算除法的余数
5mod2
1
XPath 实例
在本节,让我们通过实例来学习一些基础的 XPath 语法。
XML实例文档
我们将在下面的例子中使用这个XML文档:
"books.xml":
xmlversion="1.0"encoding="ISO-8859-1"?
>
EverydayItalian
GiadaDeLaurentiis
2005
30.00
HarryPotter
JK.Rowling
2005
29.99
XQueryKickStart
JamesMcGovern
PerBothner
KurtCagle
JamesLinn
VaidyanathanNagarajan
2003
49.99
LearningXML
ErikT.Ray
2003
39.95
加载 XML 文档
所有现代浏览器都支持使用XMLHttpRequest来加载XML文档的方法。
针对大多数现代浏览器的代码:
varxmlhttp=newXMLHttpRequest()
针对古老的微软浏览器(IE5和6)的代码:
varxmlhttp=newActiveXObject("Microsoft.XMLHTTP")
选取节点
不幸的是,InternetExplorer和其他处理XPath的方式不同。
在我们的例子中,包含适用于大多数主流浏览器的代码。
InternetExplorer使用selectNodes()方法从XML文档中的选取节点:
xmlDoc.selectNodes(xpath);
Firefox、Chrome、Opera以及Safari使用evaluate()方法从XML文档中选取节点:
xmlDoc.evaluate(xpath,xmlDoc,null,XPathResult.ANY_TYPE,null);
选取所有 title
下面的例子选取所有title节点:
/bookstore/book/title
选取第一个 book 的 title
下面的例子选取bookstore元素下面的第一个book节点的title:
/bookstore/book[1]/title
这里有一个问题。
上面的例子在IE和其他浏览器中输出不同的结果。
IE5以及更高版本将[0]视为第一个节点,而根据W3C的标准,应该是[1]。
为了解决IE5+中[0]和[1]的问题,可以为XPath设置语言选择(SelectionLanguage)。
下面的例子选取bookstore元素下面的第一个book节点的title:
xml.setProperty("SelectionLanguage","XPath");
xml.selectNodes("/bookstore/book[1]/title");
选取所有价格
下面的例子选取price节点中的所有文本:
/bookstore/book/price/text()
选取价格高于 35 的 price 节点
下面的例子选取价格高于35的所有price节点:
/bookstore/book[price>35]/price
选取价格高于 35 的 title 节点
下面的例子选取价格高于35的所有title节点:
/bookstore/book[price>35]/title
选取所有的 book 节点
下面的这个例子选取了bookstore元素下所有的book节点:
xmlDoc.selectNodes("/bookstore/book")
选取第一个 book 节点
下面的例子仅选取bookstore元素下第一个book节点:
xmlDoc.selectNodes("/bookstore/book[0]")
选取 price
下面的例子从所有的price节点选取文本:
xmlDoc.selectNodes("/bookstore/book/price/text()")
选取价格高于 35 的 price 价格
下面的例子会选取所有价格高于35的price节点:
xmlDoc.selectNodes("/bookstore/book[price>35]/price")
选取价格高于 35 的 title 节点
下面的例子会选取所有价格高于35的title节点:
xmlDoc.selectNodes("/bookstore/book[price>35]/title")
参考手册
XPath、XQuery 以及 XSLT 函数
存取函数
名称
说明
fn:
node-name(node)
返回参数节点的节点名称。
fn:
nilled(node)
返回是否拒绝参数节点的布尔值。
fn:
data(item.item,...)
接受项目序列,并返回原子值序列。
∙fn:
base-uri()
∙fn:
base-uri(node)
返回当前节点或指定节点的base-uri属性的值。
fn:
document-uri(node)
返回指定节点的document-uri属性的值。
错误和跟踪函数
名称
说明
∙fn:
error()
∙fn:
error(error)
∙fn:
error(error,description)
∙fn:
error(error,description,error-object)
例子:
error(fn:
QName(''err:
toohigh'),'Error:
Priceistoohigh')
结果:
向外部处理环境返回以及字符串"Error:
Priceistoohigh"。
fn:
tr