课题XPath教程Word下载.docx
《课题XPath教程Word下载.docx》由会员分享,可在线阅读,更多相关《课题XPath教程Word下载.docx(34页珍藏版)》请在冰点文库上搜索。
元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点。
XML文档是被作为节点树来对待的。
树的根被称为文档节点或者根节点。
请看下面这个XML文档:
<
?
xmlversion="
1.0"
encoding="
ISO-8859-1"
>
bookstore>
book>
<
titlelang="
en"
HarryPotter<
/title>
author>
JK.Rowling<
/author>
year>
2005<
/year>
price>
29.99<
/price>
/book>
/bookstore>
上面的XML文档中的节点例子:
(文档节点)
(元素节点)
lang="
(属性节点)
基本值(或称原子值,Atomicvalue)
基本值是无父或无子的节点。
基本值的例子:
JK.Rowling
"
项目(Item)
项目是基本值或者节点。
节点关系
父(Parent)
每个元素以及属性都有一个父。
在下面的例子中,book元素是title、author、year以及price元素的父:
title>
子(Children)
元素节点可有零个、一个或多个子。
在下面的例子中,title、author、year以及price元素都是book元素的子:
同胞(Sibling)
拥有相同的父的节点
在下面的例子中,title、author、year以及price元素都是同胞:
先辈(Ancestor)
某节点的父、父的父,等等。
在下面的例子中,title元素的先辈是book元素和bookstore元素:
后代(Descendant)
某个节点的子,子的子,等等。
在下面的例子中,bookstore的后代是book、title、author、year以及price元素:
语法
使用路径表达式来选取
XML
文档中的节点或节点集。
节点是通过沿着路径
(path)
或者步
(steps)
来选取的。
实例文档
我们将在下面的例子中使用这个XML文档。
eng"
LearningXML<
39.95<
选取节点
XPath使用路径表达式在XML文档中选取节点。
节点是通过沿着路径或者step来选取的。
下面列出了最有用的路径表达式:
表达式
描述
nodename
选取此节点的所有子节点。
/
从根节点选取。
//
从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
.
选取当前节点。
..
选取当前节点的父节点。
@
选取属性。
实例
在下面的表格中,我们已列出了一些路径表达式以及表达式的结果:
结果
bookstore
选取bookstore元素的所有子节点。
/bookstore
选取根元素bookstore。
注释:
假如路径起始于正斜杠(/),则此路径始终代表到某元素的绝对路径!
bookstore/book
选取属于bookstore的子元素的所有book元素。
//book
选取所有book子元素,而不管它们在文档中的位置。
bookstore//book
选择属于bookstore元素的后代的所有book元素,而不管它们位于bookstore之下的什么位置。
//@lang
选取名为lang的所有属性。
谓语(Predicates)
谓语用来查找某个特定的节点或者包含某个指定的值的节点。
谓语被嵌在方括号中。
在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果:
/bookstore/book[1]
选取属于bookstore子元素的第一个book元素。
/bookstore/book[last()]
选取属于bookstore子元素的最后一个book元素。
/bookstore/book[last()-1]
选取属于bookstore子元素的倒数第二个book元素。
/bookstore/book[position()<
3]
选取最前面的两个属于bookstore元素的子元素的book元素。
//title[@lang]
选取所有拥有名为lang的属性的title元素。
//title[@lang='
eng'
]
选取所有title元素,且这些元素拥有值为eng的lang属性。
/bookstore/book[price>
35.00]
选取bookstore元素的所有book元素,且其中的price元素的值须大于35.00。
35.00]/title
选取bookstore元素中的book元素的所有title元素,且其中的price元素的值须大于35.00。
选取未知节点
XPath通配符可用来选取未知的XML元素。
通配符
*
匹配任何元素节点。
@*
匹配任何属性节点。
node()
匹配任何类型的节点。
在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:
/bookstore/*
选取bookstore元素的所有子元素。
//*
选取文档中的所有元素。
//title[@*]
选取所有带有属性的title元素。
选取若干路径
通过在路径表达式中使用“|”运算符,您可以选取若干个路径。
//book/title|//book/price
选取book元素的所有title和price元素。
//title|//price
选取文档中的所有title和price元素。
/bookstore/book/title|//price
选取属于bookstore元素的book元素的所有title元素,以及文档中所有的price元素。
XPathAxes(坐标轴)
我们将在下面的例子中使用此XML文档:
轴
轴可定义相对于当前节点的节点集。
轴名称
ancestor
选取当前节点的所有先辈(父、祖父等)。
ancestor-or-self
选取当前节点的所有先辈(父、祖父等)以及当前节点本身。
attribute
选取当前节点的所有属性。
child
选取当前节点的所有子元素。
descendant
选取当前节点的所有后代元素(子、孙等)。
descendant-or-self
选取当前节点的所有后代元素(子、孙等)以及当前节点本身。
following
选取文档中当前节点的结束标签之后的所有节点。
namespace
选取当前节点的所有命名空间节点。
parent
preceding
选取文档中当前节点的开始标签之前的所有节点。
preceding-sibling
选取当前节点之前的所有同级节点。
self
位置路径表达式
位置路径可以是绝对的,也可以是相对的。
绝对路径起始于正斜杠(/),而相对路径不会这样。
在两种情况中,位置路径均包括一个或多个步,每个步均被斜杠分割:
绝对位置路径:
/step/step/...
相对位置路径:
step/step/...
每个步均根据当前节点集之中的节点来进行计算。
步(step)包括:
轴(axis)
定义所选节点与当前节点之间的树关系
节点测试(node-test)
识别某个轴内部的节点
零个或者更多谓语(predicate)
更深入地提炼所选的节点集
步的语法:
轴名称:
:
节点测试[谓语]
例子
child:
book
选取所有属于当前节点的子元素的book节点。
attribute:
lang
选取当前节点的lang属性。
text()
选取当前节点的所有文本子节点。
选取当前节点的所有子节点。
descendant:
选取当前节点的所有book后代。
ancestor:
选择当前节点的所有book先辈。
ancestor-or-self:
选取当前节点的所有book先辈以及当前节点(如果此节点是book节点)
*/child:
price
选取当前节点的所有price孙节点。
运算符
表达式可返回节点集、字符串、逻辑值以及数字。
下面列出了可用在XPath表达式中的运算符:
返回值
|
计算两个节点集
//book|//cd
返回所有拥有book和cd元素的节点集
+
加法
6+4
10
-
减法
6-4
2
乘法
6*4
24
div
除法
8div4
=
等于
price=9.80
如果price是9.80,则返回true。
如果price是9.90,则返回false。
!
不等于
price!
=9.80
如果price是9.90,则返回true。
如果price是9.80,则返回false。
小于
price<
9.80
如果price是9.00,则返回true。
小于或等于
大于
大于或等于
如果price是9.70,则返回false。
or
或
price=9.80orprice=9.70
如果price是9.50,则返回false。
and
与
9.00andprice<
9.90
如果price是8.50,则返回false。
mod
计算除法的余数
5mod2
1
在本节,让我们通过实例来学习一些基础的
语法。
XML实例文档
我们将在下面的例子中使用这个XML文档:
books.xml"
:
bookcategory="
COOKING"
EverydayItalian<
GiadaDeLaurentiis<
30.00<
CHILDREN"
WEB"
XQueryKickStart<
JamesMcGovern<
PerBothner<
KurtCagle<
JamesLinn<
VaidyanathanNagarajan<
2003<
49.99<
ErikT.Ray<
加载
文档
所有现代浏览器都支持使用XMLHttpRequest来加载XML文档的方法。
针对大多数现代浏览器的代码:
varxmlhttp=newXMLHttpRequest()
针对古老的微软浏览器(IE5和6)的代码:
varxmlhttp=newActiveXObject("
Microsoft.XMLHTTP"
)
不幸的是,InternetExplorer和其他处理XPath的方式不同。
在我们的例子中,包含适用于大多数主流浏览器的代码。
InternetExplorer使用selectNodes()方法从XML文档中的选取节点:
xmlDoc.selectNodes(xpath);
Firefox、Chrome、Opera以及Safari使用evaluate()方法从XML文档中选取节点:
xmlDoc.evaluate(xpath,xmlDoc,null,XPathResult.ANY_TYPE,null);
选取所有
title
下面的例子选取所有title节点:
/bookstore/book/title
选取第一个
book
的
下面的例子选取bookstore元素下面的第一个book节点的title:
/bookstore/book[1]/title
这里有一个问题。
上面的例子在IE和其他浏览器中输出不同的结果。
IE5以及更高版本将[0]视为第一个节点,而根据W3C的标准,应该是[1]。
为了解决IE5+中[0]和[1]的问题,可以为XPath设置语言选择(SelectionLanguage)。
xml.setProperty("
SelectionLanguage"
"
XPath"
);
xml.selectNodes("
/bookstore/book[1]/title"
选取所有价格
下面的例子选取price节点中的所有文本:
/bookstore/book/price/text()
选取价格高于
35
price
下面的例子选取价格高于35的所有price节点:
35]/price
title
下面的例子选取价格高于35的所有title节点:
35]/title
选取所有的
下面的这个例子选取了bookstore元素下所有的book节点:
xmlDoc.selectNodes("
/bookstore/book"
下面的例子仅选取bookstore元素下第一个book节点:
/bookstore/book[0]"
选取
下面的例子从所有的price节点选取文本:
/bookstore/book/price/text()"
价格
下面的例子会选取所有价格高于35的price节点:
35]/price"
下面的例子会选取所有价格高于35的title节点:
35]/title"
参考手册
XPath、XQuery
以及
函数
存取函数
名称
说明
fn:
node-name(node)
返回参数节点的节点名称。
nilled(node)
返回是否拒绝参数节点的布尔值。
data(item.item,...)
接受项目序列,并返回原子值序列。
∙fn:
base-uri()
base-uri(node)
返回当前节点或指定节点的base-uri属性的值。
document-uri(node)
返回指定节点的document-uri属性的值。
错误和跟踪函数
error()
error(error)
error(error,description)
error(error,description,error-object)
例子:
error(fn:
QName('
'
err:
toohigh'
),'
Error:
Priceistoohigh'
结果:
向外部处理环境返回以及字符串"
Priceistoohigh"
。
tr