--------------------------------------------------------------
此文章打印自
Builder.com.cn。
--------------------------------------------------------------
在PHP中運(yùn)行XPath查詢
Builder.com
30/3/2005
URL:
http://www.zdnet.com.cn/developer/webdevelop/story/0,3800067013,39360703,00.htmXPath是一種可以對(duì)XML文檔中的某一部分進(jìn)行單獨(dú)處理的一種語(yǔ)言,對(duì)于XSLT轉(zhuǎn)換而言它尤其重要。XPath也可作為單獨(dú)的工具管理應(yīng)用程序中的XML數(shù)據(jù),比如網(wǎng)絡(luò)應(yīng)用程序。
微軟通過(guò)selectSingleNode() 和selectNodes()方法來(lái)提供的XPath功能,從而實(shí)現(xiàn)對(duì)DOM()節(jié)點(diǎn)和文檔的操作。然而,PHP是通過(guò)程序中的環(huán)境(context)來(lái)實(shí)現(xiàn)XPath功能的。我將舉例來(lái)說(shuō)明如何利用PHP代碼從XML文檔中抽取不同的數(shù)據(jù)片斷,并隨后解釋這些PHP代碼是如何工作的。
在這個(gè)例子中,我使用了以下的XML數(shù)據(jù)。(注意:這些代碼是在PHP 4.3.4、Windows XP和IIS 5.1條件下開發(fā)并運(yùn)行成功的。)
<?xml version="1.0"?>
<x:rootxmlns:x="http://www.someplace.com">
<x:row>
<x:dog
color="yellow">Marmaduke</x:dog>
<x:cat>Garfield</x:cat>
</x:row>
<x:row>
<x:dog color="white">Snoopy</x:dog>
<x:cat>Heathcliff</x:cat>
</x:row>
<x:row>
<x:dog color="gray">Spike</x:dog>
<x:cat>Sylvester</x:cat>
</x:row>
</x:root>
這個(gè)XML文檔包含了一些元素(element)和屬性(attribute),還有一個(gè)名域空間(namespace)的聲明,都是一些基本的XML。在示例的PHP代碼中,我們會(huì)從這個(gè)XML文檔中得到多種的查詢結(jié)果。
<?php
$sxml = ‘<?xml version="1.0"?>
<x:rootxmlns:x="http://www.someplace.com">
<x:row>
<x:dog color="yellow">Marmaduke</x:dog>
<x:cat>Garfield</x:cat>
</x:row>
<x:row>
<x:dog color="white">Snoopy</x:dog>
<x:cat>Heathcliff</x:cat>
</x:row>
<x:row>
<x:dog color="gray">Spike</x:dog>
<x:cat>Sylvester</x:cat>
</x:row>
</x:root>‘;
$xml = domxml_open_mem($sxml);
$xpc = XPath_new_context($xml);
XPath_register_ns($xpc, "x", "http://www.someplace.com");
$nodes = XPath_eval($xpc, "http://x:row/x:dog[@color=‘yellow‘]/text()");
foreach ($nodes->nodeset as $node) {
print $node->content . "\n";
}
$nodes = XPath_eval($xpc, "http://x:row/x:dog");
foreach ($nodes->nodeset as $node) {
print $xml->dump_node($node) . "\n";
}
$nodes = XPath_eval($xpc, "http://x:cat/child::text()|//x:dog[@color=‘white‘ or
@color=‘gray‘]/text()");
foreach ($nodes->nodeset as $node) {
print $node->content . "\n";
}
$xml->free();
?>
首先,創(chuàng)建一個(gè)局部變量來(lái)存儲(chǔ)XML字符串,這一信息原本可以被傳遞并成為HTTP POST請(qǐng)求的一部分,然而,我要把它包含在代碼中;下一步是要使用domxml_open_mem()來(lái)創(chuàng)建一個(gè)DOM文檔,domxml_open_mem()可以從有效的XML字符串中在內(nèi)存中創(chuàng)建一個(gè)DOM文檔對(duì)象,它只有一個(gè)參數(shù):XML字符串;另一種方法是將XML存儲(chǔ)于一個(gè)單獨(dú)的文件中,然后使用domxml_open_file()從文件中讀取XML,它也只有一個(gè)參數(shù):XML文件的文件名。
創(chuàng)建了DOM文檔對(duì)象之后,就可以通過(guò)XPath_new_context()來(lái)創(chuàng)建這一對(duì)象的XPath環(huán)境了,它只需一個(gè)參數(shù):當(dāng)前的DOM文檔對(duì)象。這一環(huán)境用于XPath表達(dá)式的運(yùn)算,如果需要的話還可以用于注冊(cè)名域空間。既然在XML中已經(jīng)包括了一個(gè)名域空間,則使用XPath_register_ns()來(lái)注冊(cè)名域空間,這樣才能在XPath查詢中使用前綴,XPath_register_ns()包括了三個(gè)參數(shù):他們分別是XPath環(huán)境、前綴和名域空間。
現(xiàn)在可以運(yùn)行XPath查詢了,可以通過(guò)XPath_eval()來(lái)實(shí)現(xiàn),它的第一參數(shù)是XPath的環(huán)境,第二參數(shù)是XPath表達(dá)式,XPath_eval()將返回一個(gè)DOM節(jié)點(diǎn)的數(shù)組,在我的代碼中,我對(duì)節(jié)點(diǎn)集合進(jìn)行單步調(diào)試,可以得到某些形式的輸出。
在第一個(gè)XPath例子中,我抓取了所有‘color’屬性等于‘yellow’,并且在x:row節(jié)點(diǎn)下的x:dog文本元素,在PHP中的XPath表達(dá)式和MSXML中的XPath有些細(xì)微的區(qū)別,我將‘/text()’部分包含在表達(dá)式中則只返回文本節(jié)點(diǎn),而在MSXML中,你需要使用‘text’屬性來(lái)訪問(wèn)文本節(jié)點(diǎn),對(duì)返回的文本節(jié)點(diǎn)使用‘content’屬性則可以取得文本節(jié)點(diǎn)的內(nèi)容。
在第二個(gè)例子中,我抓取了在x:row節(jié)點(diǎn)下的x:dog元素,然而,這次我對(duì)DOM文檔對(duì)象使用dump_node()方法來(lái)打印出具有適當(dāng)節(jié)點(diǎn)的整個(gè)XML,dump_node()接受一個(gè)參數(shù):需要轉(zhuǎn)儲(chǔ)內(nèi)容的DOM節(jié)點(diǎn)。
在最后一個(gè)例子中,我抓取了所有‘color’屬性等于’gray’的所有x:cat文本節(jié)點(diǎn)和x:dog文本節(jié)點(diǎn),我再次對(duì)節(jié)點(diǎn)集合進(jìn)行單步調(diào)試并打印出每個(gè)節(jié)點(diǎn)的內(nèi)容,最后釋放這個(gè)DOM文檔對(duì)象。