溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

PHP擴(kuò)展之XML解析器安裝的示例分析

發(fā)布時(shí)間:2021-09-03 10:42:20 來(lái)源:億速云 閱讀:183 作者:小新 欄目:編程語(yǔ)言

這篇文章主要介紹PHP擴(kuò)展之XML解析器安裝的示例分析,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

一、概述及安裝

XML(可擴(kuò)展標(biāo)記語(yǔ)言,eXtensible Markup Language) 是一種在互聯(lián)網(wǎng)上用于結(jié)構(gòu)化文檔交互的數(shù)據(jù)格式。 它是互聯(lián)網(wǎng)協(xié)會(huì)(W3C)定義的一個(gè)標(biāo)準(zhǔn)。與 XML 及其相關(guān)技術(shù)的信息可訪問(wèn)http://www.php.cn/。

此 PHP 擴(kuò)展實(shí)現(xiàn) 支持 James Clark 使用 PHP 編寫(xiě)的 expat。 此工具包可解析(但不能驗(yàn)證) XML 文檔。它支持 PHP 所提供的 3 種字符編碼: US-ASCII, ISO-8859-1 和 UTF-8。 不支持 UTF-16。

此擴(kuò)展可 創(chuàng)建 XML 解析器 并為不同的 XML 事件定義 處理程序(handler)。 每個(gè) XML 解析器還存在少數(shù)可以調(diào)節(jié)的參數(shù)。

此擴(kuò)展需要 libxml PHP 擴(kuò)展。這表示需要使用 --enable-libxml ,盡管這將隱式完成因?yàn)?libxml 是缺省開(kāi)啟的。

缺省情況下,此擴(kuò)展使用expat compat layer 。也可使用expat, 此庫(kù)位于 http://www.php.cn/。 使用expat庫(kù)中的 Makefile 是不會(huì)默認(rèn)構(gòu)建出庫(kù)文件的,可使用以下構(gòu)建規(guī)則進(jìn)行構(gòu)建:

libexpat.a: $(OBJS)
    ar -rc $@ $(OBJS)
    ranlib $@

expat 的源代碼 RPM 安裝包可在 http://www.php.cn/ 找到。

此擴(kuò)展默認(rèn)為啟用,編譯時(shí)可通過(guò)下列選項(xiàng)禁用: --disable-xml

這些函數(shù)默認(rèn)為有效的,使用了捆綁的 expat 庫(kù)。您可以通過(guò)參數(shù) --disable-xml 來(lái)屏蔽 XML 的支持。如果您將 PHP 編譯為 Apache 1.3.9 或更高版本的一個(gè)模塊, PHP 將自動(dòng)使用 Apache 捆綁的 expat 庫(kù)。如果您不希望使用該捆綁的 expat 庫(kù),請(qǐng)?jiān)谶\(yùn)行 PHP 的 configure 配置腳本時(shí)使用參數(shù) --with-expat-dir=DIR ,其中 DIR 應(yīng)該指向 expat 安裝的根目錄。

PHP 的 Windows 版本已內(nèi)建對(duì)此擴(kuò)展的支持。不需要載入額外的擴(kuò)展來(lái)使用這些函數(shù)。

二、事件處理器

XML 事件處理器的定義如下:

被支持的 XML 處理器
PHP 處理器函數(shù)事件描述
xml_set_element_handler()當(dāng) XML 解析器遇到開(kāi)始或結(jié)束標(biāo)簽時(shí),會(huì)觸發(fā)元素事件。 開(kāi)始標(biāo)簽和結(jié)束標(biāo)簽有不同的處理器。
xml_set_character_data_handler()字符數(shù)據(jù)范指 XML 文檔中所有非標(biāo)記的內(nèi)容,包括標(biāo)簽之間的空格。 注意,XML 解析器不會(huì)添加或刪除任何空格,由應(yīng)用程序(你)來(lái)判斷空格是否有意義。
xml_set_processing_instruction_handler()PHP 程序員必須熟練掌握處理指令(PI)。<?php ?>是處理指令, 其中php被稱為“處理指令對(duì)象”。 除所有以“XML”開(kāi)頭的處理指令對(duì)象是系統(tǒng)保留的外, 其他的處理函數(shù)均是由應(yīng)用程序指定的。
xml_set_default_handler()不執(zhí)行其他處理函數(shù),則會(huì)執(zhí)行缺省的處理函數(shù)。 在缺省的處理函數(shù)中可取得如 XML 和文檔類型聲明等信息。
xml_set_unparsed_entity_decl_handler()未解析的實(shí)體聲明(NDATA)會(huì)調(diào)用此處理函數(shù)。
xml_set_notation_decl_handler()符號(hào)聲明會(huì)調(diào)用此處理函數(shù)
xml_set_external_entity_ref_handler()當(dāng) XML 解析器發(fā)現(xiàn)對(duì)外部已解析的普通實(shí)體的引用時(shí), 會(huì)調(diào)用此處理函數(shù)。例如,引用一個(gè)文件或URL。實(shí)例可參見(jiàn) XML 外部實(shí)體例程。

三、大寫(xiě)轉(zhuǎn)換

元素處理函數(shù)可取得元素名稱轉(zhuǎn)換為 case-folded(大寫(xiě)字母)形式。 Case-folding 被定義為“將非大寫(xiě)字母替換為相對(duì)應(yīng)的大寫(xiě)字母的字符串操作”。換句話說(shuō),在 XML 中,case-folding 就是轉(zhuǎn)換為大寫(xiě)。

默認(rèn)情況下,所有的通過(guò)處理函數(shù)的元素名都被轉(zhuǎn)換為大寫(xiě)字母。每個(gè) XML 解析器可分別通過(guò) xml_parser_get_option()與xml_parser_set_option()函數(shù)來(lái)查詢與控制此項(xiàng)功能。

四、錯(cuò)誤代碼

下列常量是 XML 相關(guān)的錯(cuò)誤代碼( xml_parse()函數(shù)的返回值):

  • XML_ERROR_NONE

  • XML_ERROR_NO_MEMORY

  • XML_ERROR_SYNTAX

  • XML_ERROR_NO_ELEMENTS

  • XML_ERROR_INVALID_TOKEN

  • XML_ERROR_UNCLOSED_TOKEN

  • XML_ERROR_PARTIAL_CHAR

  • XML_ERROR_TAG_MISMATCH

  • XML_ERROR_DUPLICATE_ATTRIBUTE

  • XML_ERROR_JUNK_AFTER_DOC_ELEMENT

  • XML_ERROR_PARAM_ENTITY_REF

  • XML_ERROR_UNDEFINED_ENTITY

  • XML_ERROR_RECURSIVE_ENTITY_REF

  • XML_ERROR_ASYNC_ENTITY

  • XML_ERROR_BAD_CHAR_REF

  • XML_ERROR_BINARY_ENTITY_REF

  • XML_ERROR_ATTRIBUTE_EXTERNAL_ENTITY_REF

  • XML_ERROR_MISPLACED_XML_PI

  • XML_ERROR_UNKNOWN_ENCODING

  • XML_ERROR_INCORRECT_ENCODING

  • XML_ERROR_UNCLOSED_CDATA_SECTION

  • XML_ERROR_EXTERNAL_ENTITY_HANDLING

五、字符編碼

PHP 的 XML 擴(kuò)展通過(guò)幾種不同的字符編碼支持Unicode 字符集。 有兩類字符編碼, 原始編碼 和 目標(biāo)編碼. 在PHP的內(nèi)部展現(xiàn)中,文檔始終是使用UTF-8編碼。

當(dāng) XML 被 解析 后,原始編碼就完成了。 在創(chuàng)建 XML 解析器時(shí), 可以指定原始編碼(在XML 解析器此后的生命周期里,不能修改此編碼)。 被支持的原始編碼有 ISO-8859-1, US-ASCII 和 UTF-8. 前兩種是單字節(jié)編碼, 即每一個(gè)字符表現(xiàn)為一個(gè)字節(jié)。 UTF-8 可將字符編碼為一串不定數(shù)量(最高21)的位(bit), 排列成1到4個(gè)字節(jié)。 PHP 中使用的默認(rèn)原始編碼是ISO-8859-1.

當(dāng) PHP 將數(shù)據(jù)傳給 XML 處理函數(shù)時(shí),目標(biāo)編碼就完成了。 在創(chuàng)建 XML 處理器時(shí),目標(biāo)編碼被設(shè)定為與原始編碼相同,但可任意修改。 目標(biāo)編碼會(huì)影響字符數(shù)據(jù)及標(biāo)簽名,與處理指令目標(biāo)。

如 XML 解析器遇到原始編碼所能表示的范圍之外的字符時(shí),會(huì)返回一個(gè)錯(cuò)誤。

如 PHP 遇到在被解析的 XML 文檔中不能用所指定的目標(biāo)編碼表示的字符時(shí), 這個(gè)問(wèn)題字符會(huì)被“降級(jí)”。通常來(lái)說(shuō),就是那些字符會(huì)被替換成問(wèn)號(hào)(?)。

以上是“PHP擴(kuò)展之XML解析器安裝的示例分析”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI