溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

XML解析方法詳解

發(fā)布時(shí)間:2020-07-30 12:10:44 來源:網(wǎng)絡(luò) 閱讀:2649 作者:honzhang 欄目:軟件技術(shù)

今日目標(biāo):DOM、 SAX、 STAX、 XML解析API

今日重點(diǎn):JAXP DOM解析 、JAXP SAX解析、XML PULL解析。

XML現(xiàn)在已成為一種通用的數(shù)據(jù)交換格式,平臺(tái)的無關(guān)性使得很多場(chǎng)合都需要用到XML。深入了解前端知識(shí)更能充分解決自動(dòng)化的異常類問題。

 一、

1、XML有三種解析方式:DOM SAX STAX

2、XML的作用(企業(yè)應(yīng)用):存儲(chǔ)數(shù)據(jù)、配置文件、傳輸數(shù)據(jù)。

 存儲(chǔ)和傳輸數(shù)據(jù)經(jīng)常一起使用,XML數(shù)據(jù)通常由程序生成的,用程序解析XML(XML一般不加約束)

 配置文件單獨(dú)使用(通常會(huì)加約束)

3、DOM

 全稱為:Document Object Model文檔對(duì)象模型。

 DOM的解析思想 :將整個(gè)XML數(shù)據(jù)讀取到內(nèi)存中,在內(nèi)存中形成文檔樹形結(jié)構(gòu),

 對(duì)內(nèi)存中文檔樹形結(jié)構(gòu)進(jìn)行操作。

 優(yōu)點(diǎn):API簡(jiǎn)單。因?yàn)橐淮涡约虞d整個(gè)文檔,文檔所有數(shù)據(jù)都在內(nèi)存中,所以簡(jiǎn)便易用 處理

 較方便??深l繁修改XML文件內(nèi)容(即可回寫)。

 缺點(diǎn):需將整個(gè)XML文檔加載到內(nèi)存,消耗系統(tǒng)資源。速度較慢。當(dāng)XML文檔過大時(shí),會(huì)導(dǎo)致

      無法全部加載進(jìn)內(nèi)存,內(nèi)存溢出問題。

**DOM是官方提供的XML解析標(biāo)準(zhǔn),由W3C制定 。

4、SAX

 全稱為:Simple API for XMl簡(jiǎn)單XML解析API。

 SAX解析思想:為解析器綁定回調(diào)程序Handler , 解析器讀取xml文件,觸發(fā)相應(yīng)事件,

 自動(dòng)調(diào)用handler中對(duì)應(yīng)事件方法

 優(yōu)點(diǎn):SAX是輕量級(jí)的接口,解析速度快,無須占用太多內(nèi)存資源。

 缺點(diǎn):SAX每次都要從頭到尾遍歷節(jié)點(diǎn),修改不易實(shí)現(xiàn)。編程復(fù)雜,如在內(nèi)存中不保留讀取的數(shù)據(jù),將無法回寫。

      注:如果SAX、STAX在內(nèi)存中邊讀邊保存數(shù)據(jù)的話 ,就類似于DOM了。

**SAX是民間XML解析標(biāo)準(zhǔn),來自XML社區(qū)。

**采用“推”模式,PUSH。

5、STAX

 全稱是:Streaming API for XML ,XML解析流API。

 STAX解析思想 :提高SAX模式解析效率。亦為邊讀邊處理。

**采用“拉”模式,PULL。

*****以上三種解析方式:性能比較::STAX >SAX >DOM

6、什么是推模式?什么是拉模式?

PUSH:是以服務(wù)器為主,控制操作流程模式。

  當(dāng)你將文檔和處理程序 交給解析器,解析器自動(dòng)進(jìn)行解析,調(diào)用相應(yīng)事件處理方法 (該過程不由你自己控制)。

  服務(wù)器主動(dòng)向客戶端發(fā)送信息,發(fā)送過程中客戶端不能干預(yù) 。

PULL:是以客戶端為主,控制操作流程模式。


********

JAXP: 

 全稱是Java API for XML Processing。

 它是一套API。DOM、SAX、STAX只是XML的解析思想。JAXP是DOM、SAX、STAX的API具體實(shí)現(xiàn)。

 由SUN提供 ,在JDK 6.0以后全面支持DOM、SAX、STAX三種解析方式。

XML PULL:拉模式解析XML框架,內(nèi)置集成Android手機(jī)內(nèi)部 。

DOM4J:DOM解析方式框架,開源。在企業(yè)端JavaEE 軟件開發(fā)中。為最流行開發(fā)框架。

javax.xml核心xml解析API,是DOM、SAX、STAX公用API。

org.w3c.dom 與DOM解析相關(guān)具體API

org.xml.sax 與SAX解析相關(guān)具體API


整個(gè)XML會(huì)被解析為樹形結(jié)構(gòu),元素、屬性、文本,都會(huì)被解析為 Node節(jié)點(diǎn) 。

********

7、DOM解析入門:

(一)

(1)創(chuàng)建解析器工廠

 DocumentBuilderFactory builderFactory=DocumentBuilderFactory.newInstance();

(2)根據(jù)解析器工廠獲得解析器

 DocumentBuilder documentBuilder=builderFactory.newDocumentBuilder();

(3)解析器讀取XML文檔進(jìn)行解析,為Document對(duì)象(文檔對(duì)象,代表整個(gè)XML文檔)

 Document document=documentBuilder.parse("test.xml");

(4)獲得document文檔后,就可以對(duì)它進(jìn)行操作了。

例如 :可以通過getElementsByTagName查找指定名稱元素NodeList。

 NodeList nodeList=document.getElementsByTagName("name");

然后遍歷集合獲得每個(gè)Node節(jié)點(diǎn)。

for(int i=0;i<nodeList.getLength();i++){

   Element node=(Element)nodeList.item(i);

   再通過Node的getTextContent獲得節(jié)點(diǎn)文本內(nèi)容 。

   System.out.println(node.getTextContent());

  }


(二)**node節(jié)點(diǎn)公共API中,

getNodeName()返回節(jié)點(diǎn)的名稱 

getNodeType()返回節(jié)點(diǎn)的類型 

getNodeValue()返回節(jié)點(diǎn)的值 


(三)**XML 提供數(shù)據(jù)只能通過兩種情況 :

第一種 <name>xml解析技術(shù)</name> 第二種 <book id="001">

* 獲得元素文本子節(jié)點(diǎn)內(nèi)容  獲得元素后 element.getTextContent()  element.getFirstChild().getNodeValue()

* 獲得元素屬性值  獲得元素后 element.getAttribute(屬性名)


(四)節(jié)點(diǎn)元素查詢時(shí)

1、全局查找縮小范圍

2、相對(duì)位置查找 父親 兒子 兄弟 獲得相對(duì)節(jié)點(diǎn)元素內(nèi)容

注意事項(xiàng)

1、查詢?cè)刈庸?jié)點(diǎn)時(shí),注意回車換行 

2、Document 類中 getElementById --- 使用時(shí) xml文檔必須有約束 DTD默認(rèn)加載 , Schema需要編程


(五)對(duì)XML 進(jìn)行增刪改查 ---- 增加 、修改 、刪除

* 對(duì)內(nèi)存XML 文檔修改后,回寫到xml 文件中


添加節(jié)點(diǎn) 1、創(chuàng)建目標(biāo)節(jié)點(diǎn) document.createXXX 2、找到合適位置插入 父節(jié)點(diǎn).appendChild

修改節(jié)點(diǎn) 1 修改文本內(nèi)容 element.setTextContent(value) 2 修改屬性 element.setAttribute(name,value)

刪除節(jié)點(diǎn) 1 獲得要?jiǎng)h除節(jié)點(diǎn)o  2. o.getParentNode().removeChild(o);

**(詳細(xì)代碼參見代碼附錄)


8、JAXP SAX 解析API

原理見上。

事件

startDocument 文檔開始事件

startElement 元素開始事件

characters 文本元素事件

endElement 元素結(jié)束事件

endDocument 文檔結(jié)束事件


對(duì)于SAX編程不要求掌握,了解原理就可以了。


在startElement 中 獲得 開始元素是什么?qName  獲得開始標(biāo)簽屬性內(nèi)容 ?attributes.getValue("屬性名稱")

在characters 中 獲得讀取到文本元素是什么 ? new String(ch,start,length)

在endElement 中 獲得當(dāng)前結(jié)束元素是什么 ?qName


9、XML Pull 解析器

(一)為開源框架 ,使用STAX類似拉模式解析方式。Android手機(jī)系統(tǒng)內(nèi)置 工具類庫(kù)。

** 從事Android開發(fā) 。因?yàn)閮?nèi)置,無需下載任何jar包 ---- 如果從事JavaEE開發(fā)需要單獨(dú)下載pull解析器類庫(kù)。

**在pull 解析器官網(wǎng)上,看到pull解析器 API接口 。

**XNI2 XmlPull 、XPP3/MXP1 、kXML2 都是 pull解析器 接口API 的實(shí)現(xiàn) 

**課程采用 xpp3 這套 pull解析器實(shí)現(xiàn)。

(二)什么是jar 包?

很多開源框架,會(huì)將class文件用zip格式進(jìn)行壓縮 獲得壓縮包。擴(kuò)展名 jar (jar包)

(三)XML PULL 快速入門


(1)、去官網(wǎng)下載 zip 壓縮包(xpp3-1.1.3.4.C_all.zip),解壓縮獲得jar包(xpp3-1.1.3.4.C.jar)。

(2)、在當(dāng)前工程目錄下新建lib文件夾,將該jar包放到lib目錄下。

(3)、右擊jar包,Add to build path 將jar包添加到 當(dāng)前工程 build path.


事件

start document

start tag

text

end tag

end document


**使用pull解析器生成XML

(1)、獲得解析器工廠

 XmlPullParserFactory parserFactory = XmlPullParserFactory.newInstance();

(2)、通過解析器工廠 獲得序列化程序?qū)ο?XmlSerializer

 XmlPullParser parser = parserFactory.newPullParser();

(3)、設(shè)置 輸出XML文件 位置

(4)、開始寫  存在5個(gè)方法寫你需要內(nèi)容


*** 能力: 將List中數(shù)據(jù) 序列化到一個(gè)XML文件中 。


10、XML PULL 解析方式 與 SAX push 最大區(qū)別?

程序員可以自己控制解析過程 。

用push 自動(dòng)執(zhí)行所有解析事件,使用pull 程序員可以控制只執(zhí)行關(guān)注的那些事件,pull解析方式效率比push方式更高。


**獲得元素屬性 ----- 在元素開始時(shí) ,通過parser.getAttributeValue(null,屬性名稱);

獲得元素內(nèi)部文本內(nèi)容 ----- 在元素開始時(shí), parser.nextText();


11、XML PULL 對(duì)xml文件 進(jìn)行CURD (Create Update Read Delete) 

* 使用pull 讀取xml,讀取內(nèi)容不釋放,在內(nèi)存中保留 ---- DOM 類似

* 解析XML --- List 序列化 List --- XML 

* 使用pull 進(jìn)行增刪改查 --- 讀取xml全部數(shù)據(jù)保存內(nèi)存list對(duì)象,對(duì)內(nèi)存list對(duì)象進(jìn)行增刪改查。


向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI