1. 程式人生 > >【Android】實現XML解析的幾種技術

【Android】實現XML解析的幾種技術

轉載地址:http://www.cnblogs.com/hanyonglu/archive/2012/02/28/2370675.html  謝謝。


本文介紹在Android平臺中實現對XML的三種解析方式。

  XML在各種開發中都廣泛應用,Android也不例外。作為承載資料的一個重要角色,如何讀寫XML成為Android開發中一項重要的技能。

  在Android中,常見的XML解析器分別為DOM解析器、SAX解析器和PULL解析器,下面,我將一一向大家詳細介紹。

 

第一種方式:DOM解析器:

DOM是基於樹形結構的的節點或資訊片段的集合,允許開發人員使用DOM API遍歷XML樹、檢索所需資料。分析該結構通常需要載入整個文件和構造樹形結構,然後才可以檢索和更新節點資訊。

Android完全支援DOM 解析。利用DOM中的物件,可以對XML文件進行讀取、搜尋、修改、新增和刪除等操作。

DOM的工作原理:使用DOM對XML檔案進行操作時,首先要解析檔案,將檔案分為獨立的元素、屬性和註釋等,然後以節點樹的形式在記憶體中對XML檔案進行表示,就可以通過節點樹訪問文件的內容,並根據需要修改文件——這就是DOM的工作原理。

DOM實現時首先為XML文件的解析定義一組介面,解析器讀入整個文件,然後構造一個駐留記憶體的樹結構,這樣程式碼就可以使用DOM介面來操作整個樹結構。 

由於DOM在記憶體中以樹形結構存放,因此檢索和更新效率會更高。但是對於特別大的文件,解析和載入整個文件將會很耗資源。 當然,如果XML檔案的內容比較小,採用DOM是可行的。

常用的DoM介面和類:

 Document:該介面定義分析並建立DOM文件的一系列方法,它是文件樹的根,是操作DOM的基礎。  

Element:該介面繼承Node介面,提供了獲取、修改XML元素名字和屬性的方法。

Node:該介面提供處理並獲取節點和子節點值的方法。

NodeList:提供獲得節點個數和當前節點的方法。這樣就可以迭代地訪問各個節點。

DOMParser:該類是Apache的Xerces中的DOM解析器類,可直接解析XML檔案。

下面是DOM的解析流程:

 

 

第二種方式:SAX解析器:

  SAX(Simple API for XML)解析器是一種基於事件的解析器,事件驅動的流式解析方式是,從檔案的開始順序解析到文件的結束,不可暫停或倒退。它的核心是事件處理模式,

主要是圍繞著事件源以及事件處理器來工作的。當事件源產生事件後,呼叫事件處理器相應的處理方法,一個事件就可以得到處理。在事件源呼叫事件處理器中特定方法的時候,

還要傳遞給事件處理器相應事件的狀態資訊,這樣事件處理器才能夠根據提供的事件資訊來決定自己的行為。  

  SAX解析器的優點是解析速度快,佔用記憶體少。非常適合在Android移動裝置中使用。

SAX的工作原理:SAX的工作原理簡單地說就是對文件進行順序掃描,

當掃描到文件(document)開始與結束、元素(element)開始與結束、文件(document)結束等地方時通知事件處理函式,由事件處理函式做相應動作,然後繼續同樣的掃描,直至文件結束。

 在SAX介面中,事件源是org.xml.sax包中的XMLReader,它通過parser()方法來解析XML文件,併產生事件。

事件處理器是org.xml.sax包中ContentHander、DTDHander、ErrorHandler,以及EntityResolver這4個介面。XMLReader通過相應事件處理器註冊方法setXXXX()來完成的與ContentHander、DTDHander、ErrorHandler,以及EntityResolver這4個介面的連線。

常用的SAX介面和類:

 Attrbutes:用於得到屬性的個數、名字和值。  

 ContentHandler:定義與文件本身關聯的事件(例如,開始和結束標記)。大多數應用程式都註冊這些事件。

 DTDHandler:定義與DTD關聯的事件。它沒有定義足夠的事件來完整地報告DTD。如果需要對DTD進行語法分析,請使用可選的DeclHandler。

 DeclHandler是SAX的擴充套件。不是所有的語法分析器都支援它。

 EntityResolver:定義與裝入實體關聯的事件。只有少數幾個應用程式註冊這些事件。

 ErrorHandler:定義錯誤事件。許多應用程式註冊這些事件以便用它們自己的方式報錯。

 DefaultHandler:它提供了這些接LI的預設實現。在大多數情況下,為應用程式擴充套件DefaultHandler並覆蓋相關的方法要比直接實現一個介面更容易。

 詳見下表:

 

  

 

 可知,我們需要XmlReader 以及DefaultHandler來配合解析xml。

 下面是SAX的解析流程:

  

 

 

第三種方式:PULL解析器: 

      Android並未提供對Java StAX API的支援。但是,Android附帶了一個pull解析器,其工作方式類似於StAX。它允許使用者的應用程式程式碼從解析器中獲取事件,這與SAX解析器自動將事件推入處理程式相反。 

PULL解析器的執行方式和SAX類似,都是基於事件的模式。不同的是,在PULL解析過程中返回的是數字,且我們需要自己獲取產生的事件然後做相應的操作,而不像SAX那樣由處理器觸發一種事件的方法,執行我們的程式碼。

        讀取到xml的宣告返回 START_DOCUMENT;

讀取到xml的結束返回 END_DOCUMENT ;

讀取到xml的開始標籤返回 START_TAG

讀取到xml的結束標籤返回 END_TAG

讀取到xml的文字返回 TEXT

 

PULL解析器小巧輕便,解析速度快,簡單易用,非常適合在Android移動裝置中使用,Android系統內部在解析各種XML時也是用PULL解析器,Android官方推薦開發者們使用Pull解析技術。Pull解析技術是第三方開發的開源技術,它同樣可以應用於JavaSE開發。

      PULL 的工作原理:XML pull提供了開始元素和結束元素。當某個元素開始時,我們可以呼叫parser.nextText從XML文件中提取所有字元資料。當解釋到一個文件結束時,自動生成EndDocument事件。

      常用的XML pull的介面和類: 

XmlPullParser:XML pull解析器是一個在XMLPULL VlAP1中提供了定義解析功能的介面。

XmlSerializer:它是一個介面,定義了XML資訊集的序列。

XmlPullParserFactory:這個類用於在XMPULL V1 API中建立XML Pull解析器。

XmlPullParserException:丟擲單一的XML pull解析器相關的錯誤。

PULL的解析流程如下:

      [附加]第四種方式: Android.util.Xml類

在Android API中,另外提供了Android.util.Xml類,同樣可以解析XML檔案,使用方法類似SAX,也都需編寫Handler來處理XML的解析,但是在使用上卻比SAX來得簡單 ,如下所示: 以android.util.XML實現XML解析 , MyHandler myHandler=new MyHandler0; android.util.Xm1.parse(ur1.openC0nnection().getlnputStream0,Xm1.Encoding.UTF-8,myHandler);

 下面是一個參考文件river.xml,放在assets目錄.如下:

View Code

採用DOM解析時具體處理步驟是:

首先利用DocumentBuilderFactory建立一個DocumentBuilderFactory例項
然後利用DocumentBuilderFactory建立DocumentBuilder

然後載入XML文件(Document,
然後獲取文件的根結點(Element)
然後獲取根結點中所有子節點的列表(NodeList),
然後使用再獲取子節點列表中的需要讀取的結點。

 

 當然我們觀察節點,我需要用一個River物件來儲存資料,抽象出River

View Code

下面我們就開始讀取xml文件物件,並新增進List中:

程式碼如下: 我們這裡是使用assets中的river.xml檔案,那麼就需要讀取這個xml檔案,返回輸入流。 讀取方法為:inputStream=this.context.getResources().getAssets().open(fileName); 引數是xml檔案路徑,當然預設的是assets目錄為根目錄。

然後可以用DocumentBuilder物件的parse方法解析輸入流,並返回document物件,然後再遍歷doument物件的節點屬性。

View Code

在這裡新增到List中, 然後我們使用ListView將他們顯示出來。如圖所示: 

  採用SAX解析時具體處理步驟是:

1 建立SAXParserFactory物件

2 根據SAXParserFactory.newSAXParser()方法返回一個SAXParser解析器

3 根據SAXParser解析器獲取事件源物件XMLReader

4 例項化一個DefaultHandler物件

5 連線事件源物件XMLReader到事件處理類DefaultHandler中

6 呼叫XMLReader的parse方法從輸入源中獲取到的xml資料

7 通過DefaultHandler返回我們需要的資料集合。

程式碼如下:

View Code

重點在於DefaultHandler物件中對每一個元素節點,屬性,文字內容,文件內容進行處理。

 

前面說過DefaultHandler是基於事件處理模型的,基本處理方式是:當SAX解析器導航到文件開始標籤時回撥startDocument方法,導航到文件結束標籤時回撥endDocument方法。當SAX解析器導航到元素開始標籤時回撥startElement方法,導航到其文字內容時回撥characters方法,導航到標籤結束時回撥endElement方法。

 

根據以上的解釋,我們可以得出以下處理xml文件邏輯:

1:當導航到文件開始標籤時,在回撥函式startDocument中,可以不做處理,當然你可以驗證下UTF-8等等。

2:當導航到rivers開始標籤時,在回撥方法startElement中可以例項化一個集合用來存貯list,不過我們這裡不用,因為在建構函式中已經例項化了。

3:導航到river開始標籤時,就說明需要例項化River物件了,當然river標籤中還有name ,length屬性,因此例項化River後還必須取出屬性值,attributes.getValue(NAME),同時賦予river物件中,同時新增為導航到的river標籤新增一個boolean為真的標識,用來說明導航到了river元素。

4:當然有river標籤內還有子標籤(節點),但是SAX解析器是不知道導航到什麼標籤的,它只懂得開始,結束而已。那麼如何讓它認得我們的各個標籤呢?當然需要判斷了,於是可以使用回撥方法startElement中的引數String localName,把我們的標籤字串與這個引數比較下,就可以了。我們還必須讓SAX知道,現在導航到的是某個標籤,因此新增一個true屬性讓SAX解析器知道。

5:它還會導航到文字內標籤,(就是<img></img>裡面的內容),回撥方法characters,我們一般在這個方法中取出就是<img></img>裡面的內容,並儲存。 6:當然它是一定會導航到結束標籤</river> 或者</rivers>的,如果是</river>標籤,記得把river物件新增進list中。如果是river中的子標籤</introduction>,就把前面設定標記導航到這個標籤的boolean標記設定為false. 按照以上實現思路,可以實現如下程式碼:

View Code

執行效果跟上例DOM 執行效果相同。

 

採用PULL解析基本處理方式:

當PULL解析器導航到文件開始標籤時就開始例項化list集合用來存貯資料物件。導航到元素開始標籤時回判斷元素標籤型別,如果是river標籤,則需要例項化River物件了,

如果是其他型別,則取得該標籤內容並賦予River物件。當然它也會導航到文字標籤,不過在這裡,我們可以不用。

根據以上的解釋,我們可以得出以下處理xml文件邏輯:

1:當導航到XmlPullParser.START_DOCUMENT,可以不做處理,當然你可以例項化集合物件等等。

2:當導航到XmlPullParser.START_TAG,則判斷是否是river標籤,如果是,則例項化river物件,並呼叫getAttributeValue方法獲取標籤中屬性值。

3:當導航到其他標籤,比如Introduction時候,則判斷river物件是否為空,如不為空,則取出Introduction中的內容,nextText方法來獲取文字節點內容

4:當然啦,它一定會導航到XmlPullParser.END_TAG的,有開始就要有結束嘛。在這裡我們就需要判讀是否是river結束標籤,如果是,則把river物件存進list集合中了,並設定river物件為null.

由以上的處理邏輯,我們可以得出以下程式碼:

View Code

執行效果和上面的一樣。

 

幾種解析技術的比較與總結:  

對於Android的移動裝置而言,因為裝置的資源比較寶貴,記憶體是有限的,所以我們需要選擇適合的技術來解析XML,這樣有利於提高訪問的速度。

1 DOM在處理XML檔案時,將XML檔案解析成樹狀結構並放入記憶體中進行處理。當XML檔案較小時,我們可以選DOM,因為它簡單、直觀。

2 SAX則是以事件作為解析XML檔案的模式,它將XML檔案轉化成一系列的事件,由不同的事件處理器來決定如何處理。XML檔案較大時,選擇SAX技術是比較合理的。雖然程式碼量有些大,但是它不需要將所有的XML檔案載入到記憶體中。這樣對於有限的Android記憶體更有效,而且Android提供了一種傳統的SAX使用方法以及一個便捷的SAX包裝器。 使用Android.util.Xml類,從示例中可以看出,會比使用 SAX來得簡單。

3 XML pull解析並未像SAX解析那樣監聽元素的結束,而是在開始處完成了大部分處理。這有利於提早讀取XML檔案,可以極大的減少解析時間,這種優化對於連線速度較漫的移動裝置而言尤為重要。對於XML文件較大但只需要文件的一部分時,XML Pull解析器則是更為有效的方法。

 

以上便是在Android平臺中對XML進行解析的方法和使用過程。