【轉載】JAVA對XML文件的讀寫(有具體的代碼和解析

阿新 • • 發佈：2019-03-20

導入處理讀寫一個掃描表示 for xml ray .html

原文：https://www.cnblogs.com/yangliguo/p/7398996.html

XML 指可擴展標記語言（EXtensible Markup Language），是獨立於軟件和硬件的信息傳輸工具，應用於 web 開發的許多方面，常用於簡化數據的存儲和共享。

xml指令
處理指令，簡稱PI （processing instruction）。處理指令用來指揮解析引擎如何解析XML文檔內容。
以下為例:

在XML中，所有的處理指令都以結束。<?後面緊跟的是處理指令的名稱。

XML 元素指的是從（且包括）開始標簽直到（且包括）結束標簽的部分。元素可包含其他元素、文本或者兩者的混合物。元素也可以擁有屬性。

XML 元素可以在開始標簽中包含屬性，屬性 (Attribute) 提供關於元素的額外（附加）信息。屬性通常提供不屬於數據組成部分的信息，但是對
需要處理這個元素的應用程序來說卻很重要。
XML 屬性必須加引號，屬性值必須被引號包圍，不過單引號和雙引號均可使用。
如果屬性值本身包含雙引號，那麽有必要使用單引號包圍它，或者可以使用實體引用。

進入主題了
首先要有一個xml文件為名字為emplist.xml內容如下

<?xml version="1.0" encoding="UTF-8"?>
<list>
    <emp id="">
        <name>張三</name>
        <age></age>
        <gender>男</gender>
    <salary>5000</salary>
    </emp>  
</list>

XML解析方式
SAX解析方式
SAX（simple API for XML）是一種XML解析的替代方法。相比於DOM，SAX是一種速度更快，更有效的方法。它逐行掃描文檔，一邊掃描一邊解析。而且相比於DOM，SAX可以在解析文檔的任意時刻停止解析。其優缺點分別為：
優點：解析可以立即開始，速度快，沒有內存壓力
缺點：不能對節點做修改
DOM解析方式

DOM：(Document Object Model, 即文檔對象模型) 是 W3C 組織推薦的處理 XML 的一種方式。DOM解析器在解析XML文檔時，會把文檔中
的所有元素，按照其出現的層次關系，解析成一個個Node對象(節點)。其優缺點分別為:

優點:把xml文件在內存中構造樹形結構，可以遍歷和修改節點
缺點：如果文件比較大，內存有壓力，解析的時間會比較長
SAXReader讀取XML文檔
使用SAXReader需要導入dom4j-full.jar包。其是DOM4J的一個核心API，用於讀取XML文檔。
DOM4J是一個Java的XML API，類似於JDOM，用來讀寫XML文件的。DOM4J是一個非常非常優秀的Java XML API，具有性能優異、功能強
大和極端易用使用的特點，同時它也是一個開放源代碼的軟件。

import java.io.File;
import java.util.ArrayList;
import java.util.List;

import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

/**
 * 使用DOM解析xml文檔
 * @author ylg
 *
 */
public class ParseXmlDemo {
    public static void main(String[] args) {
        try {
            /*
             * 解析XML大致流程
             * 1:創建SAXReader
             * 2:使用SAXReader讀取數據源(xml文檔信息)
             *   並生成一個Document對象，該對象即表示
             *   xml文檔內容。DOM耗時耗內存資源也是在
             *   這一步體現的。因為會對整個XML文檔進行
             *   讀取並載入內存。
             * 3:通過Document對象獲取根元素
             * 4:根據XML文檔結構從根元素開始逐層獲取
             *   子元素最終以達到遍歷XML文檔內容的目的
             *
             */
            //1
            SAXReader reader = new SAXReader();

            //2
            Document doc
             = reader.read(new File("emplist.xml"));

            /*
             * 3
             * Document提供了方法:
             * Element getRootElement()
             * 該方法是用來獲取XML文檔中的根元素，
             * 對於emplist.xml文檔而言，根元素就是
             * <list>標簽。
             *
             * Element類
             * 每一個Element實例都可以表示XML文檔中的
             * 一個元素，即:一對標簽。
             */
            Element root = doc.getRootElement();
            /*
             * Element提供了方法:
             * String getName()
             * 該方法可以獲取當前元素的名字(標簽名)
             */
            System.out.println(
                "獲取了根元素:"+root.getName()
            );
            //4
            /*
             * 獲取一個元素中的子元素
             * Element提供了相關方法:
             *
             * 1
             * Element element(String name)
             * 獲取當前元素下指定名字的子元素。
             *
             * 2:
             * List elements()
             * 獲取當前元素下所有子元素
             *
             * 3:
             * List elements(String name)
             * 獲取當前元素下所有同名子元素
             *
             * 2,3返回的集合中的每一個元素都是Element
             * 的實例，每個實例表示其中的一個子元素。
             *
             */
            //獲取所有emp標簽
            List<Element> list = root.elements();

            //用於保存所有員工信息的List集合
            List<Emp> empList = new ArrayList<Emp>();

            for(Element empEle : list){
//              System.out.println(empEle.getName());
                //獲取員工名字
                Element nameEle = empEle.element("name");
                /*
                 * Element還提供了獲取當前元素中文本的方法:
                 * String getText(),String getTextTrim()
                 */
                String name = nameEle.getText();
                System.out.println("name:"+name);

                //獲取員工年齡
                int age = Integer.parseInt(
                    empEle.elementText("age")
                );

                //獲取性別
                String gender = empEle.elementText("gender");

                //獲取工資
                int salary = Integer.parseInt(
                    empEle.elementText("salary")
                );
                /*
                 * Attribute attribute(String name)
                 * 獲取當前元素(標簽)中指定名字的屬性
                 *
                 * Attribute的每一個實例用於表示一個
                 * 屬性。其中常用方法:
                 * String getName():獲取屬性名
                 * String getValue():獲取屬性值
                 */
                Attribute attr
                    = empEle.attribute("id");
                int id = Integer.parseInt(
                    attr.getValue()
                );

                Emp emp = new Emp(id,name,age,gender,salary);
                empList.add(emp);
            }
            System.out.println("解析完畢!");
            for(Emp emp : empList){
                System.out.println(emp);
            }


        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

寫XML
構建Document對象
使用DOM4J我們還可以通過自行構建Document對象，並組建樹狀結構來描述一個XML文檔，並使用DOM4J將其寫入一個文件。

import java.io.FileOutputStream;
import java.util.ArrayList;
import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.XMLWriter;

/**
 * 使用DOM生成XML文檔
 * @author ylg
 *
 */
public class WriteXmlDemo {
    public static void main(String[] args) {
        List<Emp> list = new ArrayList<Emp>();
        list.add(new Emp(1,"張三",25,"男",5000));
        list.add(new Emp(2,"李四",26,"女",6000));
        list.add(new Emp(3,"王五",27,"男",7000));
        list.add(new Emp(4,"趙六",28,"女",8000));
        list.add(new Emp(5,"錢七",29,"男",9000));
        /*
         * 使用DOM生成XML文檔的大致步驟:
         * 1:創建一個Document對象表示一個空文檔
         * 2:向Document中添加根元素
         * 3:按照文檔應有的結構從根元素開始順序添加
         *   子元素來形成該文檔結構。
         * 4:創建XmlWriter對象
         * 5:將Document對象寫出
         *   若寫入到文件中則形成一個xml文件
         *   也可以寫出到網絡中作為傳輸數據使用  
         */
        
        //1
        Document doc 
            = DocumentHelper.createDocument();
        
        /*
         * 2
         * Document提供了添加根元素的方法:
         * Element addElement(String name)
         * 向當前文檔中添加指定名字的根元素，返回
         * 的Element就表示這個根元素。
         * 需要註意，該方法只能調用一次，因為一個
         * 文檔只能有一個根元素。
         */
        Element root = doc.addElement("list");
        
        //3
        for(Emp emp : list){
            /*
             * Element也提供了追加子元素的方法:
             * Element addElement(String name)
             * 調用次數沒有限制，元素可以包含若幹
             * 子元素。
             */
            Element empEle = root.addElement("emp");
            
            //添加name信息
            Element nameEle = empEle.addElement("name");
            nameEle.addText(emp.getName());
            
            //添加age信息
            Element ageEle = empEle.addElement("age");
            ageEle.addText(emp.getAge()+"");
            
            //添加gender信息
            Element genderEle = empEle.addElement("gender");
            genderEle.addText(emp.getGender());
            
            //添加salary信息
            Element salEle = empEle.addElement("salary");
            salEle.addText(emp.getSalary()+"");
            
            /*
             * 向當前元素中添加指定名字以及對應值的屬性
             */
            empEle.addAttribute("id", emp.getId()+"");
                    
        }
        try{
            //4
            XMLWriter writer = new XMLWriter(OutputFormat.createPrettyPrint());
            FileOutputStream fos
                = new FileOutputStream("myemp.xml");
            writer.setOutputStream(fos);
            
            //5
            writer.write(doc);
            System.out.println("寫出完畢!");
            writer.close();
        }catch(Exception e){
            e.printStackTrace();
        }
    }
}

註意事項：
XPath 路徑表達式
XPath 是一門在 XML 文檔中查找信息的語言。XPath 可用來在 XML 文檔中對元素和屬性進行遍歷。由於我們單純使用dom定位節點時，大部
分時間需要一層一層的處理，如果有了xPath，我們定位我們的節點將變得很輕松。他可以根據路徑，屬性，甚至是條件進行節點的檢索。
XPath 使用路徑表達式在XML 文檔中進行導航
XPath 包含一個標準函數庫
XPath 是 XSLT 中的主要元素
XPath 是一個 W3C 標準

路徑表達式語法:
斜杠（/）作為路徑內部的分割符。
同一個節點有絕對路徑和相對路徑兩種寫法:
路徑（absolute path）必須用"/"起首，後面緊跟根節點，比如/step/step/...。
相對路徑（relative path）則是除了絕對路徑以外的其他寫法，比如 step/step，也就是不使用"/"起首。
"."表示當前節點。
".."表示當前節點的父節點
nodename（節點名稱）：表示選擇該節點的所有子節點
"/"：表示選擇根節點
"//"：表示選擇任意位置的某個節點
"@"：表示選擇某個屬性

【轉載】JAVA對XML文件的讀寫(有具體的代碼和解析

導入處理讀寫一個掃描表示 for xml ray .html 原文：https://www.cnblogs.com/yangliguo/p/7398996.html XML 指可擴展標記語言（EXtensible Markup Language），是獨立於軟件和硬

【轉載】JAVA對XML文件的讀寫(有具體的代碼和解析

【轉載】JAVA對XML文件的讀寫(有具體的代碼和解析

大數據【二】HDFS部署及文件讀寫（包含eclipse hadoop配置）

【jQuery】jQ處理xml文件和xml字符串

【轉載】恢復誤刪文件--DOS命令應用實例（一）

【轉】java將excel文件轉換成txt格式文件

【轉載】ASP.NET實現文件下載的功能

Xml文件漢化後改變代碼頁

Java中超大文件讀寫

【XML解析】（1）Java下使用JAXP中的DOM解析方式對XML文件進行解析

【轉載】java文件路徑問題及getResource和getClassLoader().getResource的區別

java實現xml文件讀取並保存到對象

【java 文件讀寫操作】生成隨機數，寫入txt，然後從txt中讀出

【POI】導出excel文件，不生成中間文件，直接將內存中的數據創建對象下載到瀏覽器

【JavaNIO的深入研究4】內存映射文件I/O，大文件讀寫操作，Java nio之MappedByteBuffer，高效文件/內存映射

java 使用DOM對XML文件進行增刪改查操作

【php】面向過程的文件上傳過程

java 生成 xml 文件

C#對XML文件的各種操作方法

【轉載】Java中Comparable和Comparator比較

【轉載】JAVA多線程讀取、操作List集合

【轉載】JAVA對XML文件的讀寫(有具體的代碼和解析

相關推薦