學習筆記【JavaWeb-第六節：XML初步認識與 Jsoup簡單入門】

阿新 • • 發佈：2021-01-05

技術標籤：# Java Web java xml

XML

概念

Extensible Markup Language 可擴充套件標記語言

可擴充套件：標籤都是自定義的。

功能

儲存資料：

配置檔案
在網路中傳輸

xml與html的區別

xml的標籤都是自定義的，html的標籤都是預定義的
xml的語法嚴格，html的語法鬆散
xml是儲存資料的，html是展示資料的

語法

基本語法

xml文件的字尾名.xml
xml第一行必須定義為文件宣告
xml文件中，有且僅有一個根標籤
屬性值必須用引號引起來
標籤要正確關閉
xml標籤名稱區分大小寫

快速入門

<? xml version='1.0' ?> 


<users>
	<user>
		<name>zhangsan</name>
		<age>18</age>
		<gender>male</gender>
	</user>
	
	<user>
		<name>lisi</name>
		<age>18</age>
		<gender>female</gender>
	</user>
</users>

組成部分

文件宣告

格式：

<?xml 屬性列表?>

屬性列表:

version:版本號（必須屬性）
encoding：編碼方式。告知解析引擎當前文件使用的編碼方式，預設值：ISO-8859-1
standalone：是否獨立.yes or no。yes：不依賴其他檔案；no：依賴其他檔案

指令（瞭解）

結合css使用
如：

<?xml-stylesheet type="text/css" href="a.css" ?>

屬性

id屬性值唯一

文字

CDATA區：在該區域中的資料會被原樣展示
格式：<![CDATA[資料]]>

w3c：全球資訊網聯盟

約束

規定xml文件的書寫規則

作為框架的使用者（程式設計師）：

能夠在xml中引入約束文件
能夠簡單的讀懂約束文件

分類：

DTD：一種簡單的約束技術
Schema：一種複雜的約束技術

DTD：

引入dtd文件到xml文件中

內部dtd：將約束規則定義在xml文件中
外部dtd：將約束規則定義在外部的dtd檔案中
本地：<!DOCTYPE 根標籤名 SYSTEM "dtd檔案的位置">
網路：<!DOCTYPE 根標籤名PUBLIC "dtd檔名字" "dtd檔案的位置URL">

Schema

引入：

填寫xml文件的根元素
引入xsi字首。 xmlns:xsi=“http://www.w3.org/2001/XML Schema-instance”
引入xsd檔案名稱空間 xsi:schemaLocation=“http://www.itcast.cn/xml student.xsd”
為每一個xsd約束宣告一個字首，作為標識 xmlns=“http://www.itcast.cn/xml”

解析

操作xml文件，將文件中的資料讀取到記憶體中

操作xml文件

解析（讀取）：將文件中的資料讀取到記憶體中
寫入：將記憶體中的資料儲存到xml文件中。持久化的儲存

解析xml的方式：

DOM：
將標記語言文件一次性載入到記憶體，在記憶體中形成一顆DOM樹

優點：操作方便，可以對文件進行CRUD的所有操作
缺點：佔記憶體

SAX：
逐行讀取，基於事件驅動的

優點：不佔記憶體
缺點：只能讀取，不能增刪改

xml常見的解析器

JAXP：sun公司提供的解析器，支援dom和sax兩種思想
DOM4J：非常優秀的解析器
Jsoup：是一款Java 的HTML解析器，可直接解析某個URL地址、HTML文字內容。它提供了一套非常省力的API，可通過DOM，CSS以及類似於jQuery的操作方法來取出和操作資料。
PULL：Android作業系統內建的解析器，sax方式的。

Jsoup

快速入門：

步驟：

匯入jar包
獲取Document物件
獲取對應標籤Element物件
獲取資料

//獲取student.xml的路徑
String path = JsoupDemo1.class.getClassLoader().getResource("student.xml").getPath();
//解析xml文件，載入文件進記憶體，獲取dom樹-->Document
Document document = Jsoup.parse(new File(path), "utf-8");
//獲取元素物件 Element
Elements names = document.getElementsByTag("name");
//獲取資料
System.out.println(names.get(0).text());

物件的使用

Jsoup：
工具類，可以解析html或xml的文件，返回Document物件

Document parse(File in, String charsetName) 將檔案的內容解析為HTML。
Document parse(String html) 將HTML解析為文件。
Document parse(URL url, int timeoutMillis) 獲取一個URL，並將其解析為HTML。

Document：
文件物件，代表記憶體中的dom樹
獲取Element物件：

Elements getElementsByTag(String tagName) 使用標籤名稱獲取元素物件集合。
Elements getElementsByAttribute(String key) 根據屬性名獲取元素物件集合
Elements getElementsByAttributeValue(String key, String value) 根據對應的屬性名和屬性值獲取元素物件集合

Elements：
元素Element物件的集合。可以當作一個ArrayList<Element>來使用

Element：
元素物件

獲取屬性值：

String attr(String attributeKey) 根據屬性名稱獲取屬性值。

獲取文字內容

String text() 獲取子標籤的純文字內容
String html() 獲取標籤體的所有內容（包括子標籤的標籤和文字內容）

Node：
節點物件。是Document和Element 的父類

快捷查詢方式

1.selector 選擇器
使用的方法：Elements select(String cssQuery)

語法可參考Selector類中定義的語法

String path = JsoupDemo4.class.getClassLoader().getResource("student.xml").getPath();
Document document = Jsoup.parse(new File(path), "utf-8");
System.out.println(document.select("student[number='s001']>age").text());

2.XPath
XML路徑語言（XML Path Language），它是一種用來確定XML文件中某部分位置的語言。

步驟：

額外匯入jar包
查詢w3c手冊的xpath語法

String path = JsoupDemo6.class.getClassLoader().getResource("student.xml").getPath();
Document document = Jsoup.parse(new File(path), "utf-8");
//建立XPath的JXDocument物件
JXDocument jxDocument=new JXDocument(document);
//結合XPath語法查詢
List<JXNode> students = jxDocument.selN("//student");

List<JXNode> names = jxDocument.selN("//student/name[@id='1']");
for (JXNode name:names){
   System.out.println(name);
}

學習筆記【JavaWeb-第六節：XML初步認識與 Jsoup簡單入門】

技術標籤：# Java Webjavaxml XML 概念 Extensible Markup Language 可擴充套件標記語言可擴充套件：標籤都是自定義的。

學習筆記【SpringCloud-第五節：Ribbon負載均衡服務呼叫】

技術標籤：# SpringCloudjava Ribbon Spring Cloud Ribbon是基於Netflix Ribbon實現的一套客戶端負載均衡的工具

學習筆記【多執行緒-第四節：synchronized的淺顯基礎及安全問題】

技術標籤：筆記多執行緒java併發程式設計thread程式語言執行緒同步執行緒非同步模型各執行緒自己執行自己的，互相沒有什麼關聯，比如有兩個執行緒，一個是弟弟在吃飯，一個是姐姐在看電視，誰也沒有影響到誰。

學習筆記【23種設計模式-第四節：Prototype原型模式 -克隆羊、深淺拷貝】

技術標籤：# 23種設計模式設計模式java Prototype原型模式簡述：原型模式（Prototype模式）是指：用原型例項指定建立物件的種類，並且通過拷貝這些原型，建立新的物件。原型模式是一種建立型設計模式，允許一個

React學習筆記 | 第六節：使用axios和fetch實現Ajax請求

技術標籤：React 本文是學習React筆記，對應視訊為：https://www.bilibili.com/video/BV1oW41157DY的 24 - 25 節。

學習筆記【SSM-第三節：Spring框架的AOP】

技術標籤：# SSMaopspringjava 事務問題轉賬例子： Account sourceAccount = accountDao.findByName(sourceName);

第六節：Activiti6.0——TaskService相關的API

一、概述介紹：在activiti的任務中，與任務相關的任務為以下三種，其含義如下：

第六節：Core SignalR中的重連機制和心跳監測機制詳解

一. 重連機制宣告：　　本節僅介紹重連機制和心跳監測機制，基於Core 3.1框架，至於SignalR其它的一些基本使用，包括引入、Hub、配置等常規操作，在本節中不介紹，後續寫Core下的SignalR

《Qt MOOC系列教程》第三章第六節：輸入處理器

技術標籤：Qt MOOC系列教程qtc++gui軟體開發程式設計 Qt Quick有多種型別可以處理觸控事件，例如我們在上一節中使用的MouseArea，另外還有PinchArea、MultiPointTouchArea和Flickable。

第六節：迪米特法則

迪米特原則(Demeter Principle) 一、基本介紹　　1、一個物件應該對其他物件保持最少的瞭解；

學習筆記【23種設計模式-第五節：建造者模式】

技術標籤：# 23種設計模式java設計模式建造者模式簡述：建造者模式又叫生成器模式，是一種物件構建模式，它可以將複雜的建造過程抽象出來，使這個抽象過程的不同實現方式可以構造出不同表現（屬性）的物件。

學習筆記【23種設計模式-第十九節：Memento Pattern 備忘錄模式】

技術標籤：# 23種設計模式java設計模式 Memento Pattern 備忘錄模式簡述備忘錄模式在不破壞封裝的前提下，捕獲一個物件的內部狀態，並在該物件之外儲存這個狀態。這樣以後就可將該物件恢復到原先儲存的狀態。可

【計算機網路】學習筆記，第六篇：應用層（謝希仁版）

一 DNS 域名系統 (一) 概述許多應用層軟體經常直接使用域名系統 DNS (Domain Name System)，但計算機的使用者只是間接而不是直接使用域名系統。

學習筆記【多執行緒-第八節：volatile個人詳解】

技術標籤：筆記java多執行緒併發程式設計其實說volatile，個人覺得比synchronized簡單多了，他並不是一個鎖，只是一個可以修飾的關鍵字，作用就兩個：可見性與禁止指令重排序。

學習筆記【23種設計模式-第三節：工廠模式--簡單工廠、工廠方法、抽象工廠】

技術標籤：# 23種設計模式設計模式java抽象類工廠模式簡單工廠模式簡述：簡單工廠模式屬於建立型模式，是工廠模式的一種，簡單工廠模式是由一個工廠物件決定創建出哪一種產品類的例項。簡單工廠模式是工廠模

學習筆記【23種設計模式-第十八節：Mediator Pattern 中介者模式】

技術標籤：# 23種設計模式java設計模式 Mediator Pattern 中介者模式簡述：中介者模式，用一箇中介物件來封裝一系列的物件互動。中介者使各個物件不需要顯示的相互引用，從而使其耦合鬆散，而且可以獨立地改變

資訊安全系統設計與實現第六週：《Unix/Linux系統程式設計》第三章學習筆記

Unix/Linux程序管理多工處理原則多工處理通過不同任務之間多路複用CPU的執行時間來實現，即將CPU執行操作從一個任務切換到另一個任務；

學習專案-前端-第六課：ElementUI: modify

一、easy-mock-->/api/gathering/{gatheringId}(get) { \"code\": 20000, \"flag\": true, \"message\": \"@string\",

python學習-第六週：高階函式

高階函式遞迴函式遞迴函式就是定義了一個函式，然後在函式內，自己呼叫了自己這個函式

Bootstrap4.x學習筆記【六】

　　　　　　　表格樣式 1.使用.table 給表格設定一個基類，這是表格的基本樣式

學習筆記【JavaWeb-第六節：XML初步認識 與 Jsoup簡單入門】

XML

概念

功能

xml與html的區別

語法

基本語法

快速入門

組成部分

文件宣告

指令（瞭解）

標籤

屬性

文字

約束

DTD：

Schema

解析

解析xml的方式：

Jsoup

快速入門：

物件的使用

快捷查詢方式

相關推薦

學習筆記【JavaWeb-第六節：XML初步認識與 Jsoup簡單入門】