1. 程式人生 > >html 02-認識html

html 02-認識html

list inpu 網絡爬蟲 簡單 搜索 文件 單標簽 含義 翻譯

1. HTML 初識

  • HTML 指的是超文本標記語言 (Hyper Text Markup Language)是用來描述網頁的一種語言。

  • HTML 不是一種編程語言,而是一種標記語言 (markup language)

  • 標記語言是一套標記標簽 (markup tag)

超文本的 含義:

*可以加入圖片、聲音、動畫、多媒體等內容(超越文本限制

*還可以從一個文件跳轉到另一個文件,與世界各地主機的文件連接(超級鏈接文本 )。

html 總結:

  • html 是超文本標記(標簽)語言

  • 我們學習html 主要學習html標簽

  • 我們用html標簽描述網頁元素。 比如 圖片標簽 、文字標簽、鏈接標簽等等

  • 標簽有自己的語法規範,所有的html標簽都是用 <> 表示的

1.1 HTML骨架標簽

<html>
  <head>

     <title> </title>

  </head>  

  <body>

  </body>
</html>

1.2 HTML元素標簽分類

a.雙標簽: <標簽名> 內容 </標簽名> 比如 <body> 我是文字 </body>

  • 該語法中“<標簽名>”表示該標簽的作用開始,一般稱為“開始標簽(start tag)”,“</標簽名>” 表示該標簽的作用結束,一般稱為“結束標簽(end tag)”。

  • 和開始標簽相比,結束標簽只是在前面加了一個關閉符“/”。

  • 我們以後接觸的基本都是雙標簽

b.單標簽 :<標簽名 /> 比如 <br />

  • 空元素 用單標簽來表示, 簡單點說,就是裏面不需要包含內容, 只有一個開始標簽不需要關閉。

  • 這種單身狗標簽非常少,一共沒多少,我們多記憶就好<br /> <hr /> <input /> <img /> <base /> 等

1.3 HTML標簽關系

a.嵌套關系

<head>
  <title> </title>
</head>

b.並列關系

<head></head>
<body></body>

2. 文檔類型<!DOCTYPE> 

作用:

<!DOCTYPE> 聲明位於文檔中的最前面的位置,處於 <html> 標簽之前。此標簽可告知瀏覽器文檔使用哪種 HTML 或 XHTML 規範。

3. 頁面語言lang

可能對於程序來說沒有太大的作用,但是它可以告訴瀏覽器,搜索引擎,一些處理Html的程序對頁面語言內容來做一些對應的處理或者事情。比如可以

  • 根據根據lang屬性來設定不同語言的css樣式,或者字體

  • 告訴搜索引擎做精確的識別

  • 讓語法檢查程序做語言識別

  • 幫助翻譯工具做識別

  • 幫助網頁閱讀程序做識別等等

4.字符集

字符集(Character set)是多個字符的集合。

計算機要準確的處理各種字符集文字,需要進行字符編碼,以便計算機能夠識別和存儲各種文字。 

utf-8是目前最常用的字符集編碼方式,常用的字符集編碼方式還有gbk和gb2312。

  • gb2312 簡單中文 包括6763個漢字 GUO BIAO

  • BIG5 繁體中文 港澳臺等用

  • GBK包含全部中文字符 是GB2312的擴展,加入對繁體字的支持,兼容GB2312

  • UTF-8則基本包含全世界所有國家需要用到的字符

  • 這句代碼非常關鍵, 是必須要寫的代碼,否則可能引起亂碼的情況。

5.HTML標簽的語義化

白話: 所謂標簽語義化,就是指標簽的含義。

  1. 方便代碼的閱讀和維護

  2. 同時讓瀏覽器或是網絡爬蟲可以很好地解析,從而更好分析其中的內容

  3. 使用語義化標簽會具有更好地搜索引擎優化

html 02-認識html