1. 程式人生 > 實用技巧 >使用Excel功能抓取網頁表格資料

使用Excel功能抓取網頁表格資料

對於非工科專業的來說(例如文學歷史)學習爬蟲似乎沒有多少必要,在日常工作之中根據工作學習就可以時間一長,就可以直接使用的非常熟練了。

本文主要介紹使用Excel來抓取網頁的上面的資料。

示例連結:https://ranking.promisingedu.com/world-times

這上面這個表格之中,如果我採用複製,網頁的表格然後貼上在了Excel由於資料量過大,顯的十分麻煩,下面我們簡單介紹一個神奇當然就是Excel,注意是微軟的版本,目前wps目前還沒有當前這個功能。

複製連結:

開啟Excel :

開啟Excel之後,最好新建一個Excel檔案,這樣的話比較方便,選擇資料選項卡,資料來源選擇【自網站】如果找不到的就選擇資料獲取源裡面尋找。

抓取資料:

貼上連結到對話方塊點確定,連線選擇匿名即可

需要等待一段時間,在導航器之中選擇你需要的資料

點選載入即可。

表格已經生成了吧,下來只需要簡單處理資料就可以了。

這種方式最適合於單頁面多表格的形式,其中的原理主要採用是的使用Excel內建的遊覽器元件去下載給定連結之中的HTML頁面,從頁面之中解析表的資料,包括表頭的資料部分,簡單易用。