一篇文章教會你利用Python網路爬蟲獲取素材圖片

阿新 • • 發佈：2020-08-26

【一、專案背景】

在素材網想找到合適圖片需要一頁一頁往下翻，現在學會python就可以用程式把所有圖片儲存下來，慢慢挑選合適的圖片。

【二、專案目標】

1、根據給定的網址獲取網頁原始碼。

2、利用正則表示式把原始碼中的圖片地址過濾出來。

3、過濾出來的圖片地址下載素材圖片。

【三、涉及的庫和網站】

1、網址如下：

https://www.51miz.com/

2、涉及的庫：requests、lxml

【四、專案分析】

首先需要解決如何對下一頁的網址進行請求的問題。可以點選下一頁的按鈕，觀察到網站的變化分別如下所示：

https://www.51miz.com/so-sucai/1789243.html
https://www.51miz.com/so-sucai/1789243/p_2/
https://www.51miz.com/so-sucai/1789243/p_3/

我們可以發現圖片頁數是1789243/p{}，p{}花括號數字表示圖片哪一頁。

【五、專案實施】

1、開啟覓知網，在搜尋中輸入你想要的圖片素材（以鼠年素材圖片為例）。

2、根據上一步對網址的分析，首先我們定義一個類叫做ImageSpider，類裡面定義初始化函式、傳送請求獲取響應資料函式、解析函式、主函式。首先初始化函式，準備url地址和headers，程式碼如下圖所示。

3、傳送請求獲取響應資料函式。

4、解析資料，使用xpath獲取二級頁面連結，最後把圖片儲存在資料夾中。使用谷歌瀏覽器選擇開發者工具或直接按F12,發現我們需要的圖片src是在img標籤下的，於是用Python的requests提取該元件。

5、主函式，程式碼如下圖所示。

【六、效果展示】

1、執行程式，在控制檯輸入你要爬取的頁數，如下圖所示。

2、在本地可以看到效果圖，如下圖所示。

【七、總結】

1、不建議抓取太多資料，容易對伺服器造成負載，淺嘗輒止即可。

2、希望通過這個專案，能夠幫助大家下載到素材圖片。

3、本文基於Python網路爬蟲，利用爬蟲庫，實現素材圖片的獲取。實現的時候，總會有各種各樣的問題，切勿眼高手低，勤動手，才可以理解的更加深刻。

4、需要本文原始碼的小夥伴，後臺回覆“素材圖片”四個字，即可獲取。

看完本文有收穫？請轉發分享給更多的人

IT共享之家

入群請在微信後臺回覆【入群】

想學習更多Python網路爬蟲與資料探勘知識，可前往專業網站：

http://pdcfighting.com/

一篇文章教會你利用Python網路爬蟲獲取素材圖片

一篇文章教會你利用Python網路爬蟲獲取素材圖片

一篇文章教會你利用Python網路爬蟲獲取有道翻譯手機版的翻譯介面

一篇文章教會你利用Python網路爬蟲獲取窮遊攻略

一篇文章教會你使用Python網路爬蟲下載酷狗音樂

一篇文章教會你用Python多執行緒獲取小米應用商店App

一篇文章教會你利用createjs實現介面效果

一篇文章教會你用Python爬取淘寶評論資料（寫在記事本）

喜歡的抖音視訊只能收藏，不能儲存？一篇文章教會你使用Python下載抖音無水印視訊

一篇文章教會你如何將DOM轉換為virtual DOM

一篇文章教會你使用HTML打造一款顏色配對遊戲

一篇文章教會你建立vue專案和使用vue.js實現資料增刪改查

一篇文章教會你使用Java8中的Lambda表示式

一篇文章教會你使用html+css3製作GIF圖

一篇文章教你用python逆向抓取App資料

一篇文章帶你瞭解python的6大基本資料型別基礎篇

一篇文章教你用python畫動態愛心表白

一篇文章帶你瞭解python正則表示式的正確用法

一篇文章帶你入門Python正則表示式

（轉）一篇文章帶你瞭解Python運算子過載一篇文章帶你瞭解Python運算子過載

爬取動漫美女，手把手教你用Python網路爬蟲獲取動漫圖片

一篇文章教會你利用Python網路爬蟲獲取素材圖片

相關推薦