Python基礎進階之海量表情包多執行緒爬蟲功能的實現

阿新 • • 發佈：2020-12-18

一、前言

在我們日常聊天的過程中會使用大量的表情包，那麼如何去獲取表情包資源呢?今天老師帶領大家使用python中的爬蟲去一鍵下載海量表情包資源

二、知識點

requests網路庫
bs4選擇器
檔案操作
多執行緒

三、所用到得庫

import os
import requests
from bs4 import BeautifulSoup

四、功能

# 多執行緒程式需要用到的一些包
# 佇列
from queue import Queue
from threading import Thread

五、環境配置

直譯器 python3.6
編輯器 pycharm專業版啟用碼

六、多執行緒類程式碼

# 多執行緒類
class Download_Images(Thread):
  # 重寫建構函式
  def __init__(self,queue,path):
    Thread.__init__(self)
    # 類屬性
    self.queue = queue
    self.path = path
    if not os.path.exists(path):
      os.mkdir(path)
  def run(self) -> None:
    while True:
      # 圖片資源的url連結地址
      url = self.queue.get()
      try:
        download_images(url,self.path)
      except:
        print('下載失敗')
      finally:
        # 當爬蟲程式執行完成/出錯中斷之後傳送訊息給執行緒 代表執行緒必須停止執行
        self.queue.task_done()

七、爬蟲程式碼

# 爬蟲程式碼
def download_images(url,path):
  headers = {
    'User-Agent':
      'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/84.0.4147.105 Safari/537.36'
  }
  response = requests.get(url,headers=headers)
  soup = BeautifulSoup(response.text,'lxml')
  img_list = soup.find_all('img',class_='ui image lazy')
  for img in img_list:
    image_title = img['title']
    image_url = img['data-original']

    try:
      with open(path + image_title + os.path.splitext(image_url)[-1],'wb') as f:
        image = requests.get(image_url,headers=headers).content
        print('正在儲存圖片:',image_title)
        f.write(image)
        print('儲存成功:',image_title)
    except:
      pass

if __name__ == '__main__':
  _url = 'https://fabiaoqing.com/biaoqing/lists/page/{page}.html'
  urls = [_url.format(page=page) for page in range(1,201)]
  queue = Queue()
  path = './threading_images/'
  for x in range(10):
    worker = Download_Images(queue,path)
    worker.daemon = True
    worker.start()
  for url in urls:
    queue.put(url)
  queue.join()
  print('下載完成...')

八、爬取效果圖片

Python基礎進階之海量表情包多執行緒爬蟲功能的實現

到此這篇關於Python基礎進階之海量表情包多執行緒爬蟲的文章就介紹到這了,更多相關Python多執行緒爬蟲內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

Python基礎進階之海量表情包多執行緒爬蟲功能的實現

一、前言在我們日常聊天的過程中會使用大量的表情包，那麼如何去獲取表情包資源呢?今天老師帶領大家使用python中的爬蟲去一鍵下載海量表情包資源

Python基礎進階之海量表情包多執行緒爬蟲

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

【C語言進階】windows下的多執行緒該怎麼實現？附實戰：實現一邊倒計時一邊輸入單詞

技術標籤：實戰經驗c語言將會解決的問題 ① 建立多個執行緒（倒計時與輸入同時進行） ② 改變游標的位置 ③ 刪除控制檯上已經輸出的字元

python程式設計進階之異常處理用法例項分析

本文例項講述了python異常處理用法。分享給大家供大家參考，具體如下：之前用Java的時候，在容易出錯的地方我們經常使用try…catch或者try…catch…finally來捕捉和顯示異常，在python中很高興地發現它也有這樣的機

Python基礎進階實戰專案——彈球小遊戲

前言到現在，我們學習python也有一段時間了，相信不少夥伴已經掌握了python的基本語法。當然，也會有不少夥伴從入門到放棄，因為找不到方向，有時間想學就學。其實這些都是正常的現象，畢竟學習是很枯燥乏味的。

Python語言進階之【列表推導式&列表巢狀】

技術標籤：程式設計／Pythonpython列表 # 列表推導式 prices = { \'apple\': 1000, \'huawei\': 999,

天池Python訓練營筆記—Python基礎進階：從函式到高階魔法方法

函式 1.函式定義 Python將函式也視作物件，可以從另一個函式中返回出來去構建高階函式，比如：引數是函式，返回值也是函式

java基礎知識回顧之java Thread類--java執行緒實現常見的兩種方式（一）

java基礎知識回顧之java Thread類--java執行緒實現常見的兩種方式（一）建立執行緒的第一種方式：/ * 步驟：*1.繼承Thread類*2. 重寫Thread的run方法*目的：將自定義的程式碼儲存在run方法中，執行自定義執行緒

Python之多執行緒爬蟲抓取網頁圖片

目標嗯，我們知道搜尋或瀏覽網站時會有很多精美、漂亮的圖片。我們下載的時候，得滑鼠一個個下載，而且還翻頁。

Python利用多執行緒同步鎖實現多視窗訂票系統(推薦)

利用Python實現多視窗訂票系統，利用 threading.Lock() 避免出現一票多賣，無票也賣的情況，並規範化輸出情況。

Python如何使用佇列方式實現多執行緒爬蟲

說明：糗事百科段子的爬取，採用了佇列和多執行緒的方式，其中關鍵點是Queue.task_done()、Queue.join()，保證了執行緒的有序進行。

Python爬蟲必學知識點：多執行緒爬蟲

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python多執行緒爬蟲詳解

一、程式程序和執行緒之間的關係程式：一個應用就是一個程式，比如：qq，爬蟲

三年開發拿阿里P6+offer：基礎+資料結構+JVM+設計模式+演算法+多執行緒+分散式+網路

前言工作三年有餘，第一份工作是在一家外包公司，第二份工作是在一家做SAAS平臺的公司，第一家公司讓我入門，進入了軟體開發的行業，瞭解了一些基礎的東西；第二家公司由於規模不大，很多活兒都是一個人來做，從產品

Python爬蟲速度很慢？多執行緒爬蟲瞭解一下，提高10倍速度

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

python多程序爬蟲與多執行緒爬蟲模板

技術標籤：python爬蟲多執行緒python爬蟲多程序爬蟲不需要也沒必要過多解釋，不懂的可以看我python學習筆記專欄關於多執行緒與多程序的介紹

90分鐘掌握Python多執行緒爬蟲（全程實戰）

https://edu.csdn.net/learn/20379?spm=1002.2001.3001.4157 #encoding: utf-8 import requests from bs4 import BeautifulSoup

併發程式設計之volatile與JMM多執行緒記憶體模型

一、通過程式看現象在開始為大家講解Java 多執行緒快取模型之前，我們先看下面的這一段程式碼。這段程式碼的邏輯很簡單：主執行緒啟動了兩個子執行緒，一個執行緒1、一個執行緒2。執行緒1先執行，sleep睡眠2秒鐘之後

從黑暗走向光明：Python包安裝進階之路

想當初剛學習Python的時候，就會用書本里面自帶的一些package，用sys，os也用得很開心。後來接觸到biopython專案，發現原來Python有這麼不同功能的包，簡直琳琅滿目。不過這也是我痛苦的開始，在伺服器上裝個包怎麼那

Python進階之使用selenium爬取淘寶商品資訊功能示例

本文例項講述了Python進階之使用selenium爬取淘寶商品資訊功能。分享給大家供大家參考，具體如下：