Python3簡單爬蟲抓取網頁圖片程式碼例項

阿新 • • 發佈：2020-01-09

現在網上有很多python2寫的爬蟲抓取網頁圖片的例項，但不適用新手（新手都使用python3環境，不相容python2），

所以我用Python3的語法寫了一個簡單抓取網頁圖片的例項，希望能夠幫助到大家，並希望大家批評指正。

import urllib.request
import re
import os
import urllib
#根據給定的網址來獲取網頁詳細資訊，得到的html就是網頁的原始碼 
def getHtml(url):
  page = urllib.request.urlopen(url)
  html = page.read()
  return html.decode('UTF-8')

def getImg(html):
  reg = r'src="(.+?\.jpg)" pic_ext'
  imgre = re.compile(reg)
  imglist = imgre.findall(html)#表示在整個網頁中過濾出所有圖片的地址，放在imglist中
  x = 0
  path = 'D:\\test' 
  # 將圖片儲存到D:\\test資料夾中，如果沒有test資料夾則建立
  if not os.path.isdir(path): 
    os.makedirs(path) 
  paths = path+'\\'   #儲存在test路徑下 

  for imgurl in imglist: 
    urllib.request.urlretrieve(imgurl,'{0}{1}.jpg'.format(paths,x)) #開啟imglist中儲存的圖片網址，並下載圖片儲存在本地，format格式化字串 
    x = x + 1 
  return imglist
html = getHtml("http://tieba.baidu.com/p/2460150866")#獲取該網址網頁詳細資訊，得到的html就是網頁的原始碼 
print (getImg(html)) #從網頁原始碼中分析並下載儲存圖片

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援我們。

Python3簡單爬蟲抓取網頁圖片程式碼例項

現在網上有很多python2寫的爬蟲抓取網頁圖片的例項，但不適用新手（新手都使用python3環境，不相容python2），

Python之多執行緒爬蟲抓取網頁圖片

目標嗯，我們知道搜尋或瀏覽網站時會有很多精美、漂亮的圖片。我們下載的時候，得滑鼠一個個下載，而且還翻頁。

Python爬蟲抓取指定網頁圖片程式碼例項

想要爬取指定網頁中的圖片主要需要以下三個步驟：（1）指定網站連結，抓取該網站的原始碼（如果使用google瀏覽器就是按下滑鼠右鍵 -> Inspect-> Elements 中的 html 內容）

python3爬蟲爬取網頁圖片簡單示例

2019獨角獸企業重金招聘Python工程師標準>>> 本人也是剛剛開始學習python的爬蟲技術，然後本來想在網上找點教程來看看，誰知道一搜索，大部分的都是用python2來寫的，新手嘛，一般都喜歡裝新版

爬蟲爬取網頁圖片（分頁）

爬蟲爬取網頁圖片（分頁）不分頁原始碼： import requests import re url = \'https://www.qiushibaike.com/imgrank/\'

PHP爬蟲抓取網路圖片

技術標籤：LaravelPHP爬蟲php <?php namespace App\\Console\\Commands; use Goutte\\Client; use Illuminate\\Console\\Command;

如何使用Python網路爬蟲抓取網站圖片

本文介紹兩種爬取方式： 1.正則表示式 2.bs4解析Html 以下為正則表示式爬蟲，面向物件封裝後的程式碼如下：

Java抓取網頁圖片並下載到本地（HTTP）

直接上程式碼： package com.clzhang.sample.net; import java.io.File; import java.io.FileOutputStream;

Java抓取網頁圖片並儲存到本地（HTTPS）

下面僅介紹用新增安全證書的方式，下載HTTPS網頁圖片到本地一，下載網頁安全證書到本地

Python 爬蟲批量爬取網頁圖片儲存到本地的實現程式碼

其實和爬取普通資料本質一樣，不過我們直接爬取資料會直接返回，爬取圖片需要處理成二進位制資料儲存成圖片格式（.jpg,.png等）的資料文字。

Python爬蟲爬取煎蛋網圖片程式碼例項

這篇文章主要介紹了Python爬蟲爬取煎蛋網圖片程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python requests抓取one推送文字和圖片程式碼例項

這篇文章主要介紹了python requests抓取one推送文字和圖片程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

PHP實現爬蟲爬取圖片程式碼例項

文字資訊我們嘗試獲取表的資訊，這裡，我們就用某校的課表來代替：

Python3抓取網路圖片

第一種、普通抓取方式　　不帶頭部資訊，網站沒有任何反爬措施可使用。如http://pic.ziweidan.com

w3cschool-Python3 爬蟲抓取、深度/機器學習類

https://www.w3cschool.cn/python3/python3-enbl2pw9.html (1) requests安裝在cmd中，使用如下指令安裝requests：

Python 50行爬蟲抓取並處理圖靈書目過程詳解

前言使用 requests進行爬取、BeautifulSoup進行資料提取。主要分成兩步：第一步是解析圖書列表頁，並解析出裡面的圖書詳情頁連結。第二步是解析圖書詳情頁，提取出感興趣的內容，本例中根據不同的資料情況，採用

python3 下載網路圖片程式碼例項

說明：這裡僅展示在已經獲取圖片連結後的下載方式，對於爬蟲獲取連結部分參考前面的文章

golang抓取網頁並分析頁面包含的連結方法

1. 下載非標準的包,\"golang.org/x/net/html\" 2. 先安裝git，使用git命令下載 git clone https://github.com/golang/net

Python requests模組基礎使用方法例項及高階應用(自動登陸,抓取網頁原始碼)例項詳解

1、Python requests模組說明 requests是使用Apache2 licensed 許可證的HTTP庫。用python編寫。

python+selenium+PhantomJS抓取網頁動態載入內容

環境搭建準備工具：pyton3.5,selenium,phantomjs 我的電腦裡面已經裝好了python3.5 安裝Selenium