雙十一手剁完了嗎？教你用Python再剁一遍（Python模擬登入，採集淘寶商品資料）

阿新 • • 發佈：2021-11-06

前言

11月4日，中國消費者協會在官網釋出消費提示，提醒消費者“雙十一”購物六點注意事項。主要內容就是對於雙十一的“低價”不可迷信，提防商家套路。那麼對於我們要怎麼樣才能選擇真正的底價好貨呢？

今天帶大家使用python+selenium工具獲取這些公開的商家資料，可以採集商品的價格和評價做對比

環境介紹

python 3.8
pycharm
selenium
csv
time
random

安裝所需的第三方模組

from selenium import webdriver
import time  # 時間模組, 可以用於程式的延遲
import random  # 
 隨機數模組
from constants import TAO_USERNAME1, TAO_PASSWORD1
import csv  # 資料儲存的模組

建立一個瀏覽器

driver = webdriver.Chrome()

執行自動化瀏覽器的操作

driver.get('https://www.taobao.com/')
driver.implicitly_wait(10)  # 設定瀏覽器的等待,載入資料
driver.maximize_window()  # 最大化瀏覽器

搜尋功能

首先，開啟開發者工具；然後選擇用左上角的工具選中搜索框，然後會幫我們定位到當前選中元素的標籤；最後，右鍵，選擇Copy，再選擇Xpath語法

def search_product(keyword):
    driver.find_element_by_xpath('//*[@id="q"]').send_keys(keyword)
    time.sleep(random.randint(1, 3))  # 儘量避免人機檢測  隨機延遲

    driver.find_element_by_xpath('//*[@id="J_TSearchForm"]/div[1]/button').click()
    time.sleep(random.randint(1, 3))  # 儘量避免人機檢測  隨機延遲

word = input(' 
請輸入你要搜尋商品的關鍵字:')

# 呼叫商品搜尋的函式
search_product(word)

登入介面

用上面相同的方法，找到所需元素

driver.find_element_by_xpath('//*[@id="f-login-id"]').send_keys(TAO_USERNAME1)
time.sleep(random.randint(1, 3))  # 儘量避免人機檢測  隨機延遲

driver.find_element_by_xpath('//*[@id="f-login-password"]').send_keys(TAO_PASSWORD1)
time.sleep(random.randint(1, 3))  # 儘量避免人機檢測  隨機延遲

driver.find_element_by_xpath('//*[@id="login-form"]/div[4]/button').click()
time.sleep(random.randint(1, 3))  # 儘量避免人機檢測  隨機延遲

對於本篇文章有疑問的同學可以加【資料白嫖、解答交流群：1136201545】

selenium操作的瀏覽器被識別了, 無法登入

修改瀏覽器的部分屬性, 繞過檢測

driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument",
            {"source": """Object.defineProperty(navigator, 'webdriver', {get: () => false})"""})

解析商品資料

def parse_data():
    divs = driver.find_elements_by_xpath('//div[@class="grid g-clearfx"]/div/div')  #  所有的div標籤

    for div in divs:
        try:
            info = div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').text
            price = div.find_element_by_xpath('.//strong').text + '元'
            deal = div.find_element_by_xpath('.//div[@class="deal-cnt"]').text
            name = div.find_element_by_xpath('.//div[@class="shop"]/a/span[2]').text
            location = div.find_element_by_xpath('.//div[@class="location"]').text
            detail_url = div.find_element_by_xpath('.//div[@class="pic"]/a').get_attribute('href')

            print(info, price, deal, name, location, detail_url)

儲存

with open('某寶.csv', mode='a', encoding='utf-8', newline='') as f:
    csv_write = csv.writer(f)
    csv_write.writerow([info, price, deal, name, location, detail_url])

翻頁爬取

找到頁面的規律，為一個等差數列，而第一頁為0

for page in range(100): # 012
    print(f'\n==================正在抓取第{page + 1}頁資料====================')
    url = f'https://s.taobao.com/search?q=%E5%B7%B4%E9%BB%8E%E4%B8%96%E5%AE%B6&s={page * 44}'
    # 解析商品資料
    parse_data()
    time.sleep(random.randint(1, 3))  # 儘量避免人機檢測  隨機延遲

最後執行程式碼，得到結果

雙十一手剁完了嗎？教你用Python再剁一遍（Python模擬登入，採集淘寶商品資料）

前言 11月4日，中國消費者協會在官網釋出消費提示，提醒消費者“雙十一”購物六點注意事項。主要內容就是對於雙十一的“低價”不可迷信，提防商家套路。那麼對於我們要怎麼樣才能選擇真正的底價好貨呢？

手把手教你用WinForm製作地圖編輯工具（二）

從今天開始，進入正題一、建立專案　　1.1 建立一個WinForm專案，我這兒用的是.NET Framework4.6.2

三國志戰略版S級戰法缺了怎麼辦？教你用A級戰法補位（一）

眾所周知，三國志戰略版的S級戰法那可是相當金貴，那麼，作為平民，就不得不用一些A級戰法補位。那麼，有哪些A級戰法可以作為補位來平替S級戰法呢？

FTP服務–用來傳輸檔案的協議（FTP詳解，附帶超詳細實驗步驟）

一、FTP協議概念 1、FTP伺服器預設使用TCP協議的20、21埠與客戶端進行通訊 • 20埠用於建立資料連線，並傳輸檔案資料

手把手教你用 Node 實現 HTTP 協議（三）

手把手教你用 Node 實現 HTTP 協議（三）上一章介紹瞭如何解析 HTTP 請求報文，這一章我們來講解如何進行報文的收發和 TCP 連線的建立。

實操 | 從0到1教你用Python來爬取整站天氣網

Scrapy Scrapy是Python開發的一個快速、高層次的螢幕抓取和web抓取框架，用於抓取web站點並從頁面中提取結構化的資料。

給你一面國旗教你用python畫中國國旗

本文例項為大家分享了python畫中國國旗的具體程式碼，供大家參考，具體內容如下

阿望教你用vue寫掃雷小遊戲

前言話說阿望還在大學時，某一天寢室突然停網了，於是和室友兩人不約而同地打開了掃雷，比相同難度下誰更快找出全部的雷，玩得不亦樂乎，就這樣，掃雷伴我們度過了斷網的一週，是整整一週啊，不用上課的那種，可想而

Websocket IM聊天教程教你用GoEasy快速實現IM聊天

經常有朋友問起GoEasy如何實現IM，今天就手把手的帶大家從頭到尾用GoEasy實現一個完整IM聊天，全套程式碼已經放在了github。

高手教你用win10系統PowerShell命令格式化所有磁碟

日常使用win10系統經常需要格式化硬碟,這樣硬碟才能儲存更多檔案,不過許多新手不太清楚如何正確格式化磁碟，網上也有很多軟體，但使用起來不懂安不安全，畢竟磁碟儲存很多重要檔案，如果格式化錯誤，容易出現檔案丟失

cmd怎樣看電腦配置？高手教你用win10系統cmd檢視電腦配置

購買新電腦預裝win10系統，剛剛買回來對電腦配置一竅不通，不利於後續的使用。網上有很多方法檢視電腦配置，但要使用第三方工具，比較麻煩。其實我們可以使用系統cmd進行檢視，那麼cmd怎樣看電腦配置？方法很簡單，有

win10系統關閉頁面快捷鍵有哪些？高手教你用快捷鍵關閉頁面的方法

一般情況下，win10系統想要快速關閉某個頁面，都是點選視窗的×按鈕，如果同時開啟很多視窗，要一個一個點選關閉有點麻煩。其實，我們可以學習一些快速關閉網頁的方法，今天小編將給大家分享介紹win10系統通過快捷鍵

Windows10內建的升級助手怎麼用？老司機教你用win10升級助手功能

Win10系統之後備受使用者們喜愛，其中內建有很多實用功能，比如升級助手，它是一款可以幫助我麼升級win10 系統的一種工具，可能不少的使用者都不知道如何使用Win10升級助手，其實使用此功能不需要很強的專業知識，這

win10怎麼進行磁碟分割槽？老司機教你用win10自帶軟體進行磁碟分割槽

電腦重灌win10系統發現磁碟只有一個C盤，管理和儲存檔案都很方便，於是想要進行磁碟分割槽。網上雖然有很多磁碟分割槽軟體，但是下載後總會捆綁很多流氓軟體，有什麼辦法能不用下載軟體就可以進行磁碟分割槽的，方法

老司機教你用光碟重灌Windows10系統的詳細步驟

當win10系統遇到棘手的故障問題，重灌是一種不錯的辦法，重灌win10系統的辦法有很多，比如U盤、光碟安裝等等，其中，光碟安裝是專業人員用最多方式，也是微軟官方主推薦方法，光碟成本低,儲存資料穩定。大家是不是已

Win10自帶郵件功能如何使用？老司機教你用win10自帶郵寄功能

Win10系統自帶一個郵件應用，相信大家都沒怎麼接觸過，一般用QQ郵箱檢視或接收郵件每次要登入，這樣還是挺麻煩的！如果使用Win10自帶郵件功能，繫結你的郵箱，那麼收發郵件就簡單多了，並且收到郵件還會通知你，再也

教你用電腦管家升級Win10系統？升級Win10系統的簡單方法

隨著作業系統的更新，越來越多使用者將系統升級到win10系統，網上講解相關升級系統方法也有很多，常見的是U盤安裝，如果在沒有U盤的情況下，該採取什麼方法來升級win10系統？針對此疑問，小編今天來教你用電腦管家升

教你用啟用碼啟用Win10家庭版的具體方法

電腦安裝上Win10家庭版系統的時候,要是沒有啟用，很多功能都被限制了。最開始想使用啟用工具進行啟用，但下載的啟用工具例如暴風win10啟用工具，KMS Tools，HEU KMS Activator，都不能正常執行。很多朋友想要使得wi

手把手教你用虛擬光碟機安裝windows10系統的詳細步驟

win10目前最新最主流的系統，越來越多小夥伴升級體驗，網上升級win10系統的相關教程也很多，比如U盤、硬碟安裝等等。其實安裝win10可選擇虛擬光碟機安裝，這該如何操作呢？接下去就讓小編手把手教你用虛擬光碟機安裝

雙十一手剁完了嗎？教你用Python再剁一遍（Python模擬登入，採集淘寶商品資料）

前言

環境介紹

安裝所需的第三方模組

建立一個瀏覽器

執行自動化瀏覽器的操作

搜尋功能

登入介面

selenium操作的瀏覽器被識別了, 無法登入

解析商品資料

儲存

翻頁爬取

最後執行程式碼，得到結果

相關推薦