Python中免驗證跳轉到內容頁的例項程式碼
阿新 • • 發佈:2020-10-25
相信很多人在瀏覽網頁時,經常會碰到需要輸入驗證碼才可以繼續瀏覽的情況吧,遇到這種問題,大多數人只能進行繁瑣的註冊驗證,今天小編教大家只要使用python就可以免驗證方法。
以經常用到的解答網站——上學吧為例,在網站裡點選答案頁面,會顯示驗證後才可以檢視提示,下面就使用python實現跳過驗證碼。
我們需要通過python構造隨機的 X-Forwarded-For 資訊來繞過 ASP 網站的 IP 檢測,可以實現對輸入的網址正確性進行檢查、對驗證碼核驗不通過時的處理等等。
python免驗證跳轉頁面程式碼如下:
# 繞過驗證碼無限次獲取上學吧題目答案 # 上學吧網址:https://www.shangxueba.com/ask import os import random import requests import urllib3 urllib3.disable_warnings() # 這句和上面一句是為了忽略 https 安全驗證警告,參考:https://www.cnblogs.com/ljfight/p/9577783.html from bs4 import BeautifulSoup from PIL import Image def get_verifynum(session): # 網址的驗證碼邏輯是先去這個網址獲取驗證碼圖片,提交計算結果到另外一個網址進行驗證。 r = session.get("https://www.shangxueba.com/ask/VerifyCode2.aspx",verify=False) # HTTPS 請求進行 SSL 驗證或忽略 SSL 驗證才能請求成功,忽略方式為 verify=False。參考:https://www.cnblogs.com/ljfight/p/9577783.html with open('temp.png','wb+') as f: f.write(r.content) image = Image.open('temp.png') image.show() # 呼叫系統的圖片檢視軟體開啟驗證碼圖片,如果不能開啟,可以自己找到 temp.png 開啟。 verifynum = input("\n請輸入驗證碼圖片中的計算結果:") image.close() os.remove("temp.png") return verifynum def get_question(session): r = session.get(link) soup = BeautifulSoup(r.content,"html.parser") description = soup.find(attrs={"name":"description"})['content'] # 抓取題幹內容 return description def get_answer(session,verifynum,dataid): data1 = { "Verify": verifynum,"action": "CheckVerify",} session.post("https://www.shangxueba.com/ask/ajax/GetZuiJia.aspx",data=data1) # 核查驗證碼正確性 data2 = { "phone":"","dataid": dataid,"action": "submitVerify","siteid": "1001","Verify": verifynum,} r = session.post("https://www.shangxueba.com/ask/ajax/GetZuiJia.aspx",data=data2) soup = BeautifulSoup(r.content,"html.parser") ans = soup.find('h6') print("\n" + '-'*45) if(ans): # 只有驗證碼核查通過才會顯示答案 print("\n題目:" + get_question(session)) print(ans.text) else: print('\n沒有找到答案!請檢查驗證碼或網址是否輸入有誤!\n') print('-'*45) if __name__ == '__main__': s = requests.session() while True: s.headers.update({"X-Forwarded-For":"%d.%d.%d.%d"%(random.randint(120,125),random.randint(1,200),200))}) # 這一句是整個程式的關鍵,通過修改 X-Forwarded-For 資訊來欺騙 ASP 站點對於 IP 的驗證。 link = input("\n請輸入上學吧網站上某道題目的網址,例如:https://www.shangxueba.com/ask/8952241.html\n\n請輸入:").strip() # 過濾首尾的空格 if(link[0:31] != "https://www.shangxueba.com/ask/" or link[-4:] != "html"): print("\n網址輸入有誤!請重新輸入!\n") continue dataid = link.split("/")[-1].replace(r".html","") # 提取網址最後的數字部分 if(dataid.isdigit()): # 根據格式,dataid 應該全部為數字,判斷字串是否全部為數字,返回 True 或者 False verifynum = get_verifynum(s) get_answer(s,dataid) else: print("\n網址輸入有誤!請重新輸入!\n") continue
注意:其中 requests 和 beautifulsoup 兩個庫需要另外安裝,建議使用 pip 方式安裝:
pip install requests
pip install beautifulsoup4
Python 指令碼執行流程:
首先複製上學吧某道題目的網址,類似以下格式:
然後執行python指令碼,複製貼上網址。
按Enter鍵,自動下載驗證碼圖片存為 temp.png,然後自動讀取圖片並展示,也可以手動開啟同目錄下的 temp.png 圖片。
最後在命令列視窗輸入驗證碼圖片中的計算結果即可獲取題目詳情以及正確答案。
到此這篇關於Python中免驗證跳轉到內容頁的例項程式碼的文章就介紹到這了,更多相關Python如何免驗證跳轉到內容頁內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們!