Python批量下載小姐姐視訊,總有你喜歡的,你一般在哪個平臺看?
阿新 • • 發佈:2021-07-29
好久不見了,今天給大家整點福利!
先上一個截圖鎮鎮場子!
兄弟們學Python如果不是為了爬小姐姐,那將毫無意義!
而且爬圖片有什麼意思,咱們要爬就爬視訊,話不多說,開整!
1、動態資料抓包演示
2、json資料解析方法
3、視訊資料儲存
這是今天的大概方法,給大家介紹一下爬蟲專案抓取的一般策略(步驟)
1、找資料對應的地址<連結地址>
2、傳送地址請求
3、資料提取(解析)<提取想要的資料>
4、資料儲存
頁面載入形式
ajax非同步載入技術(前端技術)
在不需要載入整個頁面的情況下, 對頁面實現區域性重新整理
程式碼不多,其實挺簡單。
用到的模組
import requests # 資料請求模組, 第三方模組
import pprint # 格式化輸出模組
import re # 正則表示式模組, 匹配\查詢, 替換字串,
匹配非法字元, 替換
def change_title(title): pattern = re.compile('[\\\/\:\*\?\"\<\>\|]') new_title = re.sub(pattern, '_', title) return new_title
f 正在抓取第{page}頁資料
for page in range(2, 11):
1、找資料對應的地址<連結地址>
1 url = f'https://v.6.cn/minivideo/getMiniVideoList.php?act=recommend&page={page}&pagesize=30'
瀏覽器的身份標識 host 域名 referer 防盜鏈<標識你是哪裡來的> origin 資源的起始地址 cookies 使用者身份標識。
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'}
2、傳送地址請求
response = requests.get(url=url, headers=headers)
json_data = response.json()
3、資料提取(解析)<提取想要的資料>
data_list = json_data['content']['list'] for data in data_list: video_title = data['title'] + '.mp4' # 視訊的標題(文明名) 尾綴 avi rmvb flv video_url = data['playurl'] # 視訊的地址 # print(video_title, video_url)
請求視訊地址資料 視訊 圖片 音訊 都是二進位制
1 print('正在下載:', video_title) 2 video_data = requests.get(url=video_url, headers=headers).content # 視訊資料 3 4 new_title = change_title(video_title)
4、資料儲存
1 with open('video\\' + new_title, mode='wb') as f: 2 f.write(video_data) 3 print('下載完成:', video_title + '\n')
好了,是真的簡單,就這幾行程式碼,模組沒安裝的話,先把模組安裝一下。
安裝方法:win+r 開啟執行框,輸入cmd 開啟命令提示符視窗,pip install ***(***改成你要安裝的的模組名)
最後給你們看下我的硬碟裝滿了沒有,免得說我欺騙感情,我爬的都是正經的小姐姐,不要罵我,不正經的咱也過不了審,建議各位也不要爬不正經的,身體要緊!
記得點贊關注,不然下次我都沒動力更新這種福利了~